encoder和decoder的区别_python encode函数

encoder和decoder的区别_python encode函数python内部的字符串一般都是Unicode编码。代码中字符串的默认编码与代码文件本身的编码是一致的。所以要做一些编码转换通常是要以Unicode作为中间编码进行转换的,即先将其他编码的字符串解码(decode)成Unicode,再从Unicode编码(encode)成另一种编码。decode:的作用是将其他编码的字符串转换成Unicode编码,name.decode(“GB23…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

python内部的字符串一般都是 Unicode编码。代码中字符串的默认编码与代码文件本身的编码是一致的。所以要做一些编码转换通常是要以Unicode作为中间编码进行转换的,即先将其他编码的字符串解码(decode)成 Unicode,再从 Unicode编码(encode)成另一种编码。

decode:
的作用是将其他编码的字符串转换成 Unicode 编码, name.decode(“GB2312”),表示将GB2312编码的字符串name转换成Unicode编码

encode:
的作用是将Unicode编码转换成其他编码的字符串, name.encode(”GB2312“),表示将unicode编码的字符串name转换成GB2312编码

所以在进行编码转换的时候必须先知道 name 是那种编码,然后 decode 成 Unicode 编码,最后载 encode 成需要编码的编码。当然了,如果 name 已经就是 Unicode 编码了,那么就不需要进行 decode 进行解码转换了,直接用 encode 就可以编码成你所需要的编码。值得注意的是:对 Unicode 进行编码和对 str 进行编码都是错误的。

eg:
由于内置函数 open() 打开文件时,read() 读取的是 str,读取后需要使用正确的编码格式进行 decode()。write() 写入时,如果参数是 Unicode,则需要使用你希望写入的编码进行 encode(),如果是其他编码格式的 str,则需要先用该 str 的编码进行 decode(),转成 Unicode 后再使用写入的编码进行 encode()。如果直接将 Unicode 作为参数传入 write() ,python 将先使用源代码文件声明的字符编码进行编码然后写入。

例

# coding: UTF-8
 
fp1 = open('test.txt', 'r')
info1 = fp1.read()
# 已知是 GBK 编码,解码成 Unicode
tmp = info1.decode('GBK')
 
fp2 = open('test.txt', 'w')
# 编码成 UTF-8 编码的 str
info2 = tmp.encode('UTF-8')
fp2.write(info2)
fp2.close()
先知道info1是字符串,其编码为GBK,将其解码成unicode.存在tmp中。再将其编码成utf-8,存在info2中。这样写入fp2文件中的内容就是utf-8格式的了。那么能保证fp2中的内容编码一致,都是utf-8
utf-8也能显示中文。它是可变长的编码方式,可以使用 1~4 个字节表示一个字符,可根据不同的符号而变化字节长度。
python3中默认文件为utf-8格式。字符串不需使用.decode()。其作为unicode编码。可以直接使用encode编码为其他。

获取系统默认编码:
import sys
print sys.getdefaultencoding()

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/188799.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Activity 工作流框架学习总结「建议收藏」

    Activity 工作流框架学习总结「建议收藏」环境的搭建和数据表的了解1.什么是工作流?工作流(Workflow),就是“业务过程的部分或整体在计算机应用环境下的自动化”,它主要解决的是“使在多个参与者之间按照某种预定义的规则传递文档、信息或任务的过程自动进行,从而实现某个预期的业务目标,或者促使此目标的实现”。工作流管理系统(WorkflowManagementSystem,WfMS)是一个软件系统,它完成工作量的定义

    2022年5月7日
    97
  • linux中挂载新的数据盘「建议收藏」

    linux中挂载新的数据盘「建议收藏」linux中挂载新的数据盘

    2022年4月24日
    40
  • 企业怎么运营公众号,怎么策划微信集赞活动?「建议收藏」

    企业怎么运营公众号,怎么策划微信集赞活动?「建议收藏」做微信公众号运营,微信活动是微信运营的一个重要内容,吸粉、扩散知名度、发起话题、维护粉丝等运营内容都可以通过微信活动来实现。今天谈谈如何通过微信集赞活动来吸粉。首先确定好活动的主题,如xx店庆、xx开业、xx节日等等其次要提前设置好活动礼品,如满xx赞奖励xx奖品最好可以跟本行业相关,如影楼行业可设置“用户集满100赞获得3张精修照片”;医美行业“用户集满XX赞免费获得一剂瘦脸针”等。奖励条…

    2025年8月29日
    6
  • js数组遍历十种方法

    js数组遍历十种方法1.some()遍历数组,只要有一个以上的元素满足条件就返回true,否则返回false,退出循环对数组中每个元素执行一次ok函数,知道某个元素返回true,则直接返回true。如果都返回false,则返回false检查整个数组中是否有满足元素。privatesome(id:number){constarr=[{cityId:195,cityName:’深圳’},{cityId:196,cityNa

    2022年10月7日
    3
  • java 常量池和运行时常量池_java字符串常量池在堆还是方法区

    java 常量池和运行时常量池_java字符串常量池在堆还是方法区一.相关概念1.1什么是常量用final修饰的成员变量表示常量,值一旦给定就无法改变!final修饰的变量有三种:静态变量、实例变量和局部变量,分别表示三种类型的常量。1.2Class文件中的常量池在Class文件结构中,最头的4个字节用于存储魔数MagicNumber,用于确定一个文件是否能被JVM接受,再接着4个字节用于存储版本号,前2个字节存储次版本号,后2个存储主…

    2025年8月28日
    3
  • char *string=”xxxxxxxxx” 与 char string[]=”xxxxx”的区别

    char *string=”xxxxxxxxx” 与 char string[]=”xxxxx”的区别char*string=”xxxxxx“这种方式使用的字面值模式,只读,不可以修改。string是个指针,这个字符串存放在程序的RODATA(read-only)段,不能修改的!表示你定义了一个字符指针,这个指针指向一个字符串常量,既然是常量那么通过这个指针修改这个常量是不可以的。charstring[]=”xxxxx”这种方式,字符串存储在数组

    2022年8月22日
    7

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号