python3 三种字符串(无前缀,前缀u,前缀b)与encode()「建议收藏」

python3 三种字符串(无前缀,前缀u,前缀b)与encode()「建议收藏」假设读者已经了解了什么叫字符集,什么叫编码,什么叫解码。首先要明确,虽然有三种前缀(无前缀,前缀u,前缀b),但是字符串的类型只有两种(str,bytes),实验如下:根据程序以及以上运行结果,发现无前缀,和前缀u,构造出来的字符串常量,是一样的。类型一样是str,长度一样是3,==判断也是返回true。其实,这里是因为,python3中,字符串的存储方式都是以Unicode字符…

大家好,又见面了,我是你们的朋友全栈君。

假设读者已经了解了什么叫字符集,什么叫编码,什么叫解码。

首先要明确,虽然有三种前缀(无前缀,前缀u,前缀b),但是字符串的类型只有两种(str,bytes),实验如下:

python3 三种字符串(无前缀,前缀u,前缀b)与encode()「建议收藏」         python3 三种字符串(无前缀,前缀u,前缀b)与encode()「建议收藏」  python3 三种字符串(无前缀,前缀u,前缀b)与encode()「建议收藏」  python3 三种字符串(无前缀,前缀u,前缀b)与encode()「建议收藏」

根据程序以及以上运行结果,发现无前缀,和前缀u,构造出来的字符串常量,是一样的。

类型一样是str,长度一样是3,==判断也是返回true。is判断也是返回true。

其实,这里是因为,python3中,字符串的存储方式都是以Unicode字符来存储的,所以前缀带不带u,其实都一样。

结论:字符串常量,前缀带不带u,都是一样的

 

不管是utf-8,还是gbk,都可以理解为一种对应关系(若干个十六进制数<——>某个字符):

python3 三种字符串(无前缀,前缀u,前缀b)与encode()「建议收藏」      python3 三种字符串(无前缀,前缀u,前缀b)与encode()「建议收藏」

所以可以发现任何str类型的字符串,在经过encode(‘utf-8’)后,就是通过utf-8这种编码解码方式(两种方向),将Unicode字符转换为对应的以字节方式存储的若干十六进制数。

根据如上程序以及结果,可以发现,utf-8用三个字节(6个十六进制数)来表示一个中文字符,而gbk用两个字节(4个十六进制数)来表示一个中文字符。

结论:encode()函数根据括号内的编码方式,把str类型的字符串转换为bytes字符串,字符对应的若干十六进制数,根据编码方式决定

 

既然知道了,str实际存储的是Unicode字符,那么也可以Unicode编码来存储str,形如\u1234:

python3 三种字符串(无前缀,前缀u,前缀b)与encode()「建议收藏」发现\u后面跟四个十六进制数,就可以代表一个Unicode字符,同样的,前缀带不带u都一样。

python3 三种字符串(无前缀,前缀u,前缀b)与encode()「建议收藏」     python3 三种字符串(无前缀,前缀u,前缀b)与encode()「建议收藏」

结论:str类型的字符串,每个字符用字符本身或者\u1234,来表示都可以,后者则是直接是Unicode编码。但打印时都是打印字符本身

 

bytes字符串的组成形式,必须是十六进制数,或者ASCII字符:

python3 三种字符串(无前缀,前缀u,前缀b)与encode()「建议收藏」

提示错误:bytes只能包含ASCII字符。

python3 三种字符串(无前缀,前缀u,前缀b)与encode()「建议收藏」在打印bytes字符串时,某些正常字符和一些转义字符可以打印出来,比如:字母数字和‘\n’换行符。别的就只能以原来的方式存在。

python3 三种字符串(无前缀,前缀u,前缀b)与encode()「建议收藏」

还可以对bytes取索引,所以这里bytes也可以用for循环来迭代了,因为也是可迭代对象。

取索引,将所在元素的数,转换为十进制数。

代码:

oath = '我爱妞'
print(type(oath))
print(len(oath))

oath1 = u'我爱妞'
print(type(oath1))
print(len(oath1))

print(oath==oath1)


utf8 = oath.encode('utf-8')
print(type(utf8))
print(len(utf8))
print(utf8)

gbk = oath.encode('gbk')
print(type(gbk))
print(len(gbk))
print(gbk)


out = open('test.txt','w',encoding = 'utf-8')

test = u'\u5220\u9664'
print(len(test))
print(test)
test1 = test.encode('utf-8')
print(test1)
print(type(test1))

out.write(test)
out.close()

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/137941.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • pythonobject类_java中所有异常类的父类

    pythonobject类_java中所有异常类的父类Object类所有类的父类,默认所有的类都继承至Object类规定了类的结构,加载方式,常用函数以前的写法:class类名(Object):pass现在的写法:class类名:pass如果有父类才编写,如果没有父类可以省掉Object类,但是也是默认继承内置函数:__new__(cls,*args,**kwargs)创建对象时自动调用的函数,主要作用是创建对象,给该对象分配空间,方便之后的的操作该函数会返回创建…

    2025年7月15日
    4
  • 大数据舆情监测与分析_大数据分析系统架构

    大数据舆情监测与分析_大数据分析系统架构前言互联网的飞速发展促进了很多新媒体的发展,不论是知名的大V,明星还是围观群众都可以通过手机在微博,朋友圈或者点评网站上发表状态,分享自己的所见所想,使得“人人都有了麦克风”。不论是热点新闻还是娱乐八卦,传播速度远超我们的想象。可以在短短数分钟内,有数万计转发,数百万的阅读。如此海量的信息可以得到爆炸式的传播,如何能够实时的把握民情并作出对应的处理对很多企业来说都是至关重要的。大数据时代,除了…

    2022年9月20日
    3
  • linux修改密码后登陆失败_linux取消root密码

    linux修改密码后登陆失败_linux取消root密码问题:当使用root修改密码时,报错passwd:Authenticationtokenmanipulationerror解决:1、查看是否权限问题,/etc/passwd/etc/shadow文件是否被锁住lsattr/etc/passwdlsattr/etc/shadow文件解锁:chattr-i/etc/passwdchattr-i/etc…

    2025年9月16日
    4
  • 锂电池管理芯片_锂电池充放电一体芯片

    锂电池管理芯片_锂电池充放电一体芯片‍FS4001‍4.2/4.354.25-10线性降压充电。FS406‍28.4/8.7/8.8/12.6/13.25开关升压充电。FS40‍08A4.2/8.4/12.69-23开关降压充电。FS406‍38.45-9自适应自适应5V升压和9V降压充电。FS40564.2/4.354.25-6.5线性降压充电。FS40674.2/4.354.25-24线性降压充电。FS40664.2/4.354.25-24线性降压充电。…

    2022年9月27日
    2
  • 如何使用yum卸载mysql数据库_yum卸载mysql数据库方法(linux centos系统)

    如何使用yum卸载mysql数据库_yum卸载mysql数据库方法(linux centos系统)如何在linuxcentos系统中使用yum命令卸载mysql数据库呢?只需要使用yumremove命令即可轻松卸载mysql数据库了,方法很简单,只需要两个步骤即可。步骤一:执行下面的命令,查询有哪些mysql安装包可以卸载的,如下。[root@VM_230_32_centos~]#rpm-qa|grepmysqlphp-mysqlnd-5.6.32-1.el7.remi.x86…

    2022年5月22日
    35
  • 关于解决Codeblocks中文乱码问题

    关于解决Codeblocks中文乱码问题最近有很多博友在问我关于另一篇博文“表白小心心”等问题,我于是又年轻了一把———把代码复制下来,运行了一下,发现了诸多问题,当然不是代码的问题,而是编译器的一些问题。1、Codeblocks乱码Codeblocks在编译时没有任何问题,但是显示出来的汉字字符是乱码的。针对这一问题,我也找了一下解决方法,在这里给大家分享一下。首先打开你的Codeblocks,设置–&gt;编辑器,中英…

    2022年7月26日
    22

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号