GBK和UTF-8的区别

GBK和UTF-8的区别GBK 中文名汉字编码字符集外文名 ChineseInter 全称 汉字内码扩展规范 GBK 编码 是对 GB2312 编码的扩展 因此完全兼容 GB2312 80 标准 GBK 编码依然采用双字节编码方案 其编码范围 8140 FEFE 剔除 xx7F 码位 共 23940 个码位 共收录汉字和图形符号 21886 个 其中汉字 包括部首和构件 21003 个 图形符号 883 个 GBK 编码支持国际标准 ISO IEC10646 1 和国家标准 GB1300

   GBK

中文名

汉字编码字符集

外文名

Chinese Internal Code Specification

全    称

《汉字内码扩展规范》

GBK编码,是对GB2312编码的扩展,因此完全兼容GB2312-80标准。GBK编码依然采用双字节编码方案,其编码范围:8140-FEFE,剔除xx7F码位,共23940个码位。共收录汉字和图形符号21886个,其中汉字(包括部首和构件)21003个,图形符号883个。GBK编码支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字,并包含了BIG5编码中的所有汉字。GBK编码方案于1995年12月15日正式发布,这一版的GBK规范为1.0版.   

UTF-8

二者字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。

   至于UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。

       GBK包含全部中文字符;UTF-8则包含全世界所有国家需要用到的字符。

      UTF8是国际编码,它的通用性比较好,外国人也可以浏览论坛,GBK是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大。

       建议使用UTF-8。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/229111.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月16日 下午5:27
下一篇 2026年3月16日 下午5:27


相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号