常用编码格式介绍_数据库编码格式

大家好，又见面了，我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元售后保障童叟无欺

编程过程中经常会遇到各类字符的编码方式，经常会混淆，在此总结下常用的编码方式以及其原理。

Ascii：

　　因为对于计算机来说只能识别0、1这两种字符（0表示低电平，1表示高电平），所有的数据都是通过二进制来表示，对于其他的比如说3、4、s、z、#等字符用二进制表示就需要一个约定的规范，这就是ascii的由来。

　　Ascii码表是用1个字节来表示128种字符（一个字节8位，可以组成256种字符，首位默认为0，所以ASCII最多就128个字符，当首位为1的时候我们后面再讨论），其中0-31和127表示控制字符，他们是不可见字符。

　　32-126是可见字符，48-57表示0-9，65-90为26个大写英文字母，97-122是26个小写英文字母。

GBK:

　　现在英文和数字都有了，但是我们中国汉字怎么表示呢？此时GBK应运而生，上面我们得知ASCII首位为0，假如把它改成1，就表示中文。GBK由2个字节来表示，第一个字节的最高位是0则表示字母和数字，假如是1则表示中文。

Unicode：

　　Unicode则是收录了世界上所有的语言，但是在运用过程种会出现很多问题，比如一个3个字节的字符，如何区分他是1个unicode还是3个asicii，还有假如使用unicode，英文字母高位都会设置成0，这就造成了很大的浪费。因此UTF-8、UTF-16、UTF-32就出现来解决这些问题，主要讲当前互联网上常用的UTF-8