java中含中文字符串的编码和解码问题。

java中含中文字符串的编码和解码问题。1、在Java开发中经常被文字乱码的问题困扰。下面全面解释下字符串的编码和解码。如Stringstr=”中国”编码:byte[]bts=str.getBytes(“编码方式”);//常用编码方式gbk、utf-8、gb2312、iso-8859-1等等。解码:Stringb=newString(bts,”解码方式”);//解码方式对应常用编码方式。2

大家好,又见面了,我是你们的朋友全栈君。

1、在Java开发中经常被文字乱码的问题困扰。下面全面解释下字符串的编码和解码。

如 String str = “中国”

编码:byte[] bts = str.getBytes(“编码方式”);//常用编码方式 gbk、utf-8、gb2312、iso-8859-1等等。

解码:String b = new String(bts,”解码方式”);//解码方式对应常用编码方式。

2、常识:正常(正常显示的字符串无乱码)解码后的字符串对象可以用任意方式编码。但解码要正常显示,必须用对应的编码方式解码。(对于中文要保证正常显示必须采用中文编码/解码方式)

如 String str = “中国”;//这个就是正常显示的字符串

以下任意方式(中文)编码/解码———–

String b1 = new String(str.getBytes(“gbk”),”gbk”);

String b2 = new String(str.getBytes(“utf-8″),”utf-8”);

String b3 = new String(str.getBytes(“gb2312″),”gb2312”);

以上三种方式的字符串对象都是采用中文方式编码/解码,所以都会是正常并无乱码。

3、当没采用对应方式解码时(也就是所谓的乱码)怎么转成正常显示而无乱码。

如 String str = “中国”;

String b1 =  new String(str.getBytes(“gbk”),”gbk”);//这里的b1就是采用的gbk的方式解码的 ::::b1不会乱码的

String b2 = new String(b1.getBytes(),”utf-8″);//这里对b1编码后的字节数组重新用utf-8而没有用对应的gbk方式解码。:::::b2将会是乱码的

以下开始将乱码转成正常显示

String b3 = new String(b2.getBytes(“utf-8″),”gbk”)//这里编码方式(utf-8)必须用上述b2的解码方式,而解码方式(gbk)必须用b1的解码方式。因为是b2把正常显示的b1解码成乱码。:::::::b3不会是乱码的。

在实际应用中出现的乱码,都是这个原因造成的,乱码不是不可逆的,上述步骤就是一个逆转的过程。

4常见应用举例。

在web开发中,tomcat对于传输的字符串都是采用iso-8859-1编码/解码方式。而客户端(浏览器端对于中文都是用gbk或utf-8中文编码/解码方式),所以传到后台都会是乱码的。容器一般都是有处理的,所以中文能正常显示和存储。但有些情况也是会出现乱码的,解决方式如下

String b = new String(str.getBytes(“iso-8859-1″,”客户端的编码/解码方式”)//中文解码方式一般用的是utf-8或者gbk。

如:

 String b1 = new String(str.getBytes(“iso-8859-1″,”utf-8”);

转自:http://blog.csdn.net/jianrenxuan/article/details/48208501

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/157119.html原文链接:https://javaforall.net

(0)
上一篇 2022年7月8日 上午6:36
下一篇 2022年7月8日 上午6:36


相关推荐

  • date和hwclock

    date和hwclockGMT GreenwichMea 即格林尼治标准时间 GMT 以地球自转为基础 但由于地球自转不均匀 导致 GMT 不精确 UTC UniversalTim 即协调世界时 UTC 是以原子时秒长为基础 在时刻上尽量接近于 GMT 的一种时间计量系统 RTC Real TimeClock 即实时时钟 在计算机领域作为硬件时钟的简称 硬件时间 保存在主板 BIOS 中 信息比较少没时区 夏令时的概念 系统时间 系统开机时读取硬件时间作为系统的时间 系统关机时再将系

    2025年7月28日
    6
  • linux(11)配置环境变量「建议收藏」

    linux(11)配置环境变量「建议收藏」前言在自定义安装软件的时候,经常需要配置环境变量,下面进行详细解析 环境变量配置文件|用户|配置文件||:|:||系统环境|/ect/profil

    2022年7月28日
    13
  • linux shell 编程书籍

    linux shell 编程书籍

    2026年3月17日
    2
  • js判断数组中是否包含某个元素_js判断是否在数组中存在

    js判断数组中是否包含某个元素_js判断是否在数组中存在方法1:arr.indexOf(element):判断数组中是否存在某个值,如果存在,则返回数组元素的下标(第一个元素),否则返回-1;letfruits=[“Banana”,”Orange”,”Apple”,”Mango”]leta=fruits.indexOf(“Apple”)console.log(a)//2方法2:array.includes(searcElement[,fromIndex]):判断数组中是否存在某个值,如果存在返回true,否则返回false;l

    2022年10月19日
    4
  • nrzi是什么编码_epc编码

    nrzi是什么编码_epc编码NRZ与NRZI编码解释RZ编码(Return-to-zeroCode),即归零编码。在 RZ 编码中,正电平代表逻辑 1,负电平代表逻辑 0,并且,每传输完一位数据,信号返回到零电平,也就是说,信号线上会出现 3 种电平:正电平、负电平、零电平:从图上就可以看出来,因为每位传输之后都要归零,所以接受者只要在信号归零后采样即可,这样就不在需要单独的时钟信号。实际上, RZ 编码就是相当于把时钟

    2025年6月20日
    5
  • VB中CopyMemory函数

    VB中CopyMemory函数vb 中 copymemory 函数的使用挺耐人寻味的 copymemory 的使用说明资料书上就一句 该函数用于将一块内存的数据从一个位置复制到另一个位置 其参数数据类型 destinationa sourceasany 尽管是 any 型可理解成任一类型但是我看很多地方都说参数是指针类型的 因此起初我很不解 既然是指针型的参数我们往往直接将变量传递过去而不是变量的地址传递过去不是非法的吗

    2026年3月17日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号