java字符串gb18030编码和utf8编码互转[通俗易懂]

java字符串gb18030编码和utf8编码互转[通俗易懂]java字符串gb18030编码和utf8编码互转

大家好,又见面了,我是你们的朋友全栈君。

在做接口联调的时候出现访问对方的时候需要把编码转成gb18030格式的,我这边默认是utf8,这个困扰了很长时间,在网上百度发现大部分字符串转编码都是使用string.getByte(“编码格式”)的方式字节转码,可事实上这样是行不通的。原因有点难说,这里我就说一下可行的方案。

@Test
	public void toObject() throws UnsupportedEncodingException{
		System.out.println("2".equals(null));
		String str = "ab丁亦凝";//编译环境默认是utf8格式
		byte[] bytes = str.getBytes(Charset.forName("GB18030"));//这一步就是转成gb18030格式的字节码
        for (byte b : bytes)  
        {  
            System.out.print(b + " ");  
        }  
        //字节码转成gb18030的字符串
        String str4 = new String(bytes, "GB18030");
        System.out.println(str4);
        System.out.println();  
         
        //再转回utf8
        byte[] bytes4 = str4.getBytes(Charset.forName("UTF-8"));  
        for (byte b : bytes4)  
        {  
            System.out.print(b + " ");  
        }  
        System.out.println();  
        String str44 = new String(bytes4, "UTF-8");  
        System.out.println("---"+str44);//abc你好  
	}

下面再介绍几种其他格式的,其实方式都一样:

@Test
	public void aaa(){
		
		  System.out.println("default charset : "+Charset.defaultCharset());  
	        String str = "abc你好";//string with UTF-8 charset  
	  
	        byte[] bytes = str.getBytes(Charset.forName("UTF-8"));//convert to byte array with UTF-8 encode  
	        for (byte b : bytes)  
	        {  
	            System.out.print(b + " ");  
	        }  
	        System.out.println();  
	        try  
	        {  
	            String str1 = new String(bytes, "UTF-8");//to UTF-8 string  
	            String str2 = new String(bytes, "ISO-8859-1");//to ISO-8859-1 string  
	            String str3 = new String(bytes, "GBK");//to GBK string  
	            String str4 = new String(bytes, "GB18030");
	            System.out.println(str1);//abc你好  
	            System.out.println(str2);//abc??????  
	            System.out.println(str3);//abc浣犲ソ  
	            System.out.println(str4);
	            System.out.println();  
	            byte[] bytes2 = str2.getBytes(Charset.forName("ISO-8859-1"));  
	            for (byte b : bytes2)  
	            {  
	                System.out.print(b + " ");  
	            }  
	            System.out.println();  
	            String str22 = new String(bytes2, "UTF-8");  
	            System.out.println(str22);//abc你好  
	              
	            System.out.println();  
	            byte[] bytes3 = str3.getBytes(Charset.forName("GBK"));  
	            for (byte b : bytes3)  
	            {  
	                System.out.print(b + " ");  
	            }  
	            System.out.println();  
	            String str33 = new String(bytes3, "UTF-8");  
	            
	            byte[] bytes4 = str4.getBytes(Charset.forName("GB18030"));  
	            for (byte b : bytes4)  
	            {  
	                System.out.print(b + " ");  
	            }  
	            System.out.println();  
	            String str44 = new String(bytes4, "UTF-8");  
	            System.out.println("---"+str44);//abc你好  
	        } catch (UnsupportedEncodingException e)  
	        {  
	            e.printStackTrace();  
	        }  
	}

最后在联调接口通讯中,注意两点:

1,在最终传输的字节数组中修改编码,

2,对方返回的信息,要先使用对方编码转成字符串,再转成自己需要的编码

在下面的例子中有讲解:

private String sendReq(Object req) throws Exception {
        String reqXml =  XStreamHandler.toXml(req);
        //加入报文头
        reqXml=HEADER+reqXml;
        //计算报文长度
		int len=reqXml.getBytes().length;
		String bodyStr = String.format("%04d", len);
		//加入报文长度
		reqXml=bodyStr+reqXml;
		//utf8转gb18030  下面两行就是多余的,因为不是最终修改编码的位置
		byte[] bytes = reqXml.getBytes(Charset.forName("GB18030"));
		reqXml = new String(bytes, "GB18030");
		logger.info("组装好的最终报文是:"+reqXml);
		YakMessage msg = new YakMessage();
		ByteBuffer buffer = ByteBuffer.allocate(reqXml.getBytes().length);
		buffer.put(reqXml.getBytes(Charset.forName("GB18030"))); //这里才是有用的,因为参数传递最终还是在io流中以字节格式传输的
		//设置YakMessage
		msg.setRawMessage(buffer.array());
		buffer.clear();
		//发送请求
		YakMessage response = FBHYShortTermSocketClient.write(msg);
		String respXml = new String(response.getRawMessage(),Charset.forName("GB18030"));//这里对面返回的文字编码是GB18030,
		//gb18030转utf8
		byte[] bytes2 = respXml.getBytes(Charset.forName("UTF-8"));  
	    respXml = new String(bytes2, "UTF-8");
		return respXml;
	}

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/106078.html原文链接:https://javaforall.net

(0)
上一篇 2022年4月23日 下午9:00
下一篇 2022年4月23日 下午9:20


相关推荐

  • navicat15.0.23激活码【注册码】

    navicat15.0.23激活码【注册码】,https://javaforall.net/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

    2022年3月20日
    187
  • 光耦的參数的理解

    光耦的參数的理解

    2021年8月30日
    57
  • c++——类模板

    c++——类模板1 概念类模板 一个模板 是模板 模板类 调用类模板生成的类对象 是类实体 也称为类模板的实例化类模板的定义 template typenameT classBlob public Blob Blob std initializer list T i 类模板的使用 在定义类时 使用到类名的地方都需要显示的给出模板类的类型 格式为 lt gt intmain Blob T typenameT

    2026年3月16日
    2
  • 多层感知器MLP

    多层感知器MLP一 多层感知机 MLP 原理简介多层感知机 MLP MultilayerPe 也叫人工神经网络 ANN ArtificialNe 除了输入输出层 它中间可以有多个隐层 最简单的 MLP 只含一个隐层 即三层的结构 如下图 从上图可以看到 多层感知机层与层之间是全连接的 全连接的意思就是 上一层的任何一个神经元与下一层的所有神经元都有连接 多层感知机

    2026年3月26日
    2
  • 白盒测试技术_静态白盒测试

    白盒测试技术_静态白盒测试覆盖率 它是度量测试完整性的一个工具,通常可以分为逻辑覆盖和功能覆盖。覆盖率=(被执行到的项数/总项数)*100%逻辑覆盖 逻辑覆盖是以程序内部的逻辑结构为基础设计测试用例的技术,属于白盒测试。      被测试模块的流程图语句覆盖 设计若干测试用例,运行被测程序,使每个可执行语句至少执行一次。 语句覆盖率=被评价到的语句数量/

    2025年11月29日
    8
  • redis过期key的删除策略[通俗易懂]

    前言在使用redis的过程中,不免会产生过期的key,而这些key过期后并不会实时地马上被删除,当这些key数量累积越来越多,就会占用很多内存,因此在redis底层同时使用了三种策略来删除这些key。第一种策略:被动删除当读/写一个key时,redis首先会检查这个key是否存在,如果存在且已过期,则直接删除这个key并返回nil给客户端。第二种策略:定期删除redis中有一系列的定期任务(serverCron),这些任务每隔一段时间就会运行一次,其中就包含清理过期key的任务,运行频率由配置文件

    2022年4月8日
    69

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号