java字符串gb18030编码和utf8编码互转[通俗易懂]

java字符串gb18030编码和utf8编码互转[通俗易懂]java字符串gb18030编码和utf8编码互转

大家好,又见面了,我是你们的朋友全栈君。

在做接口联调的时候出现访问对方的时候需要把编码转成gb18030格式的,我这边默认是utf8,这个困扰了很长时间,在网上百度发现大部分字符串转编码都是使用string.getByte(“编码格式”)的方式字节转码,可事实上这样是行不通的。原因有点难说,这里我就说一下可行的方案。

@Test
	public void toObject() throws UnsupportedEncodingException{
		System.out.println("2".equals(null));
		String str = "ab丁亦凝";//编译环境默认是utf8格式
		byte[] bytes = str.getBytes(Charset.forName("GB18030"));//这一步就是转成gb18030格式的字节码
        for (byte b : bytes)  
        {  
            System.out.print(b + " ");  
        }  
        //字节码转成gb18030的字符串
        String str4 = new String(bytes, "GB18030");
        System.out.println(str4);
        System.out.println();  
         
        //再转回utf8
        byte[] bytes4 = str4.getBytes(Charset.forName("UTF-8"));  
        for (byte b : bytes4)  
        {  
            System.out.print(b + " ");  
        }  
        System.out.println();  
        String str44 = new String(bytes4, "UTF-8");  
        System.out.println("---"+str44);//abc你好  
	}

下面再介绍几种其他格式的,其实方式都一样:

@Test
	public void aaa(){
		
		  System.out.println("default charset : "+Charset.defaultCharset());  
	        String str = "abc你好";//string with UTF-8 charset  
	  
	        byte[] bytes = str.getBytes(Charset.forName("UTF-8"));//convert to byte array with UTF-8 encode  
	        for (byte b : bytes)  
	        {  
	            System.out.print(b + " ");  
	        }  
	        System.out.println();  
	        try  
	        {  
	            String str1 = new String(bytes, "UTF-8");//to UTF-8 string  
	            String str2 = new String(bytes, "ISO-8859-1");//to ISO-8859-1 string  
	            String str3 = new String(bytes, "GBK");//to GBK string  
	            String str4 = new String(bytes, "GB18030");
	            System.out.println(str1);//abc你好  
	            System.out.println(str2);//abc??????  
	            System.out.println(str3);//abc浣犲ソ  
	            System.out.println(str4);
	            System.out.println();  
	            byte[] bytes2 = str2.getBytes(Charset.forName("ISO-8859-1"));  
	            for (byte b : bytes2)  
	            {  
	                System.out.print(b + " ");  
	            }  
	            System.out.println();  
	            String str22 = new String(bytes2, "UTF-8");  
	            System.out.println(str22);//abc你好  
	              
	            System.out.println();  
	            byte[] bytes3 = str3.getBytes(Charset.forName("GBK"));  
	            for (byte b : bytes3)  
	            {  
	                System.out.print(b + " ");  
	            }  
	            System.out.println();  
	            String str33 = new String(bytes3, "UTF-8");  
	            
	            byte[] bytes4 = str4.getBytes(Charset.forName("GB18030"));  
	            for (byte b : bytes4)  
	            {  
	                System.out.print(b + " ");  
	            }  
	            System.out.println();  
	            String str44 = new String(bytes4, "UTF-8");  
	            System.out.println("---"+str44);//abc你好  
	        } catch (UnsupportedEncodingException e)  
	        {  
	            e.printStackTrace();  
	        }  
	}

最后在联调接口通讯中,注意两点:

1,在最终传输的字节数组中修改编码,

2,对方返回的信息,要先使用对方编码转成字符串,再转成自己需要的编码

在下面的例子中有讲解:

private String sendReq(Object req) throws Exception {
        String reqXml =  XStreamHandler.toXml(req);
        //加入报文头
        reqXml=HEADER+reqXml;
        //计算报文长度
		int len=reqXml.getBytes().length;
		String bodyStr = String.format("%04d", len);
		//加入报文长度
		reqXml=bodyStr+reqXml;
		//utf8转gb18030  下面两行就是多余的,因为不是最终修改编码的位置
		byte[] bytes = reqXml.getBytes(Charset.forName("GB18030"));
		reqXml = new String(bytes, "GB18030");
		logger.info("组装好的最终报文是:"+reqXml);
		YakMessage msg = new YakMessage();
		ByteBuffer buffer = ByteBuffer.allocate(reqXml.getBytes().length);
		buffer.put(reqXml.getBytes(Charset.forName("GB18030"))); //这里才是有用的,因为参数传递最终还是在io流中以字节格式传输的
		//设置YakMessage
		msg.setRawMessage(buffer.array());
		buffer.clear();
		//发送请求
		YakMessage response = FBHYShortTermSocketClient.write(msg);
		String respXml = new String(response.getRawMessage(),Charset.forName("GB18030"));//这里对面返回的文字编码是GB18030,
		//gb18030转utf8
		byte[] bytes2 = respXml.getBytes(Charset.forName("UTF-8"));  
	    respXml = new String(bytes2, "UTF-8");
		return respXml;
	}

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/106078.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Python append 函数[通俗易懂]

    Python append 函数[通俗易懂]pythonappend描述append函数可以在列表的末尾添加新的对象。函数无返回值,但是会修改列表。append语法list.append(object)名称 说明 备注list 待添加元素的列表 object 将要给列表中添加的对象 不可省略的参数append举例1.给列表中添加整数、浮点数和字符串:test=[‘Python’,‘C’,‘Java’]test.append(5)test.append(23.6)test.append(‘HTML’)print(t

    2022年6月16日
    91
  • MongoDB和Redis的区别是什么

    MongoDB和Redis的区别是什么

    2022年2月20日
    53
  • Nginx的启动、停止与重启

    Nginx的启动、停止与重启

    2021年10月18日
    35
  • executeupdate mysql_java – 使用Mysql中的executeUpdate通过sql语句…

    executeupdate mysql_java – 使用Mysql中的executeUpdate通过sql语句…我有以下doGet():protectedvoiddoGet(HttpServletRequestrequest,HttpServletResponseresponse)throwsServletException,IOException{MysqlDataSourceds=newMysqlConnectionPoolDataSource();ds.setServerNa…

    2022年10月20日
    5
  • Python 源码混淆与加密

    Python 源码混淆与加密Python是一种解释型语言,没有编译过程,发布程序的同时就相当于公开了源码,这也是其作为开源语言的一个特性。但在某些场景下,我们的源码是不想被别人看到的,例如开发商业软件、编写0day漏洞POC/EXP、免杀shellcode等。多人学习python,不知道从何学起。很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手。很多已经做案例的人,却不知道如何去学习更加高深的知识。那么针对这三类人,我给大家提供一个好的学习平台,免费领取视频教程,电子书籍,以及课程的源代

    2022年8月23日
    18
  • PermitRootLogin不生效,ssh允许root登录

    PermitRootLogin不生效,ssh允许root登录1、sshd-T|grepetc查看当前sshd的配置文件位置2、修改PermitRootLogin为true3、重启sshd

    2022年7月12日
    21

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号