MySQL comment_mysql和oracle的区别

MySQL comment_mysql和oracle的区别iconv用法场景说明将UTF-8的编码转换成GBK编码,使用Notepad++创建一个UTF-8(无BOM)的编码文件,文件内容简单为风雨在途,保存文件名称为utf8.txt,转换之后存储文件名称为gbk.txt.1.1:iconv命令的使用iconv-fUTF8-tGBKgbk.txt1.2:iconv函数的使用#includesize_ticonv(iconv_tcd…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

iconv 用法

场景说明

将UTF-8的编码转换成GBK编码,使用Notepad++创建一个UTF-8(无BOM)的编码文件,文件内容简单为风雨在途,保存文件名称为utf8.txt,转换之后存储文件名称为gbk.txt.

1.1:iconv命令的使用

iconv -f UTF8  -t GBK   gbk.txt

1.2:iconv函数的使用

#include

size_t iconv(iconv_t cd,

char **inbuf, size_t*inbytesleft,

char **outbuf, size_t*outbytesleft);

参数说明:经过iconv函数之后,*outbuf当前指向转换之后的字符串的最后位置,*inuf当前指向被转换字符串的最后位置,所以为了得到正确的转换字符串的指针位置,需要进行如下的调整:

*outbuf = *outbuf – iconv函数的返回值.或者定义指针指向当前的字符串缓存区,就不会修改字符串的缓冲区指针了

1.3代码如下

int UTF8fileToGBKfile()

{

int ret;

int read_fd;

int write_fd;

//1打开文件,读取utf-8文件

read_fd=open(“utf8.txt”,O_RDONLY|O_CREAT);

write_fd=open(“gbk.txt”, O_WRONLY|O_CREAT);

char utfBuffer[256] = {0};

size_t inLen = read(read_fd, utfBuffer,256);

//2获取字符集转换的文件句柄,这里是从utf-8转换为gbk

errno = 0;

iconv_t cd = iconv_open(“gbk”,”utf-8″);

char* errMsg = NULL;

if (errno !=0)

{

errMsg = strerror(errno);

cout<

cout<

return -1;

}

//3准备转换前的字符串,避免修改原字符串

char* szSrc = (char*)malloc(inLen);

memset(szSrc, 0, inLen);

memcpy(szSrc, utfBuffer, inLen);

//4准备转换后的字符串存储空间

size_t outLen = 256;

char* szDest = (char*)malloc(outLen);

memset(szDest, 0, outLen);

//4开始转换

errno = 0;

char* pszDest = szDest;

char* pszSrc = szDest;

errno = 0;

ret = iconv(cd, &pszSrc, &inLen,&pszDest , &outLen);

if (errno !=0)

{

errMsg = strerror(errno);

cout<

cout<

return -2;

}

iconv_close(cd);

//5写入文件,outlen是剩下多少空间没有使用

ret = write(write_fd, szDest, 256-outLen);

close(read_fd);

close(write_fd);

free(szDest);

free(szSrc);

return 0;

}

2 编译调试

2.1禁用优化安装

下载libiconv-1.14.tar.gz,解压,执行./configure –prefix=/opt/iconv;make;make install

生成文件:

charset.alias  libcharset.so        libiconv.la    libiconv.so.2.5.1

libcharset.a   libcharset.so.1      libiconv.so    preloadable_libiconv.so

libcharset.la  libcharset.so.1.0.0  libiconv.so.2

实际链接到库的时候,指定库目录,在/etc/ld.so.conf文件之后追加一行/opt/iconv/lib.采用ldconfig命令的时候,出错:

libcharset.so.1 不是符号链接

libiconv.so.2 不是符号链接

原因是:删除这两个文件,然后使用ldconfig命令,生成该符号链接。

[root@jack lib]# ll

总用量 3560

-rw-r–r–. 1 root root     212 9月  13 10:22 charset.alias

-rw-r–r–. 1 root root   27868 9月  13 10:22 libcharset.a

-rw-r–r–. 1 root root     936 9月  13 10:22 libcharset.la

-rw-r–r–. 1 root root   277609月  13 10:22 libcharset.so

lrwxrwxrwx. 1 root root      19 9月  13 11:10libcharset.so.1->libcharset.so.1.0.0

-rw-r–r–. 1 root root   27760 9月  13 10:22 libcharset.so.1.0.0

-rw-r–r–. 1 root root     912 9月  13 10:22 libiconv.la

-rw-r–r–. 1 root root 1186436 9月  13 10:22 libiconv.so

lrwxrwxrwx. 1 root root      17 9月  13 11:10 libiconv.so.2 ->libiconv.so.2.5.1

-rw-r–r–. 1 root root 1186436 9月  13 10:22 libiconv.so.2.5.1

-rw-r–r–. 1 root root 1168119 9月  13 10:22 preloadable_libiconv.so

调用该动态库的编译命令如下:

g++ test.cpp -I/opt/iconv/include//opt/iconv/lib/libcharset.a/opt/iconv/lib/libiconv.so   libsqlite3.a-lpthread -ldl  -g -o main

2.2禁用优化

./configure–prefix=/opt/iconvCFLAGS=”-g -O0″

生成动态库链接符号错误解决

[root@jack lib]# ldconfig

ldconfig: /opt/iconv/lib/libiconv.so.2 不是符号连接

ldconfig: /opt/iconv/lib/libcharset.so.1 不是符号连接

[root@jack lib]# rm -rflibiconv.so.2libcharset.so.1

[root@jack lib]# ldconfig

2.3 GDB调试源码

主要是将UTF-8编码的字符串在转换成GBK编码,详细的转换规则UTF-8转Unicode,

然后Unicode编码通过查表,映射到GBK编码上

loop_unicode.h:273

执行函数

incount=cd->ifuncs.xxx_mbtowc(cd,&wc,inptr,inleft);

跳转到./utf8.h:30

核心转换函数:static size_t unicode_loop_convert (iconv_t icd,

const char* * inbuf, size_t *inbytesleft,char* *outbuf,size_t*outbytesleft)

at./loop_unicode.h:284

284 incount = cd->ifuncs.xxx_mbtowc(cd,&wc,inptr,inleft);

at./loop_unicode.h:362

362   outcount = cd->ofuncs.xxx_wctomb(cd,outptr,wc,outleft);

该函数进行Unicode转换成GBK

进行的是查表进行转换,在调试的过程中,可以通过附件,提前知道转换的字符编码,然后查看iconv库是否转换有问题

UTF-8转Unicode编码的函数:

static int

utf8_mbtowc (conv_t conv, ucs4_t*pwc,constunsigned char *s, int n)

iconv函数中传递进去的outptr会指向转换字符串的末尾,所以需要进行指针的前移,outptr-返回值

就是指向最开始转换的字符串

iconv_open函数跳转到lib/iconv.c 218 行,里面调用了

#include “iconv_open1.h”

47-60行

141-152行

for (cp = fromcode, bp = buf, count = MAX_WORD_LENGTH+10+1; ; cp++,bp++){

unsigned char c = * (unsigned char *) cp;

if (c >= 0x80)

goto invalid;

if (c >= ‘a’ && c <= ‘z’)

c -= ‘a’-‘A’;

*bp = c;

if (c == ‘\0’)

break;

if (–count == 0)

goto invalid;

}

这里进行了大小写转换,所有的字体编码类型,转换成大写字母,gbk转换成GBK.小写字母转换成大写字母是减去26

目前遇到一个相当大的问题:

ap= aliases_lookup(buf,bp-buf);

if(ap == NULL) {

ap = aliases2_lookup(buf);

if (ap == NULL)

goto invalid;

}

这几行函数没能够单步调试所以并不清楚返回值进行了什么操作

#include “iconv_open2.h”

设置执行的回调函数,以及初始化标志位,具体的没有看出什么

2.4手动编写指令构建动态库

使用库提供的automake,顺利生成libiconv.so文件,目前尝试单独编译,出现如下的问题

使用指令如下:

g++libiconv-1.14/libcharset/lib/localcharset.clibiconv-1.14/lib/iconv.clibiconv-1.14/lib/relocatable.c  libsqlite3.a -lpthread -ldl -Ilibiconv-1.14/-I libiconv-1.14/include/-I libiconv-1.14/lib-Ilibiconv-1.14/libcharset/include/ -fPIC -shared -o libiconv.so

libiconv-1.14/libcharset/lib/localcharset.c:77:25:错误:configmake.h:没有那个文件或目录

libiconv-1.14/libcharset/lib/localcharset.c:Infunction‘const char* get_charset_aliases()’:

libiconv-1.14/libcharset/lib/localcharset.c:135:错误:‘LIBDIR’在此作用域中尚未声明

查找资料显示在windows下无需该文件,因此注释该头文件的包含

问题剩下LIBDIR的定义问题

查找所有的引用LIBDIR ,localcharset.c函数

static const char*get_charset_aliases(void)会通过dir =relocate (LIBDIR);

获取该值,查看该函数的内容:

const char *cp;

cp=charset_aliases;

/* Pointer to the contentsofthecharset.alias file, if it has already been

read, else NULL.  Its format is:

ALIAS_1 ‘\0’ CANONICAL_1 ‘\0’ … ALIAS_n ‘\0’CANONICAL_n ‘\0”\0’  */

static const char *volatilecharset_aliases;

说明指向这个charset.alias文件,查看该文件:

该文件的目录如下:

libiconv-1.14/libcharset/lib

内容如下:

# This file contains a table ofcharacterencodingaliases,

# suitable for operating system’linux-gnu’.

# It was automatically generatedfromconfig.charset.

# Packages using this file:

ISO_646.IRV:1983 ASCII

说明该文件是由同一级目录下的config.charset脚本生成的

跟踪:

linux* | *-gnu*)

#With glibc-2.1 or newer, we don’t need any canonicalization,

#because glibc has iconv and both glibc and libiconv support all

#GNU canonical names directly. Therefore, the Makefile does not

#need to install the alias file at all.

#The following applies only to glibc-2.0.x and older libcs.

echo “ISO_646.IRV:1983 ASCII”

翻译:glibc-2.1以后的版本都不需要任何的标准化文件,因为自带的缘故,该文件只是被之前的版本引用

因此在localcharset.c 定义LIBDIR指向的目录:

#defineLIBDIR”/work/libiconv-1.14/libcharset/lib”

[root@jack work]# g++libiconv-1.14/libcharset/lib/localcharset.clibiconv-1.14/lib/relocatable.c    libiconv-1.14/lib/iconv.c test.cpp  -I libiconv-1.14/ -Ilibiconv-1.14/lib/-Ilibiconv-1.14/include  -Ilibiconv-1.14/libcharset/include/ -I libiconv-1.14/srclib/   libsqlite3.a -lpthread -ldl  -o testmain

/tmp/cc1ENLex.o: Infunction`libiconv_open’:

iconv.c:(.text+0x18206):undefinedreferenceto `aliases_lookup(char const*, unsigned int)’

iconv.c:(.text+0x18391):undefinedreferenceto `aliases_lookup(char const*, unsigned int)’

/tmp/cc1ENLex.o:Infunction`libiconv_open_into’:

iconv.c:(.text+0x187d0): undefinedreferenceto`aliases_lookup(char const*, unsigned int)’

iconv.c:(.text+0x1895b):undefinedreferenceto `aliases_lookup(char const*, unsigned int)’

/tmp/cc1ENLex.o: Infunction`iconv_canonicalize’:

iconv.c:(.text+0x190a9):undefinedreferenceto `aliases_lookup(char const*, unsigned int)’

collect2: ld 返回 1

该函数的定义就在lib/aliases.h文件当中定义的,不清楚为什么无法找到,

然后手动将该定义拷贝到lib/iconv.c文件,还是出现同样子的问题

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/200782.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Go安装OpenCV库(gocv)常见问题

    Go安装OpenCV库(gocv)常见问题

    2021年11月23日
    74
  • 网站的404错误页面制作方法[通俗易懂]

    网站的404错误页面制作方法[通俗易懂]网站的404错误页面怎么做?  网站的404错误页面怎么做呢?很多人学习完seo就对404错误页面的理解有所偏差,认为404错误页面只是为了SEO而存在,实际上,404错误页面不单只是为了seo而存在,它一共提出以下几点理念:  一、提供简明的问题描述,消除访客的挫败感。这个很好理解,告诉用户访问页面不存在,而不会是系统默认的错误页面。  二、提供合理的解决方案,辅助访客完成访问目标。

    2022年7月27日
    28
  • 作为大学生,如何通过学校认证免费获取正版matlab[通俗易懂]

    作为大学生,如何通过学校认证免费获取正版matlab[通俗易懂]时间有限,内容从简主要介绍大学生如何免费获取正版matlab,前提是贵学校已经为你提供了正版的matlab!!!否则,可以直接点右上角了。1.背景介绍作为前大学生,需要用matlab,又不想用盗版,也不想搞激活成功教程之类的,麻烦死了1.1直接上MathWorks官网matlab正版对于学生来说很贵。standard版的一年¥6,200,永久的¥15,500.education版的分…

    2022年10月11日
    2
  • Pytorch的BatchNorm层使用中容易出现的问题

    Pytorch的BatchNorm层使用中容易出现的问题前言:本文主要介绍在pytorch中的BatchNormalization的使用以及在其中容易出现的各种小问题,本来此文应该归属于[1]中的,但是考虑到此文的篇幅可能会比较大,因此独立成篇,希望能够帮助到各位读者。如有谬误,请联系指出,如需转载,请注明出处,谢谢。∇\nabla∇联系方式:e-mail:FesianXu@163.comQQ:973926198github:htt…

    2022年4月28日
    40
  • FEC详解三_第二十三卦详解

    FEC详解三_第二十三卦详解继续上文讲解:3)标准的RTP头结构如下所示:其中第一个字节中的x标志位是否扩展了RTP头,RTP协议允许用户自定义的扩展,扩展的字段紧挨上述RTP固定头。RTP扩展投中承载如下信息:1).当前包所在的Group组序号,码流由连续的Group组成,每个Group拥有自己的唯一序号。(仅仅是小范围的唯一,序号大于255时,计数清零)2).当前包所在的Group组大小3

    2022年8月11日
    6
  • 移动硬盘不显示盘符提示初始化_移动硬盘插上系统起不来

    移动硬盘不显示盘符提示初始化_移动硬盘插上系统起不来一个2T的Seagate希捷移动硬盘,没有怎么用过,在笔记本上拷贝了几个文件就突然消失了,而且再次拔插USB线后发现仍然看不到硬盘盘符。但发现插上USB线后,任务栏中出现了USB插入硬盘的提示图标,看到这个我放心多了,至少表示电路是通的。于是打开了计算机管理,在磁盘管理中视图找到它,但始终没有它的身影双击后磁盘管理,出现了下面的对话框(这个时候千万要冷静,不要去初始化或者格式化,否则就麻烦了…

    2022年9月16日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号