Visual Studio——使用多字节字符集与使用Unicode字符集

Visual Studio——使用多字节字符集与使用Unicode字符集vs配置选项“使用多字节字符集”和“使用Unicode字符集”的区别VS集成开发环境,字符集选择“使用多字节字符集”和“使用Unicode字符集”的直接区别就是:编译器是否增加了宏定义——UNICODE。当选择“使用Unicode字符集”时,编译器会增加宏定义——UNICODE;而选择“使用多字节字符集”时,编译器则不会增加宏定义——UNICODE。而是否增加了宏定义UNICODE,则…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

vs配置选项“使用多字节字符集”和“使用Unicode字符集”的区别

VS集成开发环境,字符集选择“使用多字节字符集”和“使用Unicode字符集”的直接区别就是:编译器是否增加了宏定义——UNICODE。当选择“使用Unicode字符集”时,编译器会增加宏定义——UNICODE;而选择“使用多字节字符集”时,编译器则不会增加宏定义——UNICODE。

Visual Studio——使用多字节字符集与使用Unicode字符集

而是否增加了宏定义UNICODE,则影响了一些Windows API的使用。例如:

例子1:MessageBox的使用

windows API对MessageBox的定义如下:

WINUSERAPI
int
WINAPI
MessageBoxA(
    __in_opt HWND hWnd,
    __in_opt LPCSTR lpText,
    __in_opt LPCSTR lpCaption,
    __in UINT uType);
WINUSERAPI
int
WINAPI
MessageBoxW(
    __in_opt HWND hWnd,
    __in_opt LPCWSTR lpText,
    __in_opt LPCWSTR lpCaption,
    __in UINT uType);
#ifdef UNICODE
#define MessageBox  MessageBoxW
#else
#define MessageBox  MessageBoxA
#endif // !UNICODE

Jetbrains全家桶1年46,售后保障稳定

当选用“使用Unicode字符集”时,调用函数MessageBox,实际使用的是MessageBoxW,MessageBoxW关于字符串的入参类型是LPCWSTR,使用MessageBox时,字符串前需加L

::MessageBox(NULL, L“这是一个测试程序!”, L“Title”, MB_OK);

当选用“使用多字节字符集”时,调用函数MessageBox,实际使用的是MessageBoxA,MessageBoxA关于字符串的入参类型是LPCSTR

::MessageBox(NULL, “这是一个测试程序!”, “Title”, MB_OK);

例子2:OutputDebugString的使用

windows API对OutputDebugString的定义如下:

WINBASEAPI
VOID
WINAPI
OutputDebugStringA(
    __in_opt LPCSTR lpOutputString
    );
WINBASEAPI
VOID
WINAPI
OutputDebugStringW(
    __in_opt LPCWSTR lpOutputString
    );
#ifdef UNICODE
#define OutputDebugString  OutputDebugStringW
#else
#define OutputDebugString  OutputDebugStringA
#endif // !UNICODE

当选则“使用Unicode字符集”时,调用函数OutputDebugString,实际使用的是OutputDebugStringW,OutputDebugStringW的入参的类型是LPCWSTR,使用OutputDebugString时,字符串前需加L

OutputDebugString(L“测试12345”);

当选则“使用多字节字符集”时,调用函数OutputDebugString,实际使用的是OutputDebugStringA,OutputDebugStringA的入参类型是LPCSTR

OutputDebugString(“测试12345”);

因此,“使用Unicode字符集”和“使用多字节字符集”的直接区别是:编译器是否增加了宏定义——UNICODE。而是否增加了宏定义(UNICODE)则决定了Windows API函数参数有字符串时使用的多字节字符集还是宽字符字符集。

下面介绍多字节字符集还是宽字符(UNICODE)字符集的区别。

 

多字节字符集和宽字符(UNICODE)字符集的区别

要理解字节字符集还是宽字符(UNICODE)字符集的区别,首先先理解char与wchar_t的区别

1. char与wchar_t的区别

char叫多字节字符,一个char占一个字节,之所以叫多字节字符是因为它表示一个字符时可能是一个字节也可能是多个字节。一个英文字符(如’s’)用一个char(一个字节)表示,一个中文汉字(如’我’)用2个char(两个字节)表示。

wchar_t被称为宽字符,一个wchar_t占2个字节。之所以叫宽字符是因为所有的字都要用两个字节(即一个wchar_t)来表示,不管是英文还是中文。用常量给wchar_t赋值是,需要在常量前面加L。

可从下面的例子和运行结果,看出两者的区别。

// Test0601.cpp : 定义控制台应用程序的入口点。
//
#include <iostream>
using namespace std;

//多字节字符测试
void CharTest()
{
	cout << "********多字节字符测试********" << endl;

	char cChar1 = 'a';
	cout << "字符1 : " << cChar1 << "    字符1的长度" << sizeof(char) << endl;

	char cChar2 = '我';//无法输出正确结果
	cout << "字符2 : " << cChar2 << "    字符2的长度" << sizeof(char) << endl;

	/*char szChar3[2] = "我";//编译不通过,提示“数组界限溢出”
	cout << "字符3 : " << szChar3 << endl;*/

	char szChar4[3] = "我";//前两个字节存放汉字'我',最后一个字节存放字符串结束符\0
	cout << "字符4:" << szChar4 << "    字符4的字节长度 : " << strlen(szChar4) * sizeof(char) << endl;
}

//宽字符测试
void WCharTest()
{
	wcout.imbue(locale("chs"));//将wcout的本地化语言设置为中文
	wcout << L"********多字节字符测试********" << endl;

	wchar_t wcChar1 = L's';
	wcout << L"字符1 : " << wcChar1 << L"    字符1的长度" << sizeof(wchar_t) << endl;

	wchar_t wcChar2 = L'中';// 正确,一个汉字用一个wchar_t表示
	wcout << L"字符2:" << wcChar2 << L"    字符2的长度" << sizeof(wchar_t) << endl;

	wchar_t wszChar3[2] = L"中";// 前两个字节(前一个wchar_t)存放汉字'中',最后两个字节(后一个wchar_t)存放字符串结束符\0
	wcout << L"字符3:" << wszChar3 << L"    字符3的字节长度: " << wcslen(wszChar3) * sizeof(wchar_t) << endl;

	wchar_t wszChar4[3] = L"中国";
	wcout << L"字符串4 : " << wszChar4 << L"    字符串4的字节长度: " << wcslen(wszChar4) * sizeof(wchar_t) << endl;
}


int main()
{
	//多字节字符测试
	CharTest();
	//宽字符测试
	WCharTest();
	system("pause");
	return 0;
}

运行结果

Visual Studio——使用多字节字符集与使用Unicode字符集

2. LPCSTR与LPCWSTR的区别

LPCSTR的定义如下

typedef __nullterminated CONST CHAR *LPCSTR, *PCSTR;
typedef char CHAR;

LPCWSTR的定义如下

typedef __nullterminated CONST WCHAR *LPCWSTR, *PCWSTR;
typedef wchar_t WCHAR;    // wc,   16-bit UNICODE character

可以看出LPCSTR与LPCWSTR的区别即为char与wchar_t的区别

下面是常用的多字节和宽字节对照表。

多字节和宽字节对照表
多字节字符集 宽字节(UNICODE)字符集 通用
char wchar_t TCHAR
char* wchar_t* TCHAR*
LPSTR LPWSTR LPTSTR
LPCSTR LPCWSTR LPCTSTR

3. 多字节字符集及宽字节字符集的兼容

使用_T、TCHAR等实现程序对多字节字符集及宽字节字符集的兼容

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/201618.html原文链接:https://javaforall.net

(0)
上一篇 2025年8月15日 上午11:22
下一篇 2025年8月15日 下午12:01


相关推荐

  • 十进制数转化为二进制数的两种方法

    十进制数转化为二进制数的两种方法如果我们要把十进制的 150 转化为二进制数 可以使用下面两种方法 第一种方法 表格法这种方法的核心思想就是用二进制的各位来 拼凑 出我们的十进制数 我们先把二进制各位的位权列在表格里面 我们如何知道要列多少位出来呢 其实我们就是要列到比 150 小并且最接近 150 的那一位 也就是列到 128 就可以了 128 64 32 16 8 4 2 1 然后我们从左

    2026年3月17日
    1
  • 安装mysql-python报错_mac好用的ssh

    安装mysql-python报错_mac好用的sshmac系统安装mysqlclient时,会报错OSError:mysql_confignotfound解决办法在项目路径下输入以下内容PATH="$PATH":/usr

    2022年8月7日
    14
  • AI龙虾爆火 安全风险需警惕各方观点

    AI龙虾爆火 安全风险需警惕各方观点

    2026年3月15日
    2
  • java 接口default_接口default方法作用

    java 接口default_接口default方法作用在java8以后,接口中可以添加使用default或者static修饰的方法,在这里我们只讨论default方法,default修饰方法只能在接口中使用,在接口种被default标记的方法为普通方法,可以直接写方法体。实现类会继承接口中的default方法如果接口A中有default方法:publicinterfaceA{ publicdefaultvoida(){ System…

    2022年8月30日
    6
  • mediumtext_MySQL中tinytext、text、mediumtext和longtext等各个类型详解【图】

    mediumtext_MySQL中tinytext、text、mediumtext和longtext等各个类型详解【图】MySQL中tinytext、text、mediumtext和longtext等各个类型详解【图】07-29栏目:技术TAG:mediumtextmediumtext一、字符串类型www.jhua.org类型www.jhua.org范围https://www.jhua.org说明www.jhua.orgChar(N)[binary]N=1~255个字节jhua.orgbinary:分…

    2022年5月2日
    45
  • dataTable自定义搜索框位置

    dataTable自定义搜索框位置其实不能叫自定义位置dataTable的搜索框请参阅dataTabledom:http://www.datatables.club/reference/option/dom.html我的需求是将dataTable默认位置的搜索框移动到我的form表单中的搜索位置如图:因为自己不会写前端却要写前端幸得群里大神指点在页面写样式覆盖原来的样式在这里记录一下解决办法…

    2022年7月13日
    22

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号