Visual Studio——使用多字节字符集与使用Unicode字符集

Visual Studio——使用多字节字符集与使用Unicode字符集vs配置选项“使用多字节字符集”和“使用Unicode字符集”的区别VS集成开发环境,字符集选择“使用多字节字符集”和“使用Unicode字符集”的直接区别就是:编译器是否增加了宏定义——UNICODE。当选择“使用Unicode字符集”时,编译器会增加宏定义——UNICODE;而选择“使用多字节字符集”时,编译器则不会增加宏定义——UNICODE。而是否增加了宏定义UNICODE,则…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

vs配置选项“使用多字节字符集”和“使用Unicode字符集”的区别

VS集成开发环境,字符集选择“使用多字节字符集”和“使用Unicode字符集”的直接区别就是:编译器是否增加了宏定义——UNICODE。当选择“使用Unicode字符集”时,编译器会增加宏定义——UNICODE;而选择“使用多字节字符集”时,编译器则不会增加宏定义——UNICODE。

Visual Studio——使用多字节字符集与使用Unicode字符集

而是否增加了宏定义UNICODE,则影响了一些Windows API的使用。例如:

例子1:MessageBox的使用

windows API对MessageBox的定义如下:

WINUSERAPI
int
WINAPI
MessageBoxA(
    __in_opt HWND hWnd,
    __in_opt LPCSTR lpText,
    __in_opt LPCSTR lpCaption,
    __in UINT uType);
WINUSERAPI
int
WINAPI
MessageBoxW(
    __in_opt HWND hWnd,
    __in_opt LPCWSTR lpText,
    __in_opt LPCWSTR lpCaption,
    __in UINT uType);
#ifdef UNICODE
#define MessageBox  MessageBoxW
#else
#define MessageBox  MessageBoxA
#endif // !UNICODE

Jetbrains全家桶1年46,售后保障稳定

当选用“使用Unicode字符集”时,调用函数MessageBox,实际使用的是MessageBoxW,MessageBoxW关于字符串的入参类型是LPCWSTR,使用MessageBox时,字符串前需加L

::MessageBox(NULL, L“这是一个测试程序!”, L“Title”, MB_OK);

当选用“使用多字节字符集”时,调用函数MessageBox,实际使用的是MessageBoxA,MessageBoxA关于字符串的入参类型是LPCSTR

::MessageBox(NULL, “这是一个测试程序!”, “Title”, MB_OK);

例子2:OutputDebugString的使用

windows API对OutputDebugString的定义如下:

WINBASEAPI
VOID
WINAPI
OutputDebugStringA(
    __in_opt LPCSTR lpOutputString
    );
WINBASEAPI
VOID
WINAPI
OutputDebugStringW(
    __in_opt LPCWSTR lpOutputString
    );
#ifdef UNICODE
#define OutputDebugString  OutputDebugStringW
#else
#define OutputDebugString  OutputDebugStringA
#endif // !UNICODE

当选则“使用Unicode字符集”时,调用函数OutputDebugString,实际使用的是OutputDebugStringW,OutputDebugStringW的入参的类型是LPCWSTR,使用OutputDebugString时,字符串前需加L

OutputDebugString(L“测试12345”);

当选则“使用多字节字符集”时,调用函数OutputDebugString,实际使用的是OutputDebugStringA,OutputDebugStringA的入参类型是LPCSTR

OutputDebugString(“测试12345”);

因此,“使用Unicode字符集”和“使用多字节字符集”的直接区别是:编译器是否增加了宏定义——UNICODE。而是否增加了宏定义(UNICODE)则决定了Windows API函数参数有字符串时使用的多字节字符集还是宽字符字符集。

下面介绍多字节字符集还是宽字符(UNICODE)字符集的区别。

 

多字节字符集和宽字符(UNICODE)字符集的区别

要理解字节字符集还是宽字符(UNICODE)字符集的区别,首先先理解char与wchar_t的区别

1. char与wchar_t的区别

char叫多字节字符,一个char占一个字节,之所以叫多字节字符是因为它表示一个字符时可能是一个字节也可能是多个字节。一个英文字符(如’s’)用一个char(一个字节)表示,一个中文汉字(如’我’)用2个char(两个字节)表示。

wchar_t被称为宽字符,一个wchar_t占2个字节。之所以叫宽字符是因为所有的字都要用两个字节(即一个wchar_t)来表示,不管是英文还是中文。用常量给wchar_t赋值是,需要在常量前面加L。

可从下面的例子和运行结果,看出两者的区别。

// Test0601.cpp : 定义控制台应用程序的入口点。
//
#include <iostream>
using namespace std;

//多字节字符测试
void CharTest()
{
	cout << "********多字节字符测试********" << endl;

	char cChar1 = 'a';
	cout << "字符1 : " << cChar1 << "    字符1的长度" << sizeof(char) << endl;

	char cChar2 = '我';//无法输出正确结果
	cout << "字符2 : " << cChar2 << "    字符2的长度" << sizeof(char) << endl;

	/*char szChar3[2] = "我";//编译不通过,提示“数组界限溢出”
	cout << "字符3 : " << szChar3 << endl;*/

	char szChar4[3] = "我";//前两个字节存放汉字'我',最后一个字节存放字符串结束符\0
	cout << "字符4:" << szChar4 << "    字符4的字节长度 : " << strlen(szChar4) * sizeof(char) << endl;
}

//宽字符测试
void WCharTest()
{
	wcout.imbue(locale("chs"));//将wcout的本地化语言设置为中文
	wcout << L"********多字节字符测试********" << endl;

	wchar_t wcChar1 = L's';
	wcout << L"字符1 : " << wcChar1 << L"    字符1的长度" << sizeof(wchar_t) << endl;

	wchar_t wcChar2 = L'中';// 正确,一个汉字用一个wchar_t表示
	wcout << L"字符2:" << wcChar2 << L"    字符2的长度" << sizeof(wchar_t) << endl;

	wchar_t wszChar3[2] = L"中";// 前两个字节(前一个wchar_t)存放汉字'中',最后两个字节(后一个wchar_t)存放字符串结束符\0
	wcout << L"字符3:" << wszChar3 << L"    字符3的字节长度: " << wcslen(wszChar3) * sizeof(wchar_t) << endl;

	wchar_t wszChar4[3] = L"中国";
	wcout << L"字符串4 : " << wszChar4 << L"    字符串4的字节长度: " << wcslen(wszChar4) * sizeof(wchar_t) << endl;
}


int main()
{
	//多字节字符测试
	CharTest();
	//宽字符测试
	WCharTest();
	system("pause");
	return 0;
}

运行结果

Visual Studio——使用多字节字符集与使用Unicode字符集

2. LPCSTR与LPCWSTR的区别

LPCSTR的定义如下

typedef __nullterminated CONST CHAR *LPCSTR, *PCSTR;
typedef char CHAR;

LPCWSTR的定义如下

typedef __nullterminated CONST WCHAR *LPCWSTR, *PCWSTR;
typedef wchar_t WCHAR;    // wc,   16-bit UNICODE character

可以看出LPCSTR与LPCWSTR的区别即为char与wchar_t的区别

下面是常用的多字节和宽字节对照表。

多字节和宽字节对照表
多字节字符集 宽字节(UNICODE)字符集 通用
char wchar_t TCHAR
char* wchar_t* TCHAR*
LPSTR LPWSTR LPTSTR
LPCSTR LPCWSTR LPCTSTR

3. 多字节字符集及宽字节字符集的兼容

使用_T、TCHAR等实现程序对多字节字符集及宽字节字符集的兼容

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/201618.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Linux rootfs_hdfs shell命令

    Linux rootfs_hdfs shell命令本文阐述Linux中的文件系统部分,源代码来自基于IA32的2.4.20内核。总体上说Linux下的文件系统主要可分为三大块:一是上层的文件系统的系统调用,二是虚拟文件系统VFS(VirtualFilesystemSwitch),三是挂载到VFS中的各实际文件系统,例如ext2,jffs等。本文侧重于通过具体的代码分析来解释Linux内核中VFS的内在机制,在这过程

    2022年9月28日
    6
  • vue路由守卫详解

    vue路由守卫详解Vue 路由守卫详解

    2026年1月26日
    1
  • MariaDB安装教程(保姆级)

    MariaDB安装教程(保姆级)Maria的详细下载过程

    2022年6月12日
    134
  • PostgreSQL数据库psql连接报错connections on Unix domain socket “/pgsql/data/.s.PGSQL.5432“?

    PostgreSQL数据库psql连接报错connections on Unix domain socket “/pgsql/data/.s.PGSQL.5432“?问题现象[postgres@lyp~]$pg_ctl-D/pgsql/data/startwaitingforservertostart….2021-10-1501:42:31.606CST[32453]LOG:redirectinglogoutputtologgingcollectorprocess2021-10-1501:42:31.606CST[32453]HINT:Futurelogoutputwillappearin…

    2022年6月19日
    25
  • 团队解散,我们该何去何从?

    团队解散,我们该何去何从?写在最前:纯属吐槽,随笔,勿喷!就在前些天,下班回家的路上,看到群信息,说:听说、听说京东裁员了~,图片来源于网络也是在上上月,也一度被传的沸沸扬扬的:阿里、京东、华为相继被曝停止社招,新闻也是满天飞舞,不管是裁员,还是停止社招,这些事情没有落在亲身经历,没有落在自己身上我们都会觉得不痛不痒,毕竟一个旁观者,永远无法感受当事人的喜怒哀乐~。俗话说:人无远虑必有近忧,假如当你遇上裁员,…

    2022年5月19日
    53
  • ios8绘图方法小记touchesBegan&touchesMoved

    ios8绘图方法小记touchesBegan&touchesMoved////MyView.swift//L01Test////Createdbyrobertkunon15/9/7.//Copyright(c)2015MAC.Allrightsreserved.//importUIKitclassMyView:UIView{varpath=CGPathCreateMutable()//On

    2022年7月25日
    9

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号