关于 wcout 输出中文的问题

顺其自然~ 发布时间：2020-11-12 21:14:38 ，浏览量：5

1. cout 场景1: 在源文件中定义 const char* str = "中文" 在 VC++ 编译器上,由于Windows环境用 GBK编码，所以字符串 "中文" 被保存为 GBK内码，编译器也把 str 指向一个包含有 GBK编码的只读内存空间（因为是const）。用 cout 输出 str 时，由于中文Windows环境用GBK编码，所以把GBK编码的 str 内容输出到控制台,没问题。场景2: 在Linux 下编辑一个文件 const char* str = "中文", 由于Linux普遍使用 UTF8 编码，所以在源文件里, "中文" 被保存为 UTF8内码。然后在Windows中打开这个源文件,由于Windows使用GBK编码,所以VC++ 按照GBK去解释被保存为 UTF8 内码的 "中文"，显示为乱码。2. wcout 在源文件中定义 const wchar_t* str = L"中文" 在 VC++ 编译器上，由于指定了L，所以字符串 "中文" 被保存为UNICODE内码(UCS2)，编译器也把 str 指向一个包含有 UNICODE 编码的只读内存空间。用 wcout 输出 str 时, wcout 首先调用 wcstombs() (即根据当前 local 转换, 如果没有设置local,则是经典的C local, 不认识中文)把 str 的内容转换后交给控制台,结果自然什么都不显示. (调试代码可以知道VC++ 2010 实现是一个字符一个字符输出,调用 wctomb_s) 原理我们知道 cout 和 wcout 分别是 basic_ostream 的特化版本, 而 basic_ostream 调用 basic_streambuf 实际执行输出动作,针对 wchar_t，basic_streambuf有专门的特化函数,调用 fputwc 输出一个宽字符，而 fputwc 需要调用 wctomb_s 把宽字符转换后再输出。我们知道wctomb_s 是依赖 locale 的由于默认情况下是C locale，所以用中文内码调用 wctomb_s 会失败。解决办法设置当前系统的locale 替代默认的 "C" locale, 使 wctomb_s 等函数可以正常工作。以下3种方法中的任意一种都可以达到目的。 1. C函数设置全局locale setlocale(LC_ALL, ""); 2. C++ 设置全局locale std::locale::global(std::locale("")); 2. 单独为 wcout 设置一个 locale std::locale loc(""); std::wcout.imbue(loc); 结论和Windows API 不同 C++中的各种 w版本的类或者函数并不能提高性能,因为它们都需要用 wc..to..mb 之类的函数转换为ANSI兼容编码然后调用标准库函数。或者,如果库函数的实现者愿意，针对Windows系统，宽字符的fputwc可以直接调用UNICODE版本的Windows API而不用转换。但是这些都跟C++语言本身没有什么关系。由于Windows内核是UNICODE的,所以直接用 UNICODE 字符串调用 Windows API会有一点点好处。 C++设计者的出发点：我不管你用什么字符编码，与C++无关，要输出时：如果是单字节字符或者多字节字符，直接输出；如果是宽字符，则根据local转换为多字节字符，然后再输出。即使将来UNICODE过时了(假设,假设而已)，也不要紧，只要定义好新的local即可。对于C语言也是这样。Windows设计者的出发点：统一使用 Unicode 宽字符，解决一切问题。

关注

打赏

1688896170

查看更多评论

关于 wcout 输出中文的问题

[ 申请 ]友情链接：