c++ - 在 C++ 中读取 unicode 输入的问题

标签 c++ unicode

我想从输入中读取一个 Unicode 字符串,为此我使用了宽字符。当我输入 ASCII 字符串时,它工作得很好,但当我输入西里尔字母时,输入似乎是空的。

#include <cstdio> 
#include <string> 
#include <cwchar> 

int main() { 
        setlocale(LC_ALL, "rus"); 
        wchar_t c[64]; 
        wscanf(L"%ls", c); 
        wprintf(L"%d", wcslen(c)); 
        return 0; 
}
< hello
> 5
< алло
> 0

最佳答案

您的程序不检查任何 返回值。在这种情况下,我会对 setlocale 的返回持怀疑态度。 ,因为我很确定调用失败并返回 NULL .

您可以设置哪些语言环境取决于您机器上实际安装的语言环境。

在 Linux 上,您可以从 /usr/share/i18n/SUPPORTED 中获取可能的 语言环境列表:

$ grep -i ru /usr/share/i18n/SUPPORTED 
ce_RU UTF-8
cv_RU UTF-8
mhr_RU UTF-8
os_RU UTF-8
ru_RU.UTF-8 UTF-8
ru_RU.KOI8-R KOI8-R
ru_RU ISO-8859-5
ru_RU.CP1251 CP1251
ru_UA.UTF-8 UTF-8
ru_UA KOI8-U
tt_RU UTF-8

您会注意到它不是“rus”,而是“ru_RU.UTF-8”。但是您的机器上是否真的安装了该语言环境?您可以通过 locale -a 获取已安装 语言环境列表, 你可以通过 locale-gen安装一个新的语言环境,这需要 super 用户权限。

所以,

  • 检查您的系统上是否实际安装了所需的语言环境,
  • 使用正确的语言环境标识符,
  • 检查 setlocale实际上成功了。

综上所述,请注意,您在这里使用的是 C 语言功能。您最好使用 C++ locale/<iostream>而不是 <clocale>/类型不安全 <cstdio> .

关于c++ - 在 C++ 中读取 unicode 输入的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59007702/

相关文章:

delphi - 如何将 Unicode UTF-32(杂项符号和象形文字)分配(显示)给 TLabel.Caption?

Python 使用 euc-kr 编码以意想不到的方式对(韩语)字符进行编码(编解码器、编码模块)

c++ - ZeroMQ:重新绑定(bind)套接字时地址正在使用错误

c++ - 编译器是否允许它认为常量表达式中的未定义行为有余地?

c++ - 为什么依赖于参数的查找不适用于默认参数?

Java不显示特殊的UTF符号?

c - 在纯 C 中打开一个 Unicode 文件

c++ - 在双向链表中搜索

c++ - Visual Studio 2015中出现错误D8040的原因是什么?

string - 将字符串索引为字符