c++ - 为什么我的应用程序无法正确显示 unicode 字符？

我决定将我的 win32 c++ 应用程序转换为 Unicode 版本，但是当我使用它时，我得到了阿拉伯语、中文和日语的不可读字母...

首先:

如果我不使用 Unicode，我可以在编辑框窗口标题中使用阿拉伯语:

HWND hWnd = CreateWindowEx(WS_EX_CLIENTEDGE, "Edit", "ا ب ت ث ج ح خ د ذ", WS_CHILD | WS_VISIBLE | WS_BORDER | ES_MULTILINE, 10, 10, 300, 200, hWnd, (HMENU)100, GetModuleHandle(NULL), NULL);

SetWindowText(hWnd, "صباح الخير");

输出看起来不错，工作正常! (没有 unicode)。

使用 Unicode:

我在包含标题之前添加:

#define UNICODE
#include <windows.h

现在在窗口过程中:

case WM_CREATE:{
    HWND hEdit = CreateWindowExW(WS_EX_CLIENTEDGE, L"Edit", L"ا ب ت ث ج ح خ د ذ", WS_CHILD | WS_VISIBLE | WS_BORDER | ES_MULTILINE, 10, 10, 300, 200, hWnd, (HMENU)100, GetModuleHandle(NULL), NULL);

    // Even I send message to change text but I get unreadable characters!
}
break;
case WM_LBUTTONDBLCLK:{
    SendDlgItemMessageW(hWnd, 100, WM_SETTEXT, 0, (LPARAM)L"السلام عليكم"); // Get unreadable characters also
}
break;

ِ如您所见，使用 Unicode，控件无法正确显示阿拉伯字符。

重要的是:创建控件后，我用 backspace 手动删除了内容现在，如果我手动输入阿拉伯文本，它会成功正确显示吗？!!!但是为什么 Wen 使用 Functions 呢？像 SetWindowTextW()??

请帮助。谢谢你。

最佳答案

请确保将源文件保存为带 BOM 的 UTF-16 或 UTF-8。许多 Windows 应用程序采用 ANSI 编码(默认本地化 Windows 代码页)。您还可以检查编译器开关以强制对源文件使用 UTF-8。例如，MS Visual Studio 2015 的编译器有一个 /utf-8 开关，因此不需要使用 BOM 保存。

这是一个以 UTF-8 格式保存的简单示例，然后以带 BOM 的 UTF-8 格式保存，并使用 Microsoft Visual Studio 编译器进行编译。请注意，如果您对 API 的 W 版本进行硬编码并对宽字符串使用 L""，则无需定义 UNICODE:

#include <windows.h>

int main()
{
    MessageBoxW(NULL,L"ا ب ت ث ج ح خ د ذ",L"中文",MB_OK);
}

结果 (UTF-8)。编译器采用 ANSI 编码 (Windows-1252) 并错误地解码了宽字符串。

Corrupted image

结果(带 BOM 的 UTF-8)。编译器检测 BOM 并使用 UTF-8 解码源代码，从而为宽字符串生成正确的数据。

Correct image

一段演示解码错误的 Python 代码:

>>> s='中文,ا ب ت ث ج ح خ د ذ'
>>> print(s.encode('utf8').decode('Windows-1252'))
ä¸æ–‡,Ø§ Ø¨ Øª Ø« Ø¬ Ø Ø® Ø¯ Ø°

关于c++ - 为什么我的应用程序无法正确显示 unicode 字符？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46799465/

c++ - 为什么我的应用程序无法正确显示 unicode 字符？

上一篇：c++ - 在不存在的对象上调用静态成员函数

下一篇：c++ - noexcept 运算符在调用指向成员函数的指针后失败