c++ - 为什么我的应用程序无法正确显示 unicode 字符?

标签 c++ winapi unicode

我决定将我的 win32 c++ 应用程序转换为 Unicode 版本,但是当我使用它时,我得到了阿拉伯语、中文和日语的不可读字母...

首先:

如果我不使用 Unicode,我可以在编辑框窗口标题中使用阿拉伯语:

HWND hWnd = CreateWindowEx(WS_EX_CLIENTEDGE, "Edit", "ا ب ت ث ج ح خ د ذ", WS_CHILD | WS_VISIBLE | WS_BORDER | ES_MULTILINE, 10, 10, 300, 200, hWnd, (HMENU)100, GetModuleHandle(NULL), NULL);

SetWindowText(hWnd, "صباح الخير");

输出看起来不错,工作正常! (没有 unicode)。

  • 使用 Unicode:

我在包含标题之前添加:

#define UNICODE
#include <windows.h

现在在窗口过程中:

case WM_CREATE:{
    HWND hEdit = CreateWindowExW(WS_EX_CLIENTEDGE, L"Edit", L"ا ب ت ث ج ح خ د ذ", WS_CHILD | WS_VISIBLE | WS_BORDER | ES_MULTILINE, 10, 10, 300, 200, hWnd, (HMENU)100, GetModuleHandle(NULL), NULL);

    // Even I send message to change text but I get unreadable characters!
}
break;
case WM_LBUTTONDBLCLK:{
    SendDlgItemMessageW(hWnd, 100, WM_SETTEXT, 0, (LPARAM)L"السلام عليكم"); // Get unreadable characters also
}
break;

ِ如您所见,使用 Unicode,控件无法正确显示阿拉伯字符。

  • 重要的是:创建控件后,我用 backspace 手动删除了内容 现在,如果我手动输入阿拉伯文本,它会成功正确显示吗?!!!但是为什么 Wen 使用 Functions 呢?像 SetWindowTextW()??

请帮助。谢谢你。

最佳答案

请确保将源文件保存为带 BOM 的 UTF-16 或 UTF-8。许多 Windows 应用程序采用 ANSI 编码(默认本地化 Windows 代码页)。您还可以检查编译器开关以强制对源文件使用 UTF-8。例如,MS Visual Studio 2015 的编译器有一个 /utf-8 开关,因此不需要使用 BOM 保存。

这是一个以 UTF-8 格式保存的简单示例,然后以带 BOM 的 UTF-8 格式保存,并使用 Microsoft Visual Studio 编译器进行编译。请注意,如果您对 API 的 W 版本进行硬编码并对宽字符串使用 L"",则无需定义 UNICODE:

#include <windows.h>

int main()
{
    MessageBoxW(NULL,L"ا ب ت ث ج ح خ د ذ",L"中文",MB_OK);
}

结果 (UTF-8)。编译器采用 ANSI 编码 (Windows-1252) 并错误地解码了宽字符串。

Corrupted image

结果(带 BOM 的 UTF-8)。编译器检测 BOM 并使用 UTF-8 解码源代码,从而为宽字符串生成正确的数据。

Correct image

一段演示解码错误的 Python 代码:

>>> s='中文,ا ب ت ث ج ح خ د ذ'
>>> print(s.encode('utf8').decode('Windows-1252'))
中文,ا ب ت ث ج ح خ د ذ

关于c++ - 为什么我的应用程序无法正确显示 unicode 字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46799465/

相关文章:

c++ - 从函数返回类对象的不同行为

c++ - Qt 手势。没有收到 qgesture 事件

c++ - IDD_ABOUT : undeclared identifier

cocoa - 当用户将窗口移动到不同的显示器时,OpenGL 上下文停止工作

ios - 在 iOS 上不一致地处理表情符号序列?

php - MySQL 中的 Unicode 字符在 PHP 和 ASP 中返回不同的字符代码值

c++ - 在c++中,虚函数、函数覆盖和多态性是否相互关联?

c++ - munmap_chunk:使用 std::vector 更改数据存储位置时的无效指针

c++ - Win32 API : How to clip siblings using GetDCEx()?

python - python 的正则表达式更改一组字符