我决定将我的 win32 c++ 应用程序转换为 Unicode 版本,但是当我使用它时,我得到了阿拉伯语、中文和日语的不可读字母...
首先:
如果我不使用 Unicode,我可以在编辑框窗口标题中使用阿拉伯语:
HWND hWnd = CreateWindowEx(WS_EX_CLIENTEDGE, "Edit", "ا ب ت ث ج ح خ د ذ", WS_CHILD | WS_VISIBLE | WS_BORDER | ES_MULTILINE, 10, 10, 300, 200, hWnd, (HMENU)100, GetModuleHandle(NULL), NULL);
SetWindowText(hWnd, "صباح الخير");
输出看起来不错,工作正常! (没有 unicode)。
- 使用 Unicode:
我在包含标题之前添加:
#define UNICODE
#include <windows.h
现在在窗口过程中:
case WM_CREATE:{
HWND hEdit = CreateWindowExW(WS_EX_CLIENTEDGE, L"Edit", L"ا ب ت ث ج ح خ د ذ", WS_CHILD | WS_VISIBLE | WS_BORDER | ES_MULTILINE, 10, 10, 300, 200, hWnd, (HMENU)100, GetModuleHandle(NULL), NULL);
// Even I send message to change text but I get unreadable characters!
}
break;
case WM_LBUTTONDBLCLK:{
SendDlgItemMessageW(hWnd, 100, WM_SETTEXT, 0, (LPARAM)L"السلام عليكم"); // Get unreadable characters also
}
break;
ِ如您所见,使用 Unicode,控件无法正确显示阿拉伯字符。
- 重要的是:创建控件后,我用
backspace
手动删除了内容 现在,如果我手动输入阿拉伯文本,它会成功正确显示吗?!!!但是为什么 Wen 使用 Functions 呢?像SetWindowTextW()
??
请帮助。谢谢你。
最佳答案
请确保将源文件保存为带 BOM 的 UTF-16 或 UTF-8。许多 Windows 应用程序采用 ANSI 编码(默认本地化 Windows 代码页)。您还可以检查编译器开关以强制对源文件使用 UTF-8。例如,MS Visual Studio 2015 的编译器有一个 /utf-8
开关,因此不需要使用 BOM 保存。
这是一个以 UTF-8 格式保存的简单示例,然后以带 BOM 的 UTF-8 格式保存,并使用 Microsoft Visual Studio 编译器进行编译。请注意,如果您对 API 的 W 版本进行硬编码并对宽字符串使用 L"",则无需定义 UNICODE:
#include <windows.h>
int main()
{
MessageBoxW(NULL,L"ا ب ت ث ج ح خ د ذ",L"中文",MB_OK);
}
结果 (UTF-8)。编译器采用 ANSI 编码 (Windows-1252) 并错误地解码了宽字符串。
结果(带 BOM 的 UTF-8)。编译器检测 BOM 并使用 UTF-8 解码源代码,从而为宽字符串生成正确的数据。
一段演示解码错误的 Python 代码:
>>> s='中文,ا ب ت ث ج ح خ د ذ'
>>> print(s.encode('utf8').decode('Windows-1252'))
ä¸æ–‡,ا ب ت Ø« ج Ø Ø® د Ø°
关于c++ - 为什么我的应用程序无法正确显示 unicode 字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46799465/