c++ - UTF8 到/从 STL 中的宽字符转换

标签 c++ unicode stl utf-8 character-encoding

是否可以以独立于平台的方式将 std::string 中的 UTF8 字符串转换为 std::wstring,反之亦然?在 Windows 应用程序中,我会使用 MultiByteToWideChar 和 WideCharToMultiByte。但是,代码是为多个操作系统编译的,我仅限于标准 C++ 库。

最佳答案

我 5 年前就问过这个问题。这个线程当时对我很有帮助,我得出了结论,然后我继续我的项目。有趣的是,我最近需要类似的东西,与过去的那个项目完全无关。在研究可能的解决方案时,我偶然发现了自己的问题:)

我现在选择的方案是基于C++11的。 Constantin 在 his answer 中提到的 boost 库现在是标准的一部分。如果我们用新的字符串类型 std::u16string 替换 std::wstring,那么转换将如下所示:

UTF-8 到 UTF-16

std::string source;
...
std::wstring_convert<std::codecvt_utf8_utf16<char16_t>,char16_t> convert;
std::u16string dest = convert.from_bytes(source);    

UTF-16 到 UTF-8

std::u16string source;
...
std::wstring_convert<std::codecvt_utf8_utf16<char16_t>,char16_t> convert;
std::string dest = convert.to_bytes(source);    

从其他答案可以看出,有多种方法可以解决这个问题。这就是为什么我不选择接受的答案。

关于c++ - UTF8 到/从 STL 中的宽字符转换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62479008/

相关文章:

c++ - 如何在 linux 中将 conio.h 添加到 nvcc

c++ - Qt C++ 中 anchor 的等价物是什么?

python - Unicode 转义错误

c++ - 如何让 set::find() 为自定义类对象工作?

c++ - 与 C 语言相比,C++ 的限制是什么?

c++ - 链接到 smpeg 库

c - 将阿拉伯字符声明并打印为 wchar_t

Python 相当于 'grep -C N' ?

c++ - 使用 Gurobi 向模型添加约束时出现问题

c++ - std::sort 使用索引但保持索引顺序