c++ - 将字符串转换为 wstring [没有 locale::global 的俄罗斯符号]

标签 c++ string unicode utf-8 wstring

是否可以在不使用 std::locale::global(std::locale("")); 的情况下将字符串转换为 wstring(假设该字符串仅包含俄语符号且系统编码为 utf-8)? 我需要 C++98 的解决方案。

部分代码:

string s = "Николай";
wstring ws;
StrToWstr(ws, s);
printf("str: %ls\n", ws.c_str());

输出为空。 但是,当我添加

std::locale::global(std::locale(""))

它会打印我

 "Николай" (correct output).

StrToWstr 方法:

size_t StrToWstr(wstring& aDst, const string& aSrc)
{
    size_t length;
    length = mbstowcs(NULL, aSrc.c_str(), 0);
    if (length != static_cast<size_t>(-1)) {
        wchar_t *buffer = new wchar_t[length + 1];
        length = mbstowcs(buffer, aSrc.c_str(), length);
        buffer[length] = L'\0';
        aDst.assign(buffer);
        delete[] buffer;
    }
    return length;
}

调试显示,ws 包含以下内容:

    Name : ws
        Details:{static npos = <optimized out>,
 _M_dataplus = {<std::allocator<wchar_t>> =
 {<__gnu_cxx::new_allocator<wchar_t>> = {<No data fields>},
<No data fields>}, _M_p = 0xb7fbda7c L""}}

最佳答案

您想如何对输出字符串进行编码? UTF16、UTF2 还是其他? 如果两种转换都可以,您可以尝试

// UTF16 conversion
std::wstring_convert<codecvt_utf8_utf16<wchar_t>> converter;
aDst = converter.from_bytes(aSrc);

// UTF2 conversion
std::wstring_convert<codecvt_utf8<wchar_t>> converter;
aDst = converter.from_bytes(aSrc);

我不确定 UTF8->多字节转换是否可行,但您可以尝试

std::wstring_convert<std::codecvt<wchar_t, char, std::mbstate_t>> converter;
aDst = converter.from_bytes(aSrc);

您可能想看看 http://en.cppreference.com/w/cpp/locale/codecvt获取更多信息。

关于c++ - 将字符串转换为 wstring [没有 locale::global 的俄罗斯符号],我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26881661/

相关文章:

c# - C++ .NET Wrapper : Attempted to read or write protected memory. 这通常表示其他内存已损坏

c++ - 语法不明确

C++ inet_ntoa 导致段错误

python - 为什么 Python Unicode 内部格式按照 PEP 100 中的描述实现?

C++ 继承 : How to get Size of called object?

ios - 在 Swift 中将 Int 转换为 String

javascript - 为什么我的 for 循环没有递增,为什么我的拼接没有被改变?

perl - 如何在 Perl 中获取给定索引处的字符?

database - 将整个 DB 字符集设置为 Unicode 的缺点与 Oracle DB 中的某些 NVARCHAR2 相比?

c - POSIX系统上通用字符有什么用?