我正在尝试比较两种格式,我认为它们在某种程度上是兼容的,因为它们通常都是字符串。我曾尝试使用字符串和 std::wstring 执行 strcmp,而且我确信 C++ 专家知道,这根本无法编译。是否可以比较这两种类型?这里有一个简单的转换吗?
最佳答案
您需要将 char*
字符串(ISO C 术语中的“多字节”)转换为 wchar_t*
字符串(ISO C 术语中的“宽字符”)。执行此操作的标准函数称为 mbstowcs
("多字节字符串转宽字符串")
注意:正如史蒂夫在评论中指出的那样,这是一个 C99 函数,因此不符合 ISO C++ 标准,但可能会作为扩展由 C++ 实现支持。 MSVC 和 g++ 都支持它。
它是这样使用的:
const char* input = ...;
std::size_t output_size = std::mbstowcs(NULL, input, 0); // get length
std::vector<wchar_t> output_buffer(output_size);
// output_size is guaranteed to be >0 because of \0 at end
std::mbstowcs(&output_buffer[0], input, output_size);
std::wstring output(&output_buffer[0]);
一旦你有了两个wstring
,像往常一样进行比较。请注意,这将使用当前系统区域设置进行转换(即在 Windows 上,这将是当前的“ANSI”代码页)——通常这正是您想要的,但偶尔您需要处理特定的编码,在这种情况下上面的方法不行,你需要使用类似 iconv
的东西。
编辑
所有其他答案似乎都适用于直接代码点转换(即字符串中每个 char c
的 (wchar_t)c
等价物)。这可能不适用于所有语言环境,但它会起作用,例如你的 char
都是 ASCII 或 Latin-1,而你的 wchar_t
是 Unicode。如果您确定那是您真正想要的,最快的方法实际上是完全避免转换,并使用 std::lexicographical_compare
:
#include <algorithm>
const char* s = ...;
std::wstring ws = ...;
const char* s_end = s + strlen(s);
bool is_ws_less_than_s = std::lexicographical_compare(ws.begin, ws.end(),
s, s_end());
bool is_s_less_than_ws = std::lexicographical_compare(s, s_end(),
ws.begin(), ws.end());
bool is_s_equal_to_ws = !is_ws_less_than_s && !is_s_less_than_ws;
如果您特别需要测试相等性,请使用带有长度检查的 std::equal
:
#include <algorithm>
const char* s = ...;
std::wstring ws = ...;
std::size_t s_len = strlen(s);
bool are_equal =
ws.length() == s_len &&
std::equal(ws.begin(), ws.end(), s);
关于c++ - 字符串比较。如何比较字符串与 std::wstring? WRT 结构体,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1529095/