c++ - 将char转换为short时如何避免0xFF前缀？

当我这样做时:

cout << std::hex << (short)('\x3A') << std::endl;
cout << std::hex << (short)('\x8C') << std::endl;

我希望得到以下输出:

3a
8c

但是，我有:

3a
ff8c

我想这是由于 char——更准确地说是 signed char——在内存中的存储方式:低于 0x80 的所有内容不会有前缀；另一方面，0x80 及以上的值将以 0xFF 为前缀。

当给定一个 signed char 时，我如何获得其中实际字符的十六进制表示？换句话说，如何为 \x3A 获取 0x3A，为 \x8C 获取 0x8C？

我认为条件逻辑不适合这里。虽然我可以在需要时从生成的 short 中减去 0xFF00，但这似乎不是很清楚。

最佳答案

如果您以十进制而不是十六进制查看输出，您的输出可能更有意义:

std::cout << std::dec << (short)('\x3A') << std::endl;
std::cout << std::dec << (short)('\x8C') << std::endl;

输出:

58
-116

值被转换为short，所以我们(最常见的)处理 16 位值。 -116的16位二进制表示是1111 1111 1000 1100，十六进制变成FF8C。因此，根据您的要求，输出是正确的(在 char 是有符号类型的系统上)。与其说是 char 存储在内存中的方式，不如说是解释位的方式。作为无符号值，8 位模式 1000 1100 表示 -116，转换为 short 应该保留此值，而不是保留位。

您所需的十六进制 8C 输出对应于(对于 short)十进制值 140。要从 8 位中获取此值，必须将该值解释为无符号的 8 位值(因为最大的带符号 8 位值是 127)。因此，在将数据扩展为某种类型的 short 之前，需要将数据解释为 unsigned char。对于示例代码中的字 rune 字，这将如下所示。

std::cout << std::hex << (unsigned short)(unsigned char)('\x3A') << std::endl;
std::cout << std::hex << (unsigned short)(unsigned char)('\x8C') << std::endl;

最有可能的是，真正的代码会有变量而不是字 rune 字。如果是这种情况，那么与其强制转换为 unsigned char，不如将变量声明为 unsigned char 类型可能更方便。 这可能是您无论如何都应该使用的类型，基于您希望查看其十六进制值这一事实。不确定，但这确实表明该值被简单地视为一个数据字节而不是一个数字，这表明无符号类型是合适的。你看过std::byte了吗？

另一个要抛弃的绝妙想法:下面还提供了所需的输出，作为使用 unsigned char 变量的合理复制品。

#include <iostream>

unsigned char operator "" _u (char c) { return c; } // Suffix for unsigned char literals

int main()
{
    std::cout << std::hex << (unsigned short)('\x3A'_u) << std::endl;
    std::cout << std::hex << (unsigned short)('\x8C'_u) << std::endl;
}

关于c++ - 将char转换为short时如何避免0xFF前缀？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55130506/

c++ - 将char转换为short时如何避免0xFF前缀？

上一篇：c++ - OpenCL POCL + asan 或 valgrind

下一篇：c++ - 禁用编译器扩展 Xcode