当我这样做时:
cout << std::hex << (short)('\x3A') << std::endl;
cout << std::hex << (short)('\x8C') << std::endl;
我希望得到以下输出:
3a
8c
但是,我有:
3a
ff8c
我想这是由于 char
——更准确地说是 signed char
——在内存中的存储方式:低于 0x80 的所有内容不会有前缀;另一方面,0x80 及以上的值将以 0xFF 为前缀。
当给定一个 signed char
时,我如何获得其中实际字符的十六进制表示?换句话说,如何为 \x3A
获取 0x3A,为 \x8C
获取 0x8C?
我认为条件逻辑不适合这里。虽然我可以在需要时从生成的 short
中减去 0xFF00,但这似乎不是很清楚。
最佳答案
如果您以十进制而不是十六进制查看输出,您的输出可能更有意义:
std::cout << std::dec << (short)('\x3A') << std::endl;
std::cout << std::dec << (short)('\x8C') << std::endl;
输出:
58
-116
值被转换为short
,所以我们(最常见的)处理 16 位值。 -116的16位二进制表示是1111 1111 1000 1100
,十六进制变成FF8C
。因此,根据您的要求,输出是正确的(在 char
是有符号类型的系统上)。 与其说是 char
存储在内存中的方式,不如说是解释位的方式。作为无符号值,8 位模式 1000 1100
表示 -116,转换为 short
应该保留此值,而不是保留位。
您所需的十六进制 8C
输出对应于(对于 short
)十进制值 140
。要从 8 位中获取此值,必须将该值解释为无符号的 8 位值(因为最大的带符号 8 位值是 127)。因此,在将数据扩展为某种类型的 short
之前,需要将数据解释为 unsigned char
。对于示例代码中的字 rune 字,这将如下所示。
std::cout << std::hex << (unsigned short)(unsigned char)('\x3A') << std::endl;
std::cout << std::hex << (unsigned short)(unsigned char)('\x8C') << std::endl;
最有可能的是,真正的代码会有变量而不是字 rune 字。如果是这种情况,那么与其强制转换为 unsigned char
,不如将变量声明为 unsigned char
类型可能更方便。 这可能是您无论如何都应该使用的类型,基于您希望查看其十六进制值这一事实。不确定,但这确实表明该值被简单地视为一个数据字节而不是一个数字,这表明无符号类型是合适的。你看过std::byte
了吗?
另一个要抛弃的绝妙想法:下面还提供了所需的输出,作为使用 unsigned char
变量的合理复制品。
#include <iostream>
unsigned char operator "" _u (char c) { return c; } // Suffix for unsigned char literals
int main()
{
std::cout << std::hex << (unsigned short)('\x3A'_u) << std::endl;
std::cout << std::hex << (unsigned short)('\x8C'_u) << std::endl;
}
关于c++ - 将char转换为short时如何避免0xFF前缀?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55130506/