这困扰了我很长时间:如何将指针从任何内容转换为 char *
以将二进制文件转储到磁盘。
在 C 中,您甚至都不会考虑它。
double d = 3.14;
char *cp = (char *)&d;
// do what u would do to dump to disk
然而,在每个人都说 C-cast 不受欢迎的 C++ 中,我一直在这样做:
double d = 3.14;
auto cp = reinterpret_cast<char *>(&d);
现在这是从cppreference复制的, 所以我认为这是正确的方法。
但是,我从多个来源了解到这是 UB。 (例如 this one) 所以我忍不住想知道是否有任何“数据库”方式(根据那篇文章,没有)。
我经常遇到的另一种情况是实现这样的 API:
void serialize(void *buffer);
你会把很多东西转储到这个缓冲区的地方。现在,我一直在这样做:
void serialize(void *buffer) {
int intToDump;
float floatToDump;
int *ip = reinterpret_cast<int *>(buffer);
ip[0] = intToDump;
float *fp = reinterpret_cast<float *>(&ip[1]);
fp[0] = floatToDump;
}
嗯,我想这也是 UB。
现在,是否真的没有“DB”方式来完成这些任务中的任何一个?
我见过有人使用 uintptr_t
来完成类似于 serialize
任务,其中指针作为整数数学以及 sizeof
,
但我在这里猜测它也是 UB。
即使它们是 UB,编译器编写者通常也会做一些理性的事情来确保一切正常。 我同意这一点:要求这不是一件不合理的事情。
所以对于上面提到的两个常见任务,我的问题确实是:
- 是否真的没有“DB”方法来完成它们以满足最终的 C++ 怪胎?
- 除了我一直在做的事情之外,还有什么更好的方法来完成它们?
谢谢!
最佳答案
您的serialize
实现行为未定义,因为您违反了strict aliasing规则。简而言之,严格的别名规则表示您不能通过指针或对不同类型的引用来引用任何对象。不过该规则有一个主要异常(exception):任何对象都可以通过指向 char
、unsigned char
或(C++17 起)std 的指针来引用::字节
。请注意,此异常(exception)不适用于相反的情况;不能通过指向 char
以外的类型的指针访问 char
数组。
这意味着您可以通过这样更改 serialize
函数来定义良好:
void serialize(char* buffer) {
int intToDump = 42;
float floatToDump = 3.14;
std::memcpy(buffer, &intToDump, sizeof(intToDump));
std::memcpy(buffer + sizeof(intToDump), &floatToDump, sizeof(floatToDump));
// Or you could do byte-by-byte manual copy loops
// i.e.
//for (std::size_t i = 0; i < sizeof(intToDump); ++i, ++buffer) {
// *buffer = reinterpret_cast<char*>(&intToDump)[i];
//}
//for (std::size_t i = 0; i < sizeof(floatToDump); ++i, ++buffer) {
// *buffer = reinterpret_cast<char*>(&floatToDump)[i];
//}
}
此处,std::memcpy
不是将 buffer
强制转换为指向不兼容类型的指针,而是将指向要序列化的对象的指针强制转换为指向 的指针无符号字符
。这样做不会违反严格的别名规则,并且程序的行为仍然是明确定义的。请注意,确切的表示形式仍未指定;因为这取决于您的 CPU 的字节顺序。
关于C++:reinterpret_cast 是这些场景中的最佳选择吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55843199/