c - 如何改进 printf 各种整数类型的缓冲区大小确定？

将整数转换为文本时，通常我会创建一个大缓冲区以与sprintf() 一起使用保留任何潜在的结果。

char BigBuffer[50];
sprintf(BugBuffer, "%d", SomeInt);

我想要更节省空间并且当然更便携，所以而不是 50 ，找到替代方案:
(sizeof(integer_type)*CHAR_BIT*0.302) + 3

// 0.0302 about log10(2)
#define USHORT_DECIMAL_BUFN ((size_t) (sizeof(unsigned short)*CHAR_BIT*0.302) + 3)
#define INT_DECIMAL_BUFN    ((size_t) (sizeof(int)           *CHAR_BIT*0.302) + 3)
#define INTMAX_DECIMAL_BUFN ((size_t) (sizeof(intmax_t)      *CHAR_BIT*0.302) + 3)

int main() {
    char usbuffer[USHORT_DECIMAL_BUFN];
    sprintf(usbuffer, "%hu", USHRT_MAX);
    printf("Size:%zu Len:%zu %s\n", sizeof(usbuffer), strlen(usbuffer), usbuffer);

    char ibuffer[INT_DECIMAL_BUFN];
    sprintf(ibuffer, "%d", INT_MIN);
    printf("Size:%zu Len:%zu %s\n", sizeof(ibuffer), strlen(ibuffer), ibuffer);

    char imbuffer[INTMAX_DECIMAL_BUFN];
    sprintf(imbuffer, "%" PRIdMAX, INTMAX_MIN);
    printf("Size:%zu Len:%zu %s\n", sizeof(imbuffer), strlen(imbuffer), imbuffer);
    return 0;
}

Size:7 Len:5 65535
Size:12 Len:11 -2147483648
Size:22 Len:20 -9223372036854775808

所以问题是:
1 替代方程有问题吗？
2 有什么更好的解决办法？ - 因为这个替代方案有点浪费，而且看起来过于复杂。

[编辑答案]

答案提供了 3 种深思熟虑的方法:
1 使用缓冲区[类型的最大大小](已选择答案)
2 asprintf()
3 snprintf()

1 使用等式 (sizeof(integer_type)*CHAR_BIT*0.302) + 3 的编译时最大缓冲区大小没有损坏也没有改进。 <locale.h>的影响|按照@paddy 的建议进行了研究，没有区域设置影响整数转换%d %x %u %i .我们发现，如果已知类型是有符号或无符号的(如下)，则可以对等式进行轻微改进。 @paddy 关于“更保守”的警告是个好建议。

2 asprintf()确实是一个很好的通用解决方案，但不可移植。也许在 C11 之后？

3 snprintf() ，虽然是标准的，但在提供的缓冲区过小时存在已知的一致实现问题。这意味着使用超大缓冲区调用它，然后生成一个大小合适的缓冲区。 @jxh 建议使用线程安全的全局暂存缓冲区，以使用本地大小合适的缓冲区来形成答案。这种新颖的方法值得考虑，我可能会使用它，但最初的问题更侧重于在 s(n)printf() 之前确定调用保守的缓冲区大小。

signed ((sizeof(integer_type)*CHAR_BIT-1)*0.302) + 3
unsigned (sizeof(integer_type)*CHAR_BIT*0.302) + 2
*28/93可以用来代替 *0.302 .

最佳答案

我觉得不错。您已将小数点四舍五入，为负号和空值添加了一个额外的字符，并为良好的度量添加了一个额外的字符。如果您不使用 <locale.h> 中的功能，我认为您不必担心数字会变长。 .

我的问题是你打算用这些做什么。您是简单地在堆栈上构建它们，还是将大量它们放入内存？

对于堆栈上的临时数组，您通常不会为几个字节而大惊小怪，因为它不太可能影响缓存性能。它肯定不会耗尽您的内存力。

如果您打算存储大量此类数据，则可能需要考虑池化。但是，您需要考虑池的内存开销。池的本质意味着您保留的内存多于您将要使用的内存。如果编译 64 位，你的指针是 8 个字节。如果您的大多数数字都是 4 个字符长，那么 8 字节指针加上每个数字的 5 字节存储空间将抵消任何可能的好处，64 位数字可能除外。

这些只是我的思考过程。在我看来，你已经很好地减少了脂肪。我倾向于更保守一点，但这可能主要是偏执狂。保持简单通常是要走的路，而过度思考可能是一个陷阱。如果您考虑过度，请考虑原因，并确定它是否是一个真正需要考虑太多的问题。

关于c - 如何改进 printf 各种整数类型的缓冲区大小确定？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18708679/

c - 如何改进 printf 各种整数类型的缓冲区大小确定？

上一篇：c - 为什么位域必须是整数？

下一篇：c - 需要帮助理解 char 和 int 指针