c - 如何改进 printf 各种整数类型的缓冲区大小确定?

标签 c data-conversion

将整数转换为文本时,通常我会创建一个 缓冲区以与sprintf() 一起使用保留任何潜在的结果。

char BigBuffer[50];
sprintf(BugBuffer, "%d", SomeInt);

我想要更节省空间并且当然更便携,所以而不是 50 ,找到替代方案:
(sizeof(integer_type)*CHAR_BIT*0.302) + 3

// 0.0302 about log10(2)
#define USHORT_DECIMAL_BUFN ((size_t) (sizeof(unsigned short)*CHAR_BIT*0.302) + 3)
#define INT_DECIMAL_BUFN    ((size_t) (sizeof(int)           *CHAR_BIT*0.302) + 3)
#define INTMAX_DECIMAL_BUFN ((size_t) (sizeof(intmax_t)      *CHAR_BIT*0.302) + 3)

int main() {
    char usbuffer[USHORT_DECIMAL_BUFN];
    sprintf(usbuffer, "%hu", USHRT_MAX);
    printf("Size:%zu Len:%zu %s\n", sizeof(usbuffer), strlen(usbuffer), usbuffer);

    char ibuffer[INT_DECIMAL_BUFN];
    sprintf(ibuffer, "%d", INT_MIN);
    printf("Size:%zu Len:%zu %s\n", sizeof(ibuffer), strlen(ibuffer), ibuffer);

    char imbuffer[INTMAX_DECIMAL_BUFN];
    sprintf(imbuffer, "%" PRIdMAX, INTMAX_MIN);
    printf("Size:%zu Len:%zu %s\n", sizeof(imbuffer), strlen(imbuffer), imbuffer);
    return 0;
}

Size:7 Len:5 65535
Size:12 Len:11 -2147483648
Size:22 Len:20 -9223372036854775808

所以问题是:
1 替代方程有问题吗?
2 有什么更好的解决办法? - 因为这个替代方案有点浪费,而且看起来过于复杂。

[编辑答案]

答案提供了 3 种深思熟虑的方法:
1 使用缓冲区[类型的最大大小](已选择答案)
2 asprintf()
3 snprintf()

1 使用等式 (sizeof(integer_type)*CHAR_BIT*0.302) + 3 的编译时最大缓冲区大小没有损坏也没有改进。 <locale.h>的影响|按照@paddy 的建议进行了研究,没有区域设置影响整数转换%d %x %u %i .我们发现,如果已知类型是有符号或无符号的(如下),则可以对等式进行轻微改进。 @paddy 关于“更保守”的警告是个好建议。

2 asprintf()确实是一个很好的通用解决方案,但不可移植。也许在 C11 之后?

3 snprintf() ,虽然是标准的,但在提供的缓冲区过小时存在已知的一致实现问题。这意味着使用超大缓冲区调用它,然后生成一个大小合适的缓冲区。 @jxh 建议使用线程安全的全局暂存缓冲区,以使用本地大小合适的缓冲区来形成答案。这种新颖的方法值得考虑,我可能会使用它,但最初的问题更侧重于在 s(n)printf() 之前确定调用保守的缓冲区大小。

signed ((sizeof(integer_type)*CHAR_BIT-1)*0.302) + 3
unsigned (sizeof(integer_type)*CHAR_BIT*0.302) + 2
*28/93可以用来代替 *0.302 .

最佳答案

我觉得不错。您已将小数点四舍五入,为负号和空值添加了一个额外的字符,并为良好的度量添加了一个额外的字符。如果您不使用 <locale.h> 中的功能,我认为您不必担心数字会变长。 .

我的问题是你打算用这些做什么。您是简单地在堆栈上构建它们,还是将大量它们放入内存?

对于堆栈上的临时数组,您通常不会为几个字节而大惊小怪,因为它不太可能影响缓存性能。它肯定不会耗尽您的内存力。

如果您打算存储大量此类数据,则可能需要考虑池化。但是,您需要考虑池的内存开销。池的本质意味着您保留的内存多于您将要使用的内存。如果编译 64 位,你的指针是 8 个字节。如果您的大多数数字都是 4 个字符长,那么 8 字节指针加上每个数字的 5 字节存储空间将抵消任何可能的好处,64 位数字可能除外。

这些只是我的思考过程。在我看来,你已经很好地减少了脂肪。我倾向于更保守一点,但这可能主要是偏执狂。保持简单通常是要走的路,而过度思考可能是一个陷阱。如果您考虑过度,请考虑原因,并确定它是否是一个真正需要考虑太多的问题。

关于c - 如何改进 printf 各种整数类型的缓冲区大小确定?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18708679/

相关文章:

c - fgets 和 fsetpos 负指针?

c - 如何用c语言编写一个简单的程序来将克转换为毫克,反之亦然

database - 多种货币-存储什么以及何时转换?

C# : Seconds to Minutes to Hours conversion?

annotations - 将 Yolov5 bbox 导出为 Pascal 格式

c - 使用指针获取 3D 数组元素的总和

c 程序计算系统内存使用量?

c - 强制程序使用输入字符串调用 C 函数

c++ - 在键上使用 gpg --list-packets 的输出来获取 mpi 值以生成 s 表达式

C# 16 位浮点转换