java - 有效地将最后一个字符附加到 StringBuilder

标签 java stringbuilder

注意:这个问题是关于 Java >= 9 的,它引入了 "compact strings"


假设我正在将未知数量的字符串(或字符)附加到 StringBuilder 并且在某个时候确定我正在附加最后一个字符串。

如何有效地完成这项工作?

背景

如果字符串构建器的容量不够大,它总是会增加到 max(oldCap + str.lenght(), oldCap * 2 + 2)。所以如果你运气不好,最后一个字符串的容量不够,它会不必要地加倍容量,例如:

StringBuilder sb = new StringBuilder(4000);
sb.append("aaa..."); // 4000 * "a"
// Last string:
sb.append("b"); // Unnecessarily increases capacity from 4000 to 8002
return sb.toString();

StringBuilder 提供方法 capacity()length()getChars(...),然而,手动创建一个 char[] 然后创建一个字符串将是低效的,因为:

  • 由于“压缩字符串”,字符串生成器必须将其字节转换为字符
  • 当调用其中一个 String 构造函数时,字符必须再次压缩为字节

另一种选择是检查 capacity() 并在必要时创建一个 new StringBuilder(sb.length() + str.length()),然后附加 sbstr:

StringBuilder sb = new StringBuilder(4000);
sb.append("aaa..."); // 4000 * "a"

String str = "b";
if (sb.capacity() - sb.length() < str.length()) {
    return new StringBuilder(sb.length() + str.length())
        .append(sb)
        .append(str)
        .toString();
}
else {
    return sb.append(str).toString();
}

唯一的缺点是,如果现有的字符串构建器或新字符串是非拉丁语 1(每个字符 2 个字节),则新创建的字符串构建器必须从每个字符 1 个字节(拉丁语 1)“膨胀”到每个字符 2 个字节。

最佳答案

您在 IMO 中描述了不同的问题,但它们都不是“实际”问题。

首先,StringBuilder 分配了太多空间这一事实 - 这在实践中很少(如果有的话)成为问题。想想任何 List/Set/Map - 它们做同样的事情,可能分配太多,但是当你删除一个元素时,它们不会'收缩他们的内部存储。他们确实有一个方法;但 StringBuilder 也是如此:

 trimToSize

Due to "compact strings" the string builder has to convert its bytes to chars.

StringBuilder 知道它通过它扩展的 AbstractStringBuilder 中的 coder 字段存储什么。使用紧凑的字符串,String 现在将其数据保存在 byte[] 中(它也有一个 coder),因此我不明白在哪里从 byte[]char[] 的转换应该发生。 StringBuilder::toString 定义为:

public String toString() {
    // Create a copy, don't share the array
    return isLatin1() ? StringLatin1.newString(value, 0, count)
                      : StringUTF16.newString(value, 0, count);
}

注意 isLatin1 检查 - StringBuilder 知道它内部有什么类型的数据;因此尽可能不进行转换。

我假设:

When calling one of the String constructors the chars have to be compacted to bytes again

你的意思是:

char [] some = ...
String s = new String(some);

我不知道你为什么在这里使用 again ,但可能是我遗漏了什么。请注意,从 char[]byte[] 的这种转换确实必须发生,但它相当微不足道(最后 8 位必须为空),并且一旦单个 char 不满足前提条件,整个转换就会被放弃。因此,您要么将所有 字符存储在LATIN1 中,要么不存储。

关于java - 有效地将最后一个字符附加到 StringBuilder,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58672391/

相关文章:

java - 这个方法必须返回int类型的结果吗?法克尔游戏

java - 如何从docker容器内的输入文件读取

c# - StringBuilder 中最快的搜索方法

.net - "Don' t 在这个热代码路径中使用 StringBuilder 或 foreach”

java - 使用 JsonArray 和 HashMap 解析 JSON

Java 解析输出的消息

java - 在 JTable 中有多个具有不同值的 JComboBox

c# - 循环添加到 StringBuilder 的字符串

java - 为什么我们需要将 toString 方法与 stringbuilder 一起使用

java - 字符串连接,然后在循环中附加