java - 从文本文件中读取一大行字符串

标签 java string memory-leaks io

我有一个很大的文本文件,但没有任何换行符。它只包含一个长字符串(一大行字符串和所有 ASCII 字符),但到目前为止一切正常,因为我可以用 Java 将整行读入内存,但我想知道是否有内存泄漏问题,因为文件变得像 5GB+ 一样大,并且程序无法一次将整个文件读入内存,所以在这种情况下,读取此类文件的最佳方法是什么?我们可以将这条巨大的线分成两部分甚至多个 block 吗?

这是我读取文件的方式

   BufferedReader buf = new BufferedReader(new FileReader("input.txt"));
   String line;
   while((line = buf.readLine()) != null){

   }

最佳答案

单个字符串只能有 20 亿个字符长,每个字符将使用 2 个字节,因此如果您可以读取 5 GB 的行,它将使用 10 GB 的内存。

我建议您分块阅读文本。

Reader reader = new FileReader("input.txt");
try {
    char[] chars = new char[8192];
    for(int len; (len = reader.read(chars)) > 0;) {
        // process chars.
    }
} finally {
    reader.close();
}

无论文件大小,这将使用大约 16 KB。

关于java - 从文本文件中读取一大行字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13569728/

相关文章:

java - 如何将 DefaultTableModel 对象的数据放入 DefaultTableModel 的子类中

java - 无法在 Apache Jena 生成的 XML 中显示 UTF-8 编码

string - 字符串范围和 rune slice 范围之间有什么区别吗?

java - 预初始化工作线程池以重用连接对象(套接字)

java - 逆变转换 Guava 谓词

sql - 字符串比较的意外结果

c - 在 C 中回显客户端服务器 - 我有一个开放的服务器,它从不同的客户端获取字符串 - 我如何在新的迭代中替换旧的 char[]

ios - 存储在 CGImageRef 中的对象的潜在泄漏

c++ - Visual Studio (VC++ 2005) 调试内存

ios - Swift 3 CGContext 内存泄漏