当我调用这个方法时,我得到了一个 java outOfMemoryError - 我在一个循环中使用它来按顺序解析许多大文件。我的猜测是 result.toString()
在循环期间没有正确收集垃圾。如果是这样,我该如何解决?
private String matchHelper(String buffer, String regex, String method){
Pattern abbrev_p = Pattern.compile(regex);//norms U.S.A., B.S., PH.D, PH.D.
Matcher abbrev_matcher = abbrev_p.matcher(buffer);
StringBuffer result = new StringBuffer();
while (abbrev_matcher.find()){
abbrev_matcher.appendReplacement(result, abbrevHelper(abbrev_matcher));
}
abbrev_matcher.appendTail(result);
String tempResult = result.toString(); //ERROR OCCURS HERE
return tempResult;
}
最佳答案
这样写,文件中的每个字符大约需要 6 字节的内存。
每个字符是两个字节。您拥有原始输入、替代输出(在缓冲区中),并且在内存不足时请求第三份副本。
如果文件以类似 ASCII 或 ISO-8859-1(单字节字符编码)的方式编码,这意味着它在内存中的大小将是在磁盘中的六倍。
您可以为进程分配更多内存,但更好的解决方案可能是“流式”处理输入——读取、扫描和写入数据,而不是一次将所有数据加载到内存中。
关于java outOfMemoryError 与 stringbuilder,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2431040/