java - 在 Java 中对大文件执行 "File to byte[]"时出现 OutOfMemoryError 错误?

标签 java arrays file heap-memory

我尝试了各种代码将大型 CSV 文件(~300 MB)转换为 byte[],但每次都失败,给出 Java 堆空间错误,如下所示:

184898 [jobLauncherTaskExecutor-1] DEBUG org.springframework.batch.core.step.tasklet.TaskletStep - Rollback for Error: java.lang.OutOfMemoryError: Java heap space 185000 [jobLauncherTaskExecutor-1] DEBUG - Initiating transaction rollback on application exception java.lang.OutOfMemoryError: Java heap space at java.util.Arrays.copyOf( at java.lang.AbstractStringBuilder.expandCapacity( at java.lang.AbstractStringBuilder.ensureCapacityInternal( at java.lang.AbstractStringBuilder.append( at java.lang.StringBuffer.append( at org.apache.log4j.helpers.PatternParser$LiteralPatternConverter.format( at org.apache.log4j.PatternLayout.format( at org.apache.log4j.WriterAppender.subAppend( at org.apache.log4j.WriterAppender.append( at org.apache.log4j.AppenderSkeleton.doAppend( at org.apache.log4j.helpers.AppenderAttachableImpl.appendLoopOnAppenders( at org.apache.log4j.Category.callAppenders( at org.apache.log4j.Category.forcedLog( at org.apache.log4j.Category.log( at org.slf4j.impl.Log4jLoggerAdapter.log( at org.apache.commons.logging.impl.SLF4JLocationAwareLog.debug( at org.apache.http.impl.conn.Wire.wire( at org.apache.http.impl.conn.Wire.output( at org.apache.http.impl.conn.LoggingSessionOutputBuffer.write( at at org.apache.http.entity.ByteArrayEntity.writeTo( at org.apache.http.entity.HttpEntityWrapper.writeTo( at org.apache.http.impl.client.EntityEnclosingRequestWrapper$EntityWrapper.writeTo( at org.apache.http.impl.entity.EntitySerializer.serialize( at org.apache.http.impl.AbstractHttpClientConnection.sendRequestEntity( at org.apache.http.impl.conn.AbstractClientConnAdapter.sendRequestEntity( at org.apache.http.protocol.HttpRequestExecutor.doSendRequest( at org.apache.http.protocol.HttpRequestExecutor.execute( at org.apache.http.impl.client.DefaultRequestDirector.tryExecute( at org.apache.http.impl.client.DefaultRequestDirector.execute( at org.apache.http.impl.client.AbstractHttpClient.execute( at org.apache.http.impl.client.AbstractHttpClient.execute(

到目前为止,我已尝试使用以下版本的代码来将文件转换为 byte[]:

版本 1:核心 Java

    File file = new File(fileName);
    FileInputStream fin = null;
    byte fileContent[] = null;

    try {
        fin = new FileInputStream(file);

        fileContent = new byte[(int) file.length()];;

    } catch (FileNotFoundException e) {
        System.out.println("File not found" + e);
    } catch (IOException ioe) {
        System.out.println("Exception while reading file " + ioe);
    } finally {
        try {
            if (fin != null) {
        } catch (IOException ioe) {
            System.out.println("Error while closing stream: " + ioe);

    return fileContent;

版本 2:Java 7 NIO

    Path path = Paths.get(fileName);

    byte[] data = null;

    try {
        data = Files.readAllBytes(path);
    } catch (IOException e) {

    return data;

版本 3:Apache Commons IO

    File file = new File(fileName);
    FileInputStream fis = null;
    byte fileContent[] = null;

    try {
        fis = new FileInputStream(file);

        fileContent = IOUtils.toByteArray(fis);

    } catch (FileNotFoundException e) {
        System.out.println("File not found" + e);
    } catch (IOException ioe) {
        System.out.println("Exception while reading file " + ioe);
    } finally {
        try {
            if (fis != null) {
        } catch (IOException ioe) {
            System.out.println("Error while closing stream: " + ioe);

    return fileContent;

版本 4:Google Guava

    File file = new File(fileName);
    FileInputStream fis = null;
    byte fileContent[] = null;

    try {
        fis = new FileInputStream(file);

        fileContent = ByteStreams.toByteArray(fis);

    } catch (FileNotFoundException e) {
        System.out.println("File not found" + e);
    } catch (IOException ioe) {
        System.out.println("Exception while reading file " + ioe);
    } finally {
        try {
            if (fis != null) {
        } catch (IOException ioe) {
            System.out.println("Error while closing stream: " + ioe);

    return fileContent;


File file = new File(fileName);

byte fileContent[] = null;

try {

    fileContent =;

} catch (FileNotFoundException e) {
    System.out.println("File not found" + e);
} catch (IOException ioe) {
    System.out.println("Exception while reading file " + ioe);

return fileContent;

我什至将堆空间设置得相当大。我的外部 Tomcat 大约有 6 GB (5,617,772 K),如任务管理器中的内存消耗所示。

对于前三个版本的代码,在命中此 byte[] 生成代码时,堆空间突然增加到 5 GB 以上,然后失败。对于 Google Guava,它看起来非常有前途,在命中 byte[] 生成代码后,内存消耗在相当长的一段时间内保持在 3.5 GB 左右,例如大约 10 分钟,然后突然跳到 5 GB 以上并失败。



加载到字节数组时,300MB 的文件不会消耗 6GB 的堆。仔细观察你的堆栈跟踪,似乎加载部分完全没问题。仅当您尝试使用 Log4j 记录某些内容时,才会抛出“java.lang.OutOfMemoryError:Java 堆空间”。

日志记录似乎源自第 3 方代码而不是您自己的代码,因此您可能无法更改正在记录的内容,但您绝对可以通过 Log4j 配置减少日志记录,尝试增加 org.apache.* 的日志级别(到 WARN、ERROR 或 FATAL),然后就可以了。

关于java - 在 Java 中对大文件执行 "File to byte[]"时出现 OutOfMemoryError 错误?,我们在Stack Overflow上找到一个类似的问题:


java - 本地运行的 DynamoDb 的默认预配置吞吐量(读取和写入容量单位)是多少?

python - Numpy "double"-广播 - 有可能吗?

python - 通过 Python 创建文件和目录

c++ - C++ 检查文件是否存在

python - 通过python快速按字母顺序排列大文件

java - 如何用字符串编译不同的模式?

java - 一种检查 servlet 是否已经在处理的方法 - j2ee?

java - Maven 构建错误

c++ - 初始化十二面体数组

python - 切片 numpy 数组以使其具有所需的形状