java - Java 中的文件流

标签 java streaming random-access

我目前正在使用JOGL(Java OpenGL 绑定(bind))开发3D 图形应用程序。简而言之,我有一个巨大的景观二进制文件。由于其大小,我必须在运行时传输地形 block 。因此,我们明确地看到了随机访问问题。我已经完成了第一个(肮脏的:))实现(也许它是多线程的),我使用了一种愚蠢的方法......这是它的初始化:

dataInputStream = new DataInputStream(new BufferedInputStream(fileInputStream,4 * 1024);
dataInputStream.mark(dataInputStream.available());

当我需要读取(流)特殊 block (我已经知道它在文件中的“偏移量”)时,我正在执行以下操作(为我感到羞耻:)):

dataInputStream.reset();
dataInputStream.skipBytes(offset);
dataInputStream.read(whatever I need...);

由于我经验很少,所以这是我首先想到的:) 所以,到目前为止,我已经阅读了 3 篇有用且非常有趣的文章(我建议您阅读它们,也许如果您对此主题感兴趣的话)

  1. Byte Buffers and Non-Heap Memory - Gregory 先生似乎精通 Java NIO。

  2. Java 技巧:如何快速读取文件 [http://nadeausoftware.com/articles/2008/02/java_tip_how_read_files_quickly] - 这是一个有趣的基准。

    <
  3. 文章:调整 Java I/O 性能 [http://java.sun.com/developer/technicalArticles/Programming/PerfTuning/] - 简单的 Sun 建议,但请向下滚动并查看那里的“随机访问”部分;他们展示了具有自缓冲改进的 RandomAccessFile (RAF) 的简单实现。

先生。 Gregory 在文章末尾提供了几个 *.java 文件。其中之一是 FileChannel + ByteBuffer + Mapping (FBM) 和 RAF 之间的基准测试。他说,与 RAF 相比,他注意到使用 FBM 时速度提高了 4 倍。我在以下条件下运行了此基准测试:

  1. 偏移量(例如访问位置)是随机生成的(在文件范围内,例如 0 - file.length());
  2. 文件大小为 220MB;
  3. 1 000 000 次访问(75% 读取和 25% 写入)

结果令人震惊:

~ 英国皇家空军 28 秒! FBM 约 0.2 秒!

但是,他在这个基准测试中的 RAF 实现没有自缓冲(第 3 篇文章介绍了一个),所以我猜是“RandomAccessFile.seek”方法调用导致性能下降如此严重。

好吧,在我学到了所有这些东西之后,现在有 1 个问题和 1 个困境:)

问题:当我们使用“FileChannel.map”映射文件时,Java 是否会将整个文件内容复制到 MappedByteBuffer 中?或者它只是模仿它?如果它复制,那么使用 FBM 方法不适合我的情况,是吗?

困境:取决于您对问题的回答...

  1. 如果映射复制文件,那么似乎我只有 2 个可能的解决方案:RAF + 自缓冲(第 3 篇文章中的一个)或 ma​​ke在 FileChannel 中使用位置(不使用映射)...哪一个更好?

  2. 如果映射不复制文件,那么我有 3 个选项:之前的两个选项和 FBM 本身

编辑:还有一个问题。这里有些人说映射不会将文件复制到 MappedByteBuffer 中。好吧,为什么我不能映射 1GB 文件,我收到“映射失败”消息...

P。 S.我希望收到一个完整的答案和建议,因为我无法在互联网上找到有关此主题的一致信息。

谢谢:)

最佳答案

不,数据没有被缓冲。 MappedByteBuffer 使用pointer 引用数据。 。换句话说,数据没有被复制,它只是映射到物理内存中。请参阅API docs如果您还没有的话。

A memory-mapped file is a segment of virtual memory which has been assigned a direct byte-for-byte correlation with some portion of a file or file-like resource. This resource is typically a file that is physically present on-disk, but can also be a device, shared memory object, or other resource that the operating system can reference through a file descriptor. Once present, this correlation between the file and the memory space permits applications to treat the mapped portion as if it were primary memory.

来源:Wikipedia

如果您要经常读取数据,那么至少缓存其中一些数据是个好主意。

关于java - Java 中的文件流,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19793243/

相关文章:

java - 获取文本文件中行的字节偏移量?

java - 如何从java中的字符串中提取多个正则表达式匹配

java - RMI 转 HTTP 协议(protocol)

java - 在 Android 运行时将字符串编译为代码

video - 流式传输 RTP/RTSP : sync/timestamp problems

读取 PDPage 时出现 java.io.IOException : RandomAccessBuffer already closed,

java - 可以以及如何将 RandomAccessFile 与 FTP 服务器上包含的文件一起使用?

c++ - 如何创建简单的带有 boost 的 HTTP 服务器,能够接收数据编辑和共享?

audio - 为 Web 和移动 Web 构建自适应音频流

java - 是否可以将随机访问文件中的特定字节设置回空?