java - 高效的数据传输机制

标签 java performance file-io data-transfer

我正在开发一个 Java 类,用于将数据从任何输入流传输到任何输出流(主要用于在线使用,但具有更广泛的实用程序)。

浏览 Java 7 API 规范后,我注意到 FileChannel 类中的两个方法:transferFrom(...)transferTo

我围绕这些方法开发了我的类,并创建了以下 transmit() 方法:

public void transmit() throws IOException {
    File tmp = File.createTempFile("transmit", ".tmp");
    RandomAccessFile raf = new RandomAccessFile(tmp, "rw");
    FileChannel fc = raf.getChannel();
    fc.force(true);
    fc.transferFrom(Channels.newChannel(src), 0, Long.MAX_VALUE);
    raf.seek(0);
    fc.transferTo(0, Long.MAX_VALUE, Channels.newChannel(dst));
    raf.close();
}

然后我决定通过以下测试对其进行一些测试(第一个版本没有使用临时字节数组,并且正如预期的那样,比 transmit() 方法更糟糕):

public static void main(String[] args) throws IOException {
    File from = File.createTempFile("source", ".tmp");
    File to = File.createTempFile("destination", ".tmp");

    FileOutputStream tmp = new FileOutputStream(from);

    for (int i = 0; i < (1 << 20); i++) {
        tmp.write(0);
    }

    tmp.close();

    FileInputStream fin = new FileInputStream(from);
    FileOutputStream fout = new FileOutputStream(to);

    DataTransmitter dt = new DataTransmitter(fin, fout);

    long time_1 = new Date().getTime();
    dt.transmit();
    time_1 = new Date().getTime() - time_1;

    fin.close();
    fout.close();

    to.delete();

    fin = new FileInputStream(from);
    fout = new FileOutputStream(to);


    int len;
    byte[] b = new byte[8192];
    long time_2 = new Date().getTime();
    while ((len = fin.read(b)) >= 0) {
        fout.write(b, 0, len);
    }
    time_2 = new Date().getTime() - time_2;

    fin.close();
    fout.close();

    System.out.format("Transmitter method: %s milliseconds%n", time_1);
    System.out.format("Direct method: %s milliseconds%n", time_2);
}

对于位于本地硬盘驱动器中的文件,所谓的“直接方法”速度相当快(transmit() 方法为 192 毫秒,“直接方法”为 8 毫秒),这意味着与 transmit() 方法相比,“直接方法”效率很高。

但是,由于此类的目的是从在线源下载文件,因此我创建了一个 40 Mb 文件,并将其上传到个人云,并且(通过与上述类似的方法)得到了以下结果:

Transmitter method: 126478 milliseconds
Direct method (8192 bytes): 134105 milliseconds

这意味着来自在线源的 transmit() 方法更加高效。

我想知道这些结果是否准确(因为这些方法取决于系统,我声明我正在运行 Ubuntu 13.10),如果准确,我如何找到一种方法来优化 transmit()一般情况的方法。

如果有更有效的替代方法,如果有人陈述它们,我也将不胜感激(不需要代码,只需对该方法的解释,也许是它更有效的原因)。

最佳答案

不要编写自己的数据传输代码,除非您有非常具体的理由这样做。有很多数据传输java库:IOUtilsApache Mina 的某些部分等等。您不应该重新发明轮子,除非您想为学校项目做这件事,或者您发现现有解决方案存在弱点并希望改进。

此外,说到不好的做法,您不应该使用 java 的 Date,而应该使用更理智的 Date 功能,例如 Joda's DateTime并且您不应该打开/关闭自己的流,而是使用为您执行此操作的库或使用 Java 7 的 Closabletry-with-resources声明。

编辑: 您在示例中所做的另一个不好的做法是使用 java.util.Date 来获取当前时间。这在两个层面上都是错误的:代码可读性和线程安全性。

对于代码可读性部分:您想要做的是“给我当前时间”,您可以通过System.getCurrentTimeMillis()清楚地做到这一点。你实际上在做的是:

'allocate a semi-deprecated object, don't specify timezone or locale (which might change from the first call to the second call), don't be thread-safe, and give me its current time so I can use it as my current time'

。当您可以轻松避免时创建两个额外的对象并不是什么大问题,但是由于存在一种为您提供当前时间的方法,并且它更有效,因此您应该使用它,否则您正在开发不好的做法。

对于线程安全部分,你可以阅读以下内容: How to make Java.util.Date thread-safe

仅使用 java.util.Date 的代码本质上容易出错,因此您不应该使用它。在这个例子中,这似乎没什么大不了的,但如果您正在发展自己作为一名软件工程师,细节就很重要。此外,您不应该编写自己的数据传输方法,除非您知道现有方法有什么问题并且想要改进它,或者您这样做是为了家庭作业或学习。

关于java - 高效的数据传输机制,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20915311/

相关文章:

c# - 从代码生成映射 View - EF6

javascript - 使用 for..in 循环访问 JSON 数据

javascript - 查找 DOM 中稍后出现的下一个元素

java - @DataJpaTest 中的存储库初始化为 null

java - 如何阻止构造函数在派生类中尝试使用私有(private)但不起作用的java继承中覆盖

java - 将字符串添加到字符串数组

Python xlrd.书籍 : how to close the files?

python - 将 np.savetxt 和 np.loadtxt 与多维数组一起使用

asp.net - 中等信任文件 I/O 权限

java - 尝试创建 SQL 数据库时没有合适的驱动程序