我正在开发一个 Java 类,用于将数据从任何输入流传输到任何输出流(主要用于在线使用,但具有更广泛的实用程序)。
浏览 Java 7 API 规范后,我注意到 FileChannel
类中的两个方法:transferFrom(...)
和 transferTo
。
我围绕这些方法开发了我的类,并创建了以下 transmit()
方法:
public void transmit() throws IOException {
File tmp = File.createTempFile("transmit", ".tmp");
RandomAccessFile raf = new RandomAccessFile(tmp, "rw");
FileChannel fc = raf.getChannel();
fc.force(true);
fc.transferFrom(Channels.newChannel(src), 0, Long.MAX_VALUE);
raf.seek(0);
fc.transferTo(0, Long.MAX_VALUE, Channels.newChannel(dst));
raf.close();
}
然后我决定通过以下测试对其进行一些测试(第一个版本没有使用临时字节数组,并且正如预期的那样,比 transmit()
方法更糟糕):
public static void main(String[] args) throws IOException {
File from = File.createTempFile("source", ".tmp");
File to = File.createTempFile("destination", ".tmp");
FileOutputStream tmp = new FileOutputStream(from);
for (int i = 0; i < (1 << 20); i++) {
tmp.write(0);
}
tmp.close();
FileInputStream fin = new FileInputStream(from);
FileOutputStream fout = new FileOutputStream(to);
DataTransmitter dt = new DataTransmitter(fin, fout);
long time_1 = new Date().getTime();
dt.transmit();
time_1 = new Date().getTime() - time_1;
fin.close();
fout.close();
to.delete();
fin = new FileInputStream(from);
fout = new FileOutputStream(to);
int len;
byte[] b = new byte[8192];
long time_2 = new Date().getTime();
while ((len = fin.read(b)) >= 0) {
fout.write(b, 0, len);
}
time_2 = new Date().getTime() - time_2;
fin.close();
fout.close();
System.out.format("Transmitter method: %s milliseconds%n", time_1);
System.out.format("Direct method: %s milliseconds%n", time_2);
}
对于位于本地硬盘驱动器中的文件,所谓的“直接方法”速度相当快(transmit()
方法为 192 毫秒,“直接方法”为 8 毫秒),这意味着与 transmit()
方法相比,“直接方法”效率很高。
但是,由于此类的目的是从在线源下载文件,因此我创建了一个 40 Mb 文件,并将其上传到个人云,并且(通过与上述类似的方法)得到了以下结果:
Transmitter method: 126478 milliseconds
Direct method (8192 bytes): 134105 milliseconds
这意味着来自在线源的 transmit()
方法更加高效。
我想知道这些结果是否准确(因为这些方法取决于系统,我声明我正在运行 Ubuntu 13.10),如果准确,我如何找到一种方法来优化 transmit()
一般情况的方法。
如果有更有效的替代方法,如果有人陈述它们,我也将不胜感激(不需要代码,只需对该方法的解释,也许是它更有效的原因)。
最佳答案
不要编写自己的数据传输代码,除非您有非常具体的理由这样做。有很多数据传输java库:IOUtils , Apache Mina 的某些部分等等。您不应该重新发明轮子,除非您想为学校项目做这件事,或者您发现现有解决方案存在弱点并希望改进。
此外,说到不好的做法,您不应该使用 java 的 Date,而应该使用更理智的 Date 功能,例如 Joda's DateTime并且您不应该打开/关闭自己的流,而是使用为您执行此操作的库或使用 Java 7 的 Closable和 try-with-resources声明。
编辑: 您在示例中所做的另一个不好的做法是使用 java.util.Date 来获取当前时间。这在两个层面上都是错误的:代码可读性和线程安全性。
对于代码可读性部分:您想要做的是“给我当前时间”
,您可以通过System.getCurrentTimeMillis()
清楚地做到这一点。你实际上在做的是:
'allocate a semi-deprecated object, don't specify timezone or locale (which might change from the first call to the second call), don't be thread-safe, and give me its current time so I can use it as my current time'
。当您可以轻松避免时创建两个额外的对象并不是什么大问题,但是由于存在一种为您提供当前时间的方法,并且它更有效,因此您应该使用它,否则您正在开发不好的做法。
对于线程安全部分,你可以阅读以下内容: How to make Java.util.Date thread-safe
仅使用 java.util.Date 的代码本质上容易出错,因此您不应该使用它。在这个例子中,这似乎没什么大不了的,但如果您正在发展自己作为一名软件工程师,细节就很重要。此外,您不应该编写自己的数据传输方法,除非您知道现有方法有什么问题并且想要改进它,或者您这样做是为了家庭作业或学习。
关于java - 高效的数据传输机制,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20915311/