java - 使用阻塞 IO 的多线程会损坏 Java 中的文件

标签 java multithreading file client-server blocking

目标:- 使用 Java 中的阻塞 IO 构建多线程应用程序来下载文件。 请不要建议我使用非阻塞 IO,我被告知要使用这个。

问题:- 我的代码在下载服务器上托管的文件的客户端计算机上运行良好。但是,问题是我的服务器使用多个线程播种文件。在所有情况下,收到的文件的长度都是准确的,但是文件似乎已损坏。例如,当我下载 PDF 文件时,文件页面已写到最后一页(意味着所有页面都填充了原始内容的部分内容)。当我下载一首歌曲时,它会从头到尾爆发并伴随着这些噪音比特播放到最后。

问题 1 :- 我应该如何保持完美流畅的下载,以便文件正确播放/打开/读取?我应该在这里解决什么技术(例如多线程问题)?

我的代码:-

服务器多线程代码:::

import java.io.BufferedInputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStream;
public class FileServer extends UnicastRemoteObject implements FileServerInitialise{

private String file="";
public FileServer() throws RemoteException{
    super();
}

public void setFile(String f){
    file=f;
    //System.out.println("Length in setFile = "+f);
}

@Override
public boolean login(FileClientInitialise fci) throws RemoteException {
    try {
        InputStream is = new BufferedInputStream(new FileInputStream(file));
        long len = new File(file).length();
        System.out.println("Length of File = "+len);
        WorkerThread wt1=new WorkerThread(0,len/2,fci,is,file);
        wt1.setName("Worker Thread 1");
        WorkerThread wt2=new WorkerThread(len/2+1,2*len/2,fci,is,file);
        wt2.setName("Worker Thread 2");
        //WorkerThread wt3=new WorkerThread(2*len/4+1,3*len/4,fci,is,file);
        //wt3.setName("Worker Thread 3");
        //WorkerThread wt4=new WorkerThread(3*len/4+1,len,fci,is,file);
        //wt4.setName("Worker Thread 4");
        wt1.start();
        wt2.start();
        //wt3.start();
        //wt4.start();
        wt1.join();
        wt2.join();
        //wt3.join();
        //wt4.join();
        return true;
    }
        catch (InterruptedException iex) {          
        iex.getMessage();
        return false;
        } 

客户端下载代码::::

import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.RandomAccessFile;

public class FileClient implements FileClientInitialise {
public static int count = 1;
public static File f;
public static FileOutputStream fos;
public static RandomAccessFile raf;
public static long pointer;

public FileClient (String filename) throws RemoteException, IOException {
super();
FileClient.f= new File(filename);
FileClient.fos = new FileOutputStream(f, true);
//FileClient.raf= new RandomAccessFile(f,"rwd");
FileClient.pointer=0;
}

@Override
public boolean sendData(String filename, byte[] data, int len, String threadName) throws RemoteException{
try{

FileClient.fos.write(data,0,len);
FileClient.fos.flush();
//FileClient.raf.seek(FileClient.pointer);
//FileClient.raf.write(data,0, len);
//FileClient.pointer=raf.getFilePointer();
System.out.println("Done writing data...");
//fos.close();
return true;

}catch(Exception e){
e.getMessage();
return false;
}
}
}

问题 2:- 另外,我应该使用 RandomAccessFile 来实现相同的目的吗?会不会更好一些?我检查了一下,它运行速度非常慢(几乎慢了 10 倍)。而且,如果我要使用 RandomAccessFile,我应该为每个线程创建一个单独的对象吗?如果在这种情况下建议的话,我应该如何使用它?

如果代码不可能,请给我一个技术描述,代码不必在答案中提及。

最佳答案

正如其他人在评论中已经提到的那样,这是一种糟糕的方法,允许多个线程共享输入流并允许并发写入,从而导致文件损坏。

我在多线程分布式文件服务器项目中执行的一种方法是允许文件服务器的多线程执行,但仅允许顺序线程执行。

我以这样的方式进行编码,以确保线程以同步方式(仅一一方式)访问输入流。这也没有损坏客户端的文件。而且,这效果也太惊人了。

请注意,在对此答案采取任何操作之前:-

当时我对代码进行了基准测试,以确保我在这个答案中所说的内容对于访问者/搜索者来说确实是最佳的。我认为这是最佳情况,因为我有 4 个逻辑处理器(核心/CPU),这减少了多个线程的开销(尽管它们一次都工作 1 个)。

人们会认为这是最糟糕的方法,或者是一种丑陋的方法,等等。但我发现这对于文件服务器播种非常有帮助。我在 Linux 服务器 [Intel(R) Core(TM) 2 Duo CPU E4600 @ 2.40GHz 处理器,CPU:2] 上的 40 MB(大约)PDF 文件 在 4-5 次执行测试中,平均在 33-34 秒内复制到文件客户端。然而,当我增加线程数量(8-10 个线程)时,性能下降了大约 36-38 秒。当我使用单线程服务器时也是如此,在 45-50 秒内复制相同的文件。随着线程数的增加,性能有所提高,在4-6个线程范围内效率较高。

尽管如此,维护如此多的线程显然会产生开销,而且人们会认为单个线程可以获胜,但是,令人惊讶的是,在 4-6 个线程的情况下,结果是最佳的。

因此,我的建议是按照代码所示进行,通过 4-6 个线程执行输入流的顺序访问。这是最佳的,相信我,我也可以与其他人争论多线程开销,我发现在 4-6 个线程的情况下这是最佳的。

对于您的代码,我建议进行以下更改:-

InputStream is = new BufferedInputStream(new FileInputStream(file));
        long len = new File(file).length();
        System.out.println("Length of File = "+len);
        int numOFThreads=4;
        WorkerThread wt1=new WorkerThread(0,len/numOFThreads,fci,is,file);
        wt1.setName("Worker Thread 1");
        WorkerThread wt2=new WorkerThread(len/numOFThreads+1,2*len/numOFThreads,fci,is,file);
        wt2.setName("Worker Thread 2");
        WorkerThread wt3=new WorkerThread(2*len/numOFThreads+1,3*len/numOFThreads,fci,is,file);
        wt3.setName("Worker Thread 3");
        WorkerThread wt4=new WorkerThread(3*len/numOFThreads+1,4*len/numOFThreads,fci,is,file);
        wt4.setName("Worker Thread 4");
        wt1.start();
        wt1.join();
        wt2.start();
        wt2.join();
        wt3.start();
        wt3.join();
        wt4.start();
        wt4.join();

关于java - 使用阻塞 IO 的多线程会损坏 Java 中的文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30885037/

相关文章:

java - 如何从 GitHub 存储库中删除不正确的路径名?

java - 将jar转换为exe

c - `pthread_mutex_trylock` 和 `pthread_mutex_lock` 行为

c - 为什么我的程序 fork 函数没有按预期运行

java - Java 中存在错误的合并排序

java - 令人困惑的缩进,为什么以及如何发生

python - Scrapy 中使用代理的多线程

c# - 使用 BackgroundWorker 在 GUI 中更新两个(单个操作/总操作)进度条?

python - Python 2.7 中的错误文件描述符

c - 从 stdin 或 file 输入,C