java - 如何混合来自 DatagramPackets 的多个实时语音音频流?

标签 java android udp

我正在从事一个项目,我想在其中添加 一键通 功能和 我有 android 作为客户端和 java 作为我的服务器。我所做的是将 bytesAudioRecord 发送到我的服务器并将其广播回连接的客户端。

混合来自同时发送的不同客户端的 data 时我的问题出在哪里。

这是我在服务器上尝试过的:

static boolean status = true;
static int port = 1938;
static byte[] mixed_audio;
static byte[][] all_bytes;
static int client_count = 0;
static DatagramSocket socket;
static ArrayList<InetAddress> addresses;
public static void main(String args[]) throws Exception {

    DatagramSocket serverSocket = new DatagramSocket(port);    
    System.out.println("Listening. . .");    
    addresses = new ArrayList<>();

    for(int x = 0; x < args.length; x++){
        if(args[x].equals("-p")){
            port = Integer.parseInt(args[x+1]);
        }
    }

    byte[] receiveData = new byte[1400];

    DatagramPacket receivePacket = new DatagramPacket(receiveData,
            receiveData.length);

    socket = new DatagramSocket();

    while (status == true) {
        all_bytes = new byte[1400][1400];
        mixed_audio = new byte[1400];
        serverSocket.receive(receivePacket);        
        int a = addresses.indexOf(receivePacket.getAddress());
        if(a < 0 ){
            addresses.add(receivePacket.getAddress());            
        }
        client_count++;        
        all_bytes[client_count] = receivePacket.getData();
       new Thread(new ReceiveData(receivePacket.getData(), receivePacket.getAddress())).start();

    }
}

public static class ReceiveData implements Runnable{

    byte[] data;
    InetAddress address;

    public ReceiveData(byte[]  b, InetAddress address){
        this.data = b;
        this.address = address;
    }

    @Override
    public void run() {

        try {
            for(int i = 0; i < 1400; i++){
                for(int j = 0; j < 1400; j++){
                    mixed_audio[j] += all_bytes[i][j];
                }
            } 

            if(client_count > 1){
                int c=0;
                for(int x = 0; x < 1400; x++){
                    mixed_audio[x]  = (byte) (mixed_audio[x] / client_count + 1);
                }
            }else{
                mixed_audio = data;
            }
            client_count--;

            for(InetAddress add: addresses){

                if(add != address){
                    DatagramPacket packet;
                    packet = new DatagramPacket(mixed_audio, mixed_audio.length, add, port);
                    socket.send(packet);

                }

            }


        } catch (IOException ex) {
            //Logger.getLogger(TeraMix.class.getName()).log(Level.SEVERE, null, ex);
        }

    }

}

只有一个客户端说话时音频输出清晰,但多个客户端同时开始说话时音频输出变得很不清晰。

我还尝试了将我的算法用于混合音频,方法是在我的 PC 上的文件上使用它,并且效果很好。我需要的是混合不同客户端同时发送的数据包

我需要处理不同线程上的客户端吗?我做错了吗? 有没有更好的方法? 请指导我。谢谢!

最佳答案

我不知道你是否能够调试数据包是如何在那里合并的,但是从阅读中我会说问题是每个接收到的数据包都会产生它自己的线程,然后它将发送当前合并的数据包。

例如如果是三个客户端 A、B 和 C,分别发送数据包 1 和 2,则合并为:

  • A1 输入 -> A1 输出
  • B1 输入 -> B1,或者 A1+B1 输出
  • C1 输入 -> C1,或 B1+C1 甚至 A1+B1+C1 输出
  • A2 在 -> A2 或 C1+A2 或 ...
  • B2 在 -> B2 或 A2+B2 或 ...
  • C2 在 -> C2 或 B2+C2 或 ...

在这个简化的情况下,它会发送六个数据包,而不是理想的两个 - A1+B1+C1 和 A2+B2+B2?

显然,要使合并顺利进行,这将需要一些小心,尤其是因为我确信数据包不会完全同步到达 - 毕竟这是 UDP。

假设可以在“合并你拥有的数据包”的基础上工作,它可能只在你现在有所有当前客户端的数据包时触发发送线程,或者如果第二个数据包到达其中一个客户端,或者可能在采样率超时之后。

我猜这可能会冒着在接收线程和发送线程之间争用 all_bytes 的风险。一旦有足够的数据包进入,将当前的 all_bytes 传递给可运行的 ReceiveData 可能会更好,然后再启动一个新的来读取更多数据包。或者,如果内存/GC 开销可能是一个问题,至少循环数组。

关于java - 如何混合来自 DatagramPackets 的多个实时语音音频流?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49290258/

相关文章:

java - 无法对数组类型 char[] 调用 add(char)

使用多种颜色的android主题.xml

c++ - 如何在 C++ 中使用 winsock 接收 udp 数据包?

android - 您可以在不编写任何 native 代码的情况下访问智能手机上的蓝牙吗?

Java 不识别 Android XML 元素的 ID

c++ - 使用 C++ 将 UDP 数据包存储在结构中

c# - UDP 绑定(bind)方法

java - 对象在实例化后不做任何事情

java - 等待 JFrame 加载后再继续?

java - 使用 HashSet 字段解码响应实体的 Jersey 问题