java - 如何解释音频字节？

我想编写一个语音压力分析工具。我正在打开音频流进行阅读:

TargetDataLine line;
AudioFormat format = new AudioFormat((float) 44100, 16, 1, true, false);
DataLine.Info info = new DataLine.Info(TargetDataLine.class, format);
line = (TargetDataLine) AudioSystem.getLine(info);
line.open(format);
// Begin audio capture.
line.start();

然后循环:

// Read the next chunk of data from the TargetDataLine.
numBytesRead = line.read(externalData, 0, externalData.length);

我得到一个包含字节的数组，因为 externalData 定义如下:

public static byte[] externalData = new byte[1024];

我想知道的是如何解释这些数据？我尝试按字节值绘制它，但我猜这是错误的。 Plotted bytes

X轴是时间，Y轴是字节值。

PS:在哪里可以找到有关 McQuiston-Ford 算法的更多信息？

最佳答案

您需要将字节转换为幅度并绘制它们。有关如何打点的问题，请参阅此问题:Obtain wave pattern of a audio file in Java

至于算法，维基百科说它是伪科学，我怀疑公共(public)领域不会有太多关于它的内容。

关于java - 如何解释音频字节？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13210894/

上一篇：java - 如何在 Java 中为票证打印机提供格式和打印数据

下一篇：java - 不同用户登录时静态变量的行为

相关文章：

java - 为什么要重写接口(interface)方法？

java - gwt 503 服务 20 分钟后暂时不可用

audio - 如何自动从PRAAT的.wav文件中提取音高范围并将其全部放入.csv文件中？

iphone - iOS Advanced Audio API 解压格式

machine-learning - FFT 和音乐比较

audio - 无需语音识别即可检测多个声音

javascript - WinJS 中的音频分析

java - IntelliJ 中的 Spring 项目中的 gradle 存在 java 版本控制问题

java 分割后字符串的最大值

java - 如何在 commons-exec 下从 Java 中启动 VI？