这可能是一个广泛的答案,但我希望看到答案并与SO用户讨论此主题。
到目前为止,我猜一个音频文件(WAV)的采样率可能是44000或48000(我看过这2个中的大多数),从中我们可以确定将一个Second插入一个File(第二个00:00:01 )正好有44000个整数值,这意味着这里我们有一个Int[]
,因此,如果音频文件持续时间为5秒,则它具有5 * 44000个整数(或5个样本)。
所以我的问题是,我们如何才能计算两个时间跨度(如Audio1.wav和Audio2.wav在00:00:01时具有相同采样率)之间内容的差异(或相似性)。
最佳答案
您的推理有两个假设:
1.文件是原始未压缩(PCM编码)数据。
2.只有一个 channel (单声道)。
最好先阅读一些format descriptions和sample implementations,然后搜索一些音频比较算法(1, 2 ,3)。
链接的Q:Compare two spectogram to find the offset where they match algorithm
关于c# - 计算两个时间跨度DSP之间的差,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7899753/