.net - 如何使用.net比较两个音轨的波形？

标签 .net audio wav waveform phonetics

我尝试编写一个可以测试用户发音的程序。

该程序将播放波形声音，说一个英语句子，然后用户将尝试发音并记录其声音，然后程序将检查该波形的相似性并指出用户的发音。

问题是，是否可以使用.net编写此程序？如果可以，我可以使用哪些库？有入门指南吗？

最佳答案

音乐识别程序通常在频谱域中表示声音(以捕获音高)。

根据某些频谱表示，可以使用距离度量(欧几里得或其他)。

对于语音，时间维度是必要的。

在空间域中，考虑时间变形(慢速与快速)的翘曲措施似乎也是一个不错的选择。

模板匹配算法可能像OCR算法一样都是不错的选择，但是现在您将要处理声波问题。

声波算法通常考虑的是滑动窗口或分段。

关于.net - 如何使用.net比较两个音轨的波形？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17732218/

上一篇：elasticsearch - 在聚合中使用inner_hits

下一篇：powershell - Azure 自动化错误 'DynamicActivity' : Expected an input parameter value of type

相关文章：

.net - 几个大的或许多小的 dll

.net - 如何在 ASP.NET MVC 中获取当前虚拟路径？

c# - 有谁知道 System 或 System.Core 中比较运算符的 .NET 枚举？

windows - 计算机上所有音频的实时均衡器

algorithm - AMR 中的静音检测

java - 在java中计算实时音频

audio - .WAV 音频的一个字节是多少毫秒？

.net - 使用 SVN 时如何忽略 .NET 数据集定义 (XSD) 中属性顺序的变化？

delphi - 如何从声卡录制任何东西？

matlab - 如何使用Matlab从单声道wav文件中获取频率和音调？