我陷入了一个大问题,因为我没有任何想法或示例该如何做。
我需要做的是比较两种声音,例如:
我需要在C#或C++中执行此操作。
我发现“Microsoft Speech API”和“合成工具包”将完全帮助完成我的任务,但我没有找到好的教程或方法。任何人都可以帮助完成这项任务
最佳答案
如果您只是在寻找可以帮助您解决此问题的库,请查看此页面。
http://en.wikipedia.org/wiki/List_of_speech_recognition_software
如果您的实际工作是从头开始创建语音识别代码,那么您将面临更加困难的工作。特别是因为有几种不同的路线可以走。不过,几乎所有这些工具都需要某种特征提取(例如,fft)。因此,请确保您已准备好信号处理方法。提取功能后,可以开始实现几种不同的方法。隐马尔可夫模型,神经网络(许多不同的种类..),互相关...
隐藏的Markov模型纸
http://mi.eng.cam.ac.uk/~mjfg/mjfg_NOW.pdf
关于audio - 语音认证,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29098180/