这是我的一个个人项目,我不知道从哪里开始,因为它远远超出了我的舒适区。
我知道有一些语言学习软件可以让用户记录他或她的声音并将发音与该语言的母语者进行比较。
我的问题是,如何实现这一目标?
我的意思是,如何比较用户和母语者的发音?
最佳答案
如果您正在寻找相对简单的东西,您可以简单地计算录音的 MFCC (http://en.wikipedia.org/wiki/Mel-frequency_cepstrum),然后查看一些简单的东西,例如录音和母语者发音的单词的平均系数。 MFCC 将音频转换成一个空间,其中欧氏距离与感知差异更紧密地对应。
当然,有几个可能的问题:
同样,最后,您要知道这些选项的哪种组合最有效的唯一方法是通过测试。
关于comparison - 如何比较单词的发音?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6318168/