python - PocketSphinx python 和设置声学模型？

我正在 speech recognition 阅读本指南，它提到我需要三个项目来进行语音识别:声学模型、语言模型、语音词典。

我想开始玩这个 python demo ，它使用 Gstreamer 从麦克风中捕获并重新采样为 8kHz、16 位 PCM 音频。

我看到可以指定语言模型和语音词典，我用的是【cmu提供的】:

http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Language%20Model/

但是我很困惑应该在哪里指定声学模型？ gstreamer 是否有我隐式使用的自己的声学模型？我希望使用此处提供的声学模型以获得更好的结果:

 http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Acoustic%20Model/

(对超链接感到抱歉。我不能发布超过 2 个代表少于 10 的链接)

最佳答案

But I am confused where I should specify the acoustic model?

您可以使用 gstreamer 元素的 hmm 属性指定模型。就像教程中介绍的一样

asr.set_property('lm', '/home/user/mylanguagemodel.lm')

你可以使用

asr.set_property('hmm', '/home/user/acoustic_model_folder')

Does gstreamer have its own acoustic model I'm implicitly using?

是的，默认情况下它使用来自发行版的美国英语模型 hub4wsj_sc_8k

关于python - PocketSphinx python 和设置声学模型？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13653379/