在哪里可以找到有关ARPA语言模型格式的文档?
我正在使用Pocket-Sphinx STT引擎开发简单的语音识别应用程序。出于性能考虑,建议在此处使用ARPA。
我想了解我可以做些什么来针对我的自定义需求调整语言模型。
我发现的只是一些非常简短的ARPA格式说明:
http://kered.org/blog/2008-08-12/arpa-language-model-file-format/
http://www.speech.sri.com/projects/srilm/manpages/ngram-format.5.html
http://www.speech.cs.cmu.edu/SLM/toolkit_documentation.html
我是STT的初学者,我很难将它包起来(n-gram等)。我正在寻找更详细的文档。类似于JSGF语法的文档在这里:
http://www.w3.org/TR/jsgf/
最佳答案
关于这些格式,实际上没有什么比这些文档中所说的更多的了。
此外,您可能需要准备一个带有示例句子和generate the language file based on it的文本文件。有一个可以为您完成的在线版本:lmtool
关于nlp - ARPA语言模型文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16408163/