虽然我最初在使 sphinx 4 工作时遇到一些问题,但现在它工作得很好。由于语法是有限的,无论是 JSGF 还是 N-Gram,我无法让 sphinx 识别每个可能的单词或句子。我想构建一些类似基于语音的谷歌搜索的东西。由于搜索可能有任何可能的单词或单词组合。将所有字典单词添加到语法中是很麻烦的。请帮忙。
最佳答案
不,这是不可能的。每个语音识别器(包括 Google 的语音识别器)都使用有限的词汇量。 Google 使用了大约 150 万个单词中的很大一部分,但仍然有限。所以CMUSphinx。您可以通过尝试识别罕见的专有名称来验证这一点,即使使用 Google 也几乎不可能。
实际的解决方案是使用具有大词汇量的大型语言模型。
这是一个开放的研究问题,用于检测音频流中的新单词并将其添加到带有语音或其他类型反馈的识别器中。
关于cmusphinx - sphinx 4 是否可以识别所有可能的单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18217070/