cmusphinx - sphinx 4 是否可以识别所有可能的单词

标签 cmusphinx sphinx4

虽然我最初在使 sphinx 4 工作时遇到一些问题,但现在它工作得很好。由于语法是有限的,无论是 JSGF 还是 N-Gram,我无法让 sphinx 识别每个可能的单词或句子。我想构建一些类似基于语音的谷歌搜索的东西。由于搜索可能有任何可能的单词或单词组合。将所有字典单词添加到语法中是很麻烦的。请帮忙。

最佳答案

不,这是不可能的。每个语音识别器(包括 Google 的语音识别器)都使用有限的词汇量。 Google 使用了大约 150 万个单词中的很大一部分,但仍然有限。所以CMUSphinx。您可以通过尝试识别罕见的专有名称来验证这一点,即使使用 Google 也几乎不可能。

实际的解决方案是使用具有大词汇量的大型语言模型。

这是一个开放的研究问题,用于检测音频流中的新单词并将其添加到带有语音或其他类型反馈的识别器中。

关于cmusphinx - sphinx 4 是否可以识别所有可能的单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18217070/

相关文章:

java - 当有人用 JAVA 说话时尝试将静态图像发送到 'talk'

Python 无法使用 Gstreamer 访问 USB 麦克风以在 Raspberry Pi 上使用 Pocketsphinx 执行语音识别

speech-recognition - 如何结合语音识别和说话人二值化?

c++ - 找不到 Sphinx Ubuntu 14 c++ sphinx_config.h

java - 如何使用sphinx 4将自己的语言模型添加到java程序中

java - 使用 Sphinx4 识别关键字或关键词

java - Sphinx4 实时语音识别只能工作一次

performance - 调整 CMU Sphinx