c# - 如何从语音文件中识别短语

标签 c# visual-studio-2010 speech-recognition

如何让引擎成功识别语音文件(wav/mp3/etc..)中的短语?

例如,如果我有一个语音文件和同一个文件上下文的书面文本,那么要让它识别语音文件中的书面文字。

我尝试使用 SpeechRecognitionEngine,但到目前为止没有成功。

我会很感激你的想法,因为这是我第一次处理语音识别技术。

我看过使用词典进行语音转文本的示例,但我不确定它在这里有何用处。我正在考虑将所有语音文件转换为文本,然后简单地在该文本中查找特定短语,但我认为这不是正确的方法。将例如 5 小时的语音转换为文本似乎没有意义……或者可能将特定短语用作“词典”并在语音文件中查找此项。

最佳答案

看来您需要在一个长文件中查找特定的单词。这种技术称为“关键字识别”,它与语音识别截然不同,效率更高。显然,您不需要转录整个文件来搜索其中的单词,您可以快速浏览整个文件。 Microsoft 语音识别引擎对关键字识别的支持非常有限。

CMUSphinx 这样的开源引擎可用于有效地实现关键字发现。有关更多引用信息,请参阅 how to implement wake-up listening with pocketsphinx 上的信息.

有关底层算法的更多信息,请参阅 ACOUSTIC KEYWORD SPOTTING IN SPEECH WITH APPLICATIONs TO DATA MINING

关于c# - 如何从语音文件中识别短语,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10377054/

相关文章:

c# - 自定义 WPF 中列表框中选择的可视化

c# - 查询以更新值

c - 第一次机会异常 : KernelBase. dll

python - 从 Python 中的字符串中删除引号

android - 如何检测语音

c# - asp net web api自定义过滤器和http动词

c# - 仅从 Azure Web Scheduler 调用 Asp.Net MVC Web API

c# - MySqlconnection 不包含 Connection、CommandText、Prepare 或 ExecuteNonquery 的定义

c# - MSTest - 从构建服务器隐藏一些单元测试

android - 如何将语音识别与我的相机应用程序集成?