Python 语音比较

标签 python speech-recognition speech-to-text cmusphinx

我有两个 .wav 文件,我需要比较它们并确定它们是否包含相同的词(也有相同的顺序)。

我一直在寻找最好的方法。我不知道如何让 pyspeech 使用文件作为输入。我试过让 CMU sphinx 项目正常工作,但我似乎无法让 GStreamer 与 Python 27 一起工作,更不用说他们的项目了。我也搞砸了 DragonFly,但运气不好。

我正在使用 Win7 64bit 和 Python27。有人有什么想法吗?

非常感谢任何帮助。

最佳答案

你可以试试 PySpeech .有关更多信息,请参阅 pyspeech (python) - Transcribe mp3 files? .我从未使用过它,但我相信它利用了 Windows 内置的语音识别引擎。这将允许您将 Wav 文件转换为文本,然后您可以进行文本比较。

要使用 Windows 语音引擎并使用 wav 文件进行输入,有两个要求。

  1. 使用进程内识别器 (SpeechRecognitionEngine)。共享识别器不能使用 Wav 文件作为输入。
  2. 在识别器对象上调用 SetInputToWaveFile 以指定您的输入 wav 文件。

您可能需要对 wav 文件重新采样,因为语音识别引擎仅支持某些采样率。

  • 每个样本 8 位
  • 单声道单声道
  • 每秒 22,050 个样本
  • PCM编码

在 Windows 上运行良好。参见 https://stackoverflow.com/a/6203533/90236了解更多信息。

有关 Windows 语音引擎的更多背景信息,您可以查看 SAPI and Windows 7 ProblemWhat is the difference between System.Speech.Recognition and Microsoft.Speech.Recognition?

关于Python 语音比较,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9404099/

相关文章:

python - 如何重命名内置函数,例如 "if"-> "hehe"、 "elif"-> "haha"、 "else"-> "hihi"?

c# - C# 中的乌尔都语语音识别

python - 如何在 Python 中使用 recognize_sphinx API 提高语音到文本转换的准确性

ios - Swift 3.0 语音转文本 : Changing Color of Words

python - 将 Python 中的日期与日期时间进行比较

python - 使用python从mysql检索数据时如何删除多余的逗号

android - 用于英语以外语言的 Google 语音转文本 API

audio - Google Cloud Speech:单词开始时间

python - 在 Python 中访问计算机麦克风的最简单方法是什么?

c# - 录制语音,直到用户停止讲话?