python - 如何通过pyspeech或dragonfly输入和处理音频文件以转换为文本

标签 python speech-recognition

我看过pyspeech和dragonfly的文档,但不知道如何输入音频文件转换成文本。我已经通过对着它说话用麦克风试过了,语音被转换成文本,但是如果我想输入一个以前录制的音频文件。谁能帮忙举个例子?

最佳答案

PySpeech 和 Dragonfly 都是相对较薄的 SAPI 包装器。不幸的是,它们都使用不支持输入选择的共享识别器。虽然我熟悉 SAPI,但对 Python 不是很熟悉,所以我无法帮助任何人将 PySpeech/Dragonfly 转移到进程内识别器。

关于python - 如何通过pyspeech或dragonfly输入和处理音频文件以转换为文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12455069/

相关文章:

c# - 在语音识别方面需要建议吗?

c# - Microsoft Sam,SAPI 替代品

google-cloud-platform - 谷歌云平台 : Speech to Text Conversion of Large Media Files

ffmpeg - Watson 语音转文本 : Narrowband producing better results than Broadband?

python - 如何使用协程作为 pytest fixture ?

带有 Tor 代理的 Python urllib2 抛出 `HTTP Error 403`

python - 过滤掉 Pandas 数据框中的数据

javascript - Microsoft Edge 中的语音识别 API(未定义)

python - Cython setup error : Unable to find pgen, 没有编译正式语法

python - 原始输入处的 Nose 测试卡住