c++ - 如何对视频文件使用语音识别?

标签 c++ video speech-recognition

我如何编写语音识别引擎(使用 Microsoft Speech SDK)以“收听”视频文件并将检测结果保存到文件中?

最佳答案

这与 this question 非常相似并且有一个非常相似的答案。您需要分离出音频部分,将其转换为 WAV 格式,并将其发送到一个 inproc 识别器。

但是,它存在我之前描述的相同问题(需要训练,假设单一语音,并假设麦克风离说话者很近)。如果是这样的话,那么您可能会得到相当不错的结果。如果不是这种情况(即,您正在尝试转录电视节目,或者更糟的是,转录某种摄像机音频),那么结果可能不会令人满意。

关于c++ - 如何对视频文件使用语音识别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1700651/

相关文章:

c++ - 如何通过递归使用 OpenMP

c++ - 用于模拟 Spring 运动的代码中的段错误

c++ - 无法从 Qt C++ 将发出的信号捕捉到 QML 中

java - Android Marshmallow 6.0.1 打破了我的连续语音识别

raspberry-pi - 如何用arecord录制单声道?

c++ - 线程同步

ios - 检测以纵向或横向全屏播放的视频

ruby-on-rails - 视频不在 Rails 中播放

facebook - 如何使用 iphone sdk 4.0 在 facebook 上上传视频?

python-3.x - 如何从python中的.wav音频文件中删除/减少噪声