audio - YouTube语音识别-音频中包含特殊单词?

标签 audio youtube speech-recognition speech-to-text

我正在考虑一种机制,以找出是否有特殊词,例如“hello world”在youtube视频中说。我真的不知道该怎么做,但是我的方法是:

  • 通过youtube-dl从youtube视频中提取音频
  • 通过Pocketsphinx_continuous进行语音识别并保存在txt文件


  • 但这是非常不可靠的。 pocketsphinx_continuous效果不佳。

    有人可以建议一个好的解决方案吗?

    谢谢您的帮助!

    最佳答案

    pocketsphinx_continuous本身具有内置的kws。
    您可以使用pocketsphinx_continuous -hmm en-us -infile file.wav -dict dictfile.dict -kws "keyphrase"

    关于audio - YouTube语音识别-音频中包含特殊单词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23374495/

    相关文章:

    jquery-ui - 如何在jQuery对话框中关闭嵌入式YouTube视频

    javascript - 在一页上连续播放 YouTube 嵌入式视频

    youtube - YouTube 数据 API v3 的 `.../auth/youtube.download` 范围是什么?

    java - Android - 铃声不会停止播放

    .net - 如何分析声音并存储结果?

    audio - ASIO SDK如何处理音频缓冲区

    c# - 在 WPF 应用程序中激活 Dragon Naturally Speaking Full-Text Control 功能

    ios - 最自然的读信方式(在美国)

    algorithm - 如何使用python查找两个语音文件的差异

    python - 预期的 Chromecast 音频延迟?