java - 是否有用于监听音频命令的 Kotlin 或 Java 库? (想要在 child 大喊 'TRICK OR TREAT' 时触发万圣节显示)

标签 java audio raspberry-pi speech-recognition speech-to-text

目标:

  • 在低端设备上(树莓派 3)
  • 聆听一组固定的音频短语命令(我的“Hey Google”或“Hey Siri”版本)
  • 这可能是一个非常有限的词汇表(少于 10 个命令)
  • 检测到命令时触发 Kotlin 函数。
  • 无需使用大量 CPU 或大量网络带宽。

  • AFAIK 现代边缘设备(Echo、智能手机、Google Home 等)具有非常精美的硬件+软件解决方案,使它们能够连续收听关键字而不会占用大量 CPU,也无需将所有音频发送到云服务器.我也想要同样的,但我不确定这是否可能——我确信他们训练了他们最小且高效的“Hey Siri”ML 模型来处理各种口音、音量、节奏、年龄、背景噪音, ETC。
  • Java Speech API (JSAPI) 似乎... 不确定。许多示例都是旧的,或者指向不受支持的库,或者最终使用了 Google Cloud Speech。
  • 这不是 作为一个 Java/Kotlin 库,我还可以包装一个 native 命令监听器进程。
  • 我正在查看 ML Kit 和 Firebase ML,但没有看到音频到命令的转换。
  • 如果我能调整灵敏度,那将是最好的,戴着面具的 child 大喊“TWIC R TREET”或“TMURMP ... TWEEF”或其他任何应该做的事情。
  • ...但不是纯粹的音量检测器,开车经过的汽车不应该触发它。

  • 有什么建议么?或者问一个rpi是不合理的?

    最佳答案

    您可以使用像 CMU Sphinx 这样的库离线工作,不需要其他在线服务器。
    有时,公认的结果是相当不准确的。为了解决这个问题,我使用了一个比默认提供的字典小得多的字典。我从未在 Raspberry Pi 上对其进行过全面测试,但我认为它应该可以工作。

    关于java - 是否有用于监听音频命令的 Kotlin 或 Java 库? (想要在 child 大喊 'TRICK OR TREAT' 时触发万圣节显示),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63853946/

    相关文章:

    在 R 中使用 rJava 的 Java 包装器

    ios - 如何从 iOS 应用程序中的音频文件访问声音样本?

    java - 用Java录制即将到来的声音

    logging - 通过ssh记录树莓派数据的最有效方法是什么?

    c# - 使用 Raspberry Pi 和 C# 进行实时视频流传输

    java - Windows x64 上的 Tomcat 使用 32 位 JDK

    java - IntelliJ 工件的扩展名无效

    java - Android 文件读写

    python - 在 python 中使用 super 对撞机

    serial-port - C中使用termios的Raspberry Pi UART程序接收垃圾(Rx和Tx直接连接)