java - 是否有用于监听音频命令的 Kotlin 或 Java 库？ (想要在 child 大喊 'TRICK OR TREAT' 时触发万圣节显示)

目标:

在低端设备上(树莓派 3)

聆听一组固定的音频短语命令(我的“Hey Google”或“Hey Siri”版本)

这可能是一个非常有限的词汇表(少于 10 个命令)

检测到命令时触发 Kotlin 函数。

无需使用大量 CPU 或大量网络带宽。

AFAIK 现代边缘设备(Echo、智能手机、Google Home 等)具有非常精美的硬件+软件解决方案，使它们能够连续收听关键字而不会占用大量 CPU，也无需将所有音频发送到云服务器.我也想要同样的，但我不确定这是否可能——我确信他们训练了他们最小且高效的“Hey Siri”ML 模型来处理各种口音、音量、节奏、年龄、背景噪音， ETC。

Java Speech API (JSAPI) 似乎... 不确定。许多示例都是旧的，或者指向不受支持的库，或者最终使用了 Google Cloud Speech。

这不是有作为一个 Java/Kotlin 库，我还可以包装一个 native 命令监听器进程。

我正在查看 ML Kit 和 Firebase ML，但没有看到音频到命令的转换。

如果我能调整灵敏度，那将是最好的，戴着面具的 child 大喊“TWIC R TREET”或“TMURMP ... TWEEF”或其他任何应该做的事情。

...但不是纯粹的音量检测器，开车经过的汽车不应该触发它。

有什么建议么？或者问一个rpi是不合理的？

最佳答案

您可以使用像 CMU Sphinx 这样的库离线工作，不需要其他在线服务器。
有时，公认的结果是相当不准确的。为了解决这个问题，我使用了一个比默认提供的字典小得多的字典。我从未在 Raspberry Pi 上对其进行过全面测试，但我认为它应该可以工作。

关于java - 是否有用于监听音频命令的 Kotlin 或 Java 库？ (想要在 child 大喊 'TRICK OR TREAT' 时触发万圣节显示)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63853946/

java - 是否有用于监听音频命令的 Kotlin 或 Java 库？ (想要在 child 大喊 'TRICK OR TREAT' 时触发万圣节显示)

上一篇：elasticsearch - ElasticSearch根据存储桶长度(存储桶中唯一键的数量)过滤结果

下一篇：elasticsearch - 如何在Elasticsearch 6.3中找到哪个碎片超过30Gb