目标:
AFAIK 现代边缘设备(Echo、智能手机、Google Home 等)具有非常精美的硬件+软件解决方案,使它们能够连续收听关键字而不会占用大量 CPU,也无需将所有音频发送到云服务器.我也想要同样的,但我不确定这是否可能——我确信他们训练了他们最小且高效的“Hey Siri”ML 模型来处理各种口音、音量、节奏、年龄、背景噪音, ETC。
有什么建议么?或者问一个rpi是不合理的?
最佳答案
您可以使用像 CMU Sphinx 这样的库离线工作,不需要其他在线服务器。
有时,公认的结果是相当不准确的。为了解决这个问题,我使用了一个比默认提供的字典小得多的字典。我从未在 Raspberry Pi 上对其进行过全面测试,但我认为它应该可以工作。
关于java - 是否有用于监听音频命令的 Kotlin 或 Java 库? (想要在 child 大喊 'TRICK OR TREAT' 时触发万圣节显示),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63853946/