由于连接到不同的 API,我目前正在开发一种工具,允许我阅读我的所有通知。
它工作得很好,但现在我想发出一些声音命令来执行一些操作。
就像当软件说“一封来自 Bob 的邮件”时,我想说“阅读”或“存档”。
我的软件是通过 Node 服务器运行的,目前我没有任何浏览器实现,但它可以是一个计划。
在 Node JS 中启用语音到文本的最佳方式是什么?
我已经看到很多关于它的线程,但主要是它使用浏览器,如果可能的话,我想在一开始就避免它。可能吗?
另一个问题是某些软件需要输入 wav 文件。我没有任何文件,我只希望我的软件始终听我说的话,以便在我说出命令时使用react。
你有关于我如何做到这一点的任何信息吗?
干杯
最佳答案
这里的两个答案都已经很好了,但我认为您正在寻找的是 Sonus .它会为您处理音频编码和流式传输。它始终离线收听可定制 热词(如 Siri 或 Alexa)。您还可以以编程方式触发监听。结合 say 这样的模块,您可以通过执行以下操作来启用您的示例:
say.speak('One mail from Bob', function(err) {
Sonus.trigger(sonus, 1) //start listening
});
您还可以使用不同的热词以不同的方式处理后续识别的语音。例如:
“通知。最新的。”和“发送消息。你今天好吗”
将它扔到 Pi 或 CHIP 上,并在你的 table 上放一个麦克风,你就有了一个私有(private)助理来读取你的通知并对命令使用react。
简单的例子:
https://twitter.com/_evnc/status/811290460174041090
有点复杂:
https://youtu.be/pm0F_WNoe9k?t=20s
完整文档:
https://github.com/evancohen/sonus/blob/master/docs/API.md
免责声明:这是我的项目:)
关于node.js - 语音识别,nodeJS,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35643347/