node.js - 语音识别，nodeJS

由于连接到不同的 API，我目前正在开发一种工具，允许我阅读我的所有通知。

它工作得很好，但现在我想发出一些声音命令来执行一些操作。

就像当软件说“一封来自 Bob 的邮件”时，我想说“阅读”或“存档”。

我的软件是通过 Node 服务器运行的，目前我没有任何浏览器实现，但它可以是一个计划。

在 Node JS 中启用语音到文本的最佳方式是什么？

我已经看到很多关于它的线程，但主要是它使用浏览器，如果可能的话，我想在一开始就避免它。可能吗？

另一个问题是某些软件需要输入 wav 文件。我没有任何文件，我只希望我的软件始终听我说的话，以便在我说出命令时使用react。

你有关于我如何做到这一点的任何信息吗？

干杯

最佳答案

这里的两个答案都已经很好了，但我认为您正在寻找的是 Sonus .它会为您处理音频编码和流式传输。它始终离线收听可定制 热词(如 Siri 或 Alexa)。您还可以以编程方式触发监听。结合 say 这样的模块，您可以通过执行以下操作来启用您的示例:

say.speak('One mail from Bob', function(err) {
  Sonus.trigger(sonus, 1) //start listening
});

您还可以使用不同的热词以不同的方式处理后续识别的语音。例如:
“通知。最新的。”和“发送消息。你今天好吗”

将它扔到 Pi 或 CHIP 上，并在你的 table 上放一个麦克风，你就有了一个私有(private)助理来读取你的通知并对命令使用react。

完整文档:
https://github.com/evancohen/sonus/blob/master/docs/API.md

免责声明:这是我的项目:)

关于node.js - 语音识别，nodeJS，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35643347/