node.js - 语音识别,nodeJS

标签 node.js speech-recognition speech-to-text

由于连接到不同的 API,我目前正在开发一种工具,允许我阅读我的所有通知。

它工作得很好,但现在我想发出一些声音命令来执行一些操作。

就像当软件说“一封来自 Bob 的邮件”时,我想说“阅读”或“存档”。

我的软件是通过 Node 服务器运行的,目前我没有任何浏览器实现,但它可以是一个计划。

在 Node JS 中启用语音到文本的最佳方式是什么?

我已经看到很多关于它的线程,但主要是它使用浏览器,如果可能的话,我想在一开始就避免它。可能吗?

另一个问题是某些软件需要输入 wav 文件。我没有任何文件,我只希望我的软件始终听我说的话,以便在我说出命令时使用react。

你有关于我如何做到这一点的任何信息吗?

干杯

最佳答案

这里的两个答案都已经很好了,但我认为您正在寻找的是 Sonus .它会为您处理音频编码和流式传输。它始终离线收听可定制 热词(如 Siri 或 Alexa)。您还可以以编程方式触发监听。结合 say 这样的模块,您可以通过执行以下操作来启用您的示例:

say.speak('One mail from Bob', function(err) {
  Sonus.trigger(sonus, 1) //start listening
});

您还可以使用不同的热词以不同的方式处理后续识别的语音。例如:
通知。最新的。”和“发送消息。你今天好吗”

将它扔到 Pi 或 CHIP 上,并在你的 table 上放一个麦克风,你就有了一个私有(private)助理来读取你的通知并对命令使用react。

简单的例子:
https://twitter.com/_evnc/status/811290460174041090

有点复杂:
https://youtu.be/pm0F_WNoe9k?t=20s

完整文档:
https://github.com/evancohen/sonus/blob/master/docs/API.md

免责声明:这是我的项目:)

关于node.js - 语音识别,nodeJS,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35643347/

相关文章:

javascript - 为什么我无法在Socket.IO中保存当前房间?

javascript - Node readline 模块没有 'on' 功能?

android - 如何处理 ERROR_RECOGNIZER_BUSY

python - 如何使用 Python 查看 Microsoft 语音识别语言以及它是否处于事件状态?

audio - IBM Watson文本到语音服务生成的音频的采样频率是多少?

ios - iPhone 5 上的语音识别

node.js - 带有 Express 框架的 Node.js 中的自定义事件

javascript - 在 Chrome 扩展中使用 Node.js 和 Express.js

web - (连续)网络浏览器中有限单词的语音识别

ffmpeg - Watson 语音转文本 : Narrowband producing better results than Broadband?