javascript - 如何使用 WAMI 和 impress.js 创建语音控制的幻灯片?

标签 javascript api speech-recognition voice-recognition

我想使用 MIT 的 WAMI API(或其他语音识别 API)和 impress.js 创建语音控制的幻灯片。我想包含简单的命令,例如“下一页”或“返回”。

这可能吗?我该怎么做?

最佳答案

another post in stackoverflow问了一个非常相似的问题,但他们想使用谷歌的语音识别 API。那里对这个问题有一个很好的答案。

还有一个新的Speech API in Chrome可以使用。这个解决方案的问题是你必须点击一个图标来告诉语音识别引擎 (ASR) 开始收听,并且你的用户被限制在特定版本的 Chrome 上。大多数这些解决方案的工作方式是您必须单击图标才能获得用户的下一个话语。因此,一旦 ASR 有了命令,它就会识别出您必须再次单击该图标以告诉它再次收听。对于具有非常有限的命令集(即“下一步”和“后退”)的应用程序,这没有太大的值(value),因为用户单击告诉应用程序前进或前进的按钮同样容易回来。

看起来 WAMI API 可以让您以编程方式启动识别过程,这是一个更好的选择。这是一个 JavaScript API,您只需将其包含在您的网页中即可开始监听用户输入。 documentation for this API提供了有关如何开发多模式语音识别应用程序的良好示例。您将需要学习如何开发语法,以向语音引擎指定您在应用程序中寻找的话语。 WAMI 使用 JSpeech Grammar Format .一旦您从 ASR 中识别出“下一张”或“返回”,您只需使用 JavaScript 移至下一张或上一张幻灯片。

关于javascript - 如何使用 WAMI 和 impress.js 创建语音控制的幻灯片?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8845221/

相关文章:

javascript - .NET 部分回发后更新 javascript 变量

javascript - 根据 leaflet.js 中 map 的缩放级别使用不同的 JavaScript 文件

php - 用于英国邮件WebService API的PHP Soap客户端?

python - 如何像 FFMPEG 一样在 Python 中从音频文件创建频谱图?

javascript - 使用 javascript 存储、删除和重新应用类属性

javascript - 为什么套接字之间的数据传输需要很长时间?

android - 无法从 SDK 管理器的插件 URL 中获取“Google API 8”?

iphone - iPhone 的共享 API 按钮

javax.sound.sampled.LineUnavailableException : line with format PCM_SIGNED 16000. 0 Hz,16 位,单声道,2 字节/帧

python - 导入错误 : No module named request