speech-recognition - 有没有办法通过 Alexa 或 DialogFlow.ai 等技术来使用原始音频数据？

标签 speech-recognition alexa-skills-kit web-audio-api speech-to-text voice-recognition

我正在开发一个使用语音识别的应用程序来帮助盲人学习音乐。为此，我正在考虑使用DialogFlow.ai，甚至Amazon Alexa，以免重蹈覆辙。因此，有时我想使用原始音频数据来检查乐器是否已调音。使用这些技术，默认情况下，所有音频输入都会被解释，并因此转换为文本。那么，有没有办法使用原始音频数据而不是解释用户语音呢？

最佳答案

出于多种原因(主要是安全性)，Amazon Alexa 和其他类似技术不允许您获取用户的原始输入。使用 Amazon Alexa 作为捕获乐器音频输入的方法并不是实现调音器的合理方法。您应该实现自己的方式来捕获音频，并且可以将其与 Alexa/DialogFlow 结合使用以进行命令解释。

关于speech-recognition - 有没有办法通过 Alexa 或 DialogFlow.ai 等技术来使用原始音频数据？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58283036/

上一篇：openshift - OpenShift 模板资源的部分安装

下一篇：reactjs - 为什么 Github 页面 url 在加载时发生变化，导致公共(public)资源路径不正确？

ios - Dragon Dictation API 连接服务器失败

ios - 如何为 SFSpeechRecognitionTask 设置委托(delegate)？

android - 我们能保证 Android 的 SpeechRecognizer 不会向 Google 发送数据吗？

json - 如何将文本从 alexa/echo 传递到服务器

javascript - 响应已返回后，Alexa 技能出现响应问题

javascript - 需要 Alexa 技能开发中 session 属性的初学者类(class)

javascript - HTML5 以低 kbps 录制音频

c# - 语音识别问题

javascript - Web Audio 振荡器在 Chrome 中意外地从一个频率滑到另一个频率