google-api - Google Speech API 的正确识别结果

是否可以使用示例数据训练 Google Speech API 以帮助识别我的应用程序？

我的意思是类似于 wit.ai 提供并描述的方法 here (即使该示例适用于 nlp 处理)。基本上，如果您可以预测用户将与您的机器人进行的交互，则可以训练它以更好地执行。例如，我知道将使用的城市子集，例如:当我说 Zurich 时，它似乎无法让机器人理解我，它变成了 Syria 或 Siberia 但我已经知道那是不可能的。因此，比方说，如果我可以先上传要使用的首选词列表，然后如果没有找到匹配项，则回退到标准识别或一些类似的方法，我认为这会取得更好的结果。

知道是否可行以及如何实现吗？我知道这些 API 处于测试阶段并且可能会发生变化，但我仍然想尝试一下。

我可以上传一些我目前正在做的代码示例，尽管到目前为止它只是发送音频并分析结果，所以离这个问题还很远。

最佳答案

在recognition config您可以使用 maxAlternatives 字段(最多 30 个)指定返回给您的替代方案。一旦你有 30 个有信心的备选方案，你将有 Syria 有信心 0.5，Siberia 有信心 0.01 和 Zurich 置信度 0.1。通常会出现正确的答案，尽管它可能不在顶部。您可以根据您的当前状态选择最佳替代方案。

关于google-api - Google Speech API 的正确识别结果，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40299921/

上一篇：r - 在 R 中使用 colsplit 保持前导零

下一篇：joomla - 在 Joomla 上，如何在同一页面上显示多个可编辑的文章？

python - 是否可以更新 Google 服务帐户的设置？

c# - 无法再下载文件

java - 为什么 GoogleCredentials.fromStream(myJson) 输出为 null？

java - 语音识别API

google-api - 撤消授予我的应用 Google Drive API 的访问权限

c# - 使用microsoft speech recognition，我能得到语法识别到一半的时间吗？

ios - 快速语音识别

python - 微软语音识别自定义训练

ios - 集成 Nuance Dragon Mobile 语音包时架构 armv7 的 undefined symbol