google-api - Google Speech API 的正确识别结果

标签 google-api speech-recognition

是否可以使用示例数据训练 Google Speech API 以帮助识别我的应用程序?

我的意思是类似于 wit.ai 提供并描述的方法 here (即使该示例适用于 nlp 处理)。基本上,如果您可以预测用户将与您的机器人进行的交互,则可以训练它以更好地执行。例如,我知道将使用的城市子集,例如:当我说 Zurich 时,它似乎无法让机器人理解我,它变成了 SyriaSiberia 但我已经知道那是不可能的。因此,比方说,如果我可以先上传要使用的首选词列表,然后如果没有找到匹配项,则回退到标准识别或一些类似的方法,我认为这会取得更好的结果。

知道是否可行以及如何实现吗?我知道这些 API 处于测试阶段并且可能会发生变化,但我仍然想尝试一下。

我可以上传一些我目前正在做的代码示例,尽管到目前为止它只是发送音频并分析结果,所以离这个问题还很远。

最佳答案

recognition config您可以使用 maxAlternatives 字段(最多 30 个)指定返回给您的替代方案。一旦你有 30 个有信心的备选方案,你将有 Syria 有信心 0.5Siberia 有信心 0.01Zurich 置信度 0.1。通常会出现正确的答案,尽管它可能不在顶部。您可以根据您的当前状态选择最佳替代方案。

关于google-api - Google Speech API 的正确识别结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40299921/

相关文章:

c# - Xbox One C# 上的 Google 登录问题 - GoogleWebAuthorizationBroker.AuthorizeAsync

python - 是否可以更新 Google 服务帐户的设置?

c# - 无法再下载文件

java - 为什么 GoogleCredentials.fromStream(myJson) 输出为 null?

java - 语音识别API

google-api - 撤消授予我的应用 Google Drive API 的访问权限

c# - 使用microsoft speech recognition,我能得到语法识别到一半的时间吗?

ios - 快速语音识别

python - 微软语音识别自定义训练

ios - 集成 Nuance Dragon Mobile 语音包时架构 armv7 的 undefined symbol