google-cloud-platform - Google-speech-api 错误地转录语音数字

标签 google-cloud-platform speech-recognition speech-to-text google-speech-api

我开始使用谷歌语音 api 来转录音频。

被转录的音频包含许多一个接一个说出的数字。

例如。 273 298

但是转录回来了 270-3298

我的猜测是它将它解释为某种电话号码。

我想要的是未解析的输出,例如“二七十三二九十八”,我可以自己处理和解析。

这种事情有设置或支持吗?

谢谢

最佳答案

所以我遇到了完全相同的问题,我认为我们找到了解决方案。如果您使用英语作为输入,请在处理数字时切换到 en-PH。然后,Google 不会将结果格式化为美国电话号码,也不会尝试在其中添加额外的数字。

关于google-cloud-platform - Google-speech-api 错误地转录语音数字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39893742/

相关文章:

google-cloud-platform - GCP 从另一个帐户访问一个帐户的快照以创建虚拟机实例

java - 通过语音命令启动应用程序 (android)

带语音识别器的 Android 自定义键盘

macos - 在 MacOS 上以编程方式切换听写

android - 关于 Android 语音识别

android - Flutter语音识别应用程序-_platformCallHandler调用speech.onError 2

javascript - 云函数冷启动期间,node_modules 文件夹的大小是否重要?

java - Android 音频指纹实现

github - 从 bitbucket 克隆 repo 时出现 Google Cloud Platform 错误

python - 为 CNN(音频识别)转换 MFCC 频谱图的输入