speech-recognition - 是否有语音转文本 API 或一些 "hack"，我可以通过它使用 Google 的语音转文本工具？

标签 speech-recognition google-api

我认为 Google 的语音转文本工具(Google Voice 语音邮件自动转录、YouTube 视频自动字幕等)令人印象深刻。

我确实查看了 Google 是否通过 API 提供了它，但似乎他们没有(不是我责怪他们!)。不过，提供语音到文本功能的云计算服务会很酷。

是否有某种“黑客”可以用来访问文本的语音。我的架构基本上归结为这一点 - 一个 15-20 秒的短 wav/mp3/其他剪辑作为输入，输出是纯文本。

有什么想法吗？

最佳答案

有很多语音到文本 API。仅仅因为谷歌没有提供他们的，并不意味着你不走运。

这是一个很好的 C#。如果您的平台不是 .NET，您可以搜索其他平台。

http://cmusphinx.sourceforge.net/

关于speech-recognition - 是否有语音转文本 API 或一些 "hack"，我可以通过它使用 Google 的语音转文本工具？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2815076/

上一篇：ant - 最后在 Ant 中尝试

下一篇：.net - 有没有扩展 System.Diagnostics.Trace 的库？

google-api - 谷歌API认证: Not valid origin for the client

javascript - Angular2 从 NPM (Googleapis) 导入模块

android - Android 上 Google 登录的 403 响应

android - 适用于移动设备的语音转文本 API 或 SDK(跨平台)

ipad - 从哪里开始开发语音识别应用程序

android - 在模拟器 : No Activity found to handle Intent 中语音转文本

r - 从 MFCC 训练 GMM 的库

python - 如何根据我自己的训练数据微调来自 OpenAI 的 Whisper ASR 的模型？

php - 将视频上传到特定的播放列表