perl - 在文件中发送音频时，Google Speech API 不给出正确的结果

标签 perl audio ffmpeg google-apps

我偶然在 Google Speech API 看到了这篇文章这提出了一种通过 Perl 从音频文件中提取文本的机制。现在我已经录制了一个音频文件，您可以在 http://vocaroo.com/i/s0lPN5d3YQJj 找到它。 .这是一段简单的音频，阅读 我爱你 .当我在 Chrome 中访问 Google 语音 API 并说出这些话时，我得到了正确的结果。当我用我指出的音频文件尝试上述链接中的代码时，它返回奇怪的结果，如洛根 .我怎样才能使它更准确？这只是一个示例音频，我通常做的是使用类似 ffmpeg -i input.avi -vn -ar 44100 -ac 2 -ab 192 -f mp3 output.mp3 的东西通过 FFMpeg 从视频文件中提取音频，后跟 ffmpeg -i input.mp3 output.flac .

最佳答案

您是否尝试过播放您正在创建的音频文件？

您正在设置 192 位/秒的音频比特率，这非常低。

对于 192Kbps，您需要 -ab 196608 .

关于perl - 在文件中发送音频时，Google Speech API 不给出正确的结果，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11809056/

上一篇：json - 用Java解析嵌套的JSON

下一篇：elasticsearch - 有人可以解释如何在 Elasticsearch 5.1中将过滤器与percolate查询一起使用吗？

相关文章：

perl - 使用 Redis 和 Perl，如何等待一个已发布的方法

c++ - 获取 .ogg 音频剪辑持续时间

ffmpeg - 从 PNG 文件制作 Alpha Mask 视频

android - 如何使用android ndk r9b为Android编译FFMPEG

c - 读取到下一个字节的位数

perl - 编码模块和引号

perl - Alien-ffmpeg 和 ffmpeg 的区别

git - 如何使用 git repos 将本地代码与共享代码分开

java - equencer.startRecording() 没有立即开始？ Java MIDI

audio - 如何将操纵的WAV文件保存在对象列表中？