我在开发微信小程序的时候,想实现语音控制。但是微信客户端提供的音频是丝的。
我需要将 silk 文件转换成某种可以被 3rd 语音检测服务识别的格式。
一些 3rd 服务支持 amr 格式。这真的很棒,因为尺寸可以非常小。
最佳答案
步骤如下:
- 正在将 silk 文件上传到您的服务器。
- 解码 silk 文件。感谢this project ,这是一个很棒的工具,可以将 silk 文件解码为 pcm 格式。
- 安装 ffmpeg,由于一些许可问题,默认情况下,ffmpeg 不支持 amr,您必须安装 opencore-amr。最简单的方法是
brew install ffmpeg --with-opencore-amr --with-speex
。 - 因为amr格式只支持8kHz,所以project中的shell(上面提到的)不起作用。我们必须将第 70 行的命令更改为
ffmpeg -y -f s16le -ar 24000 -ac 1 -i "$1.pcm"-ar 8000 "${1%.*}.$2”
.
关于ffmpeg - 如何将微信中的silk音频文件转换成amr格式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42337870/