我有数千个由电话录音系统生成的 GSM wav 文件。我需要通过语音到文本引擎 (Nuance) 运行这些,这似乎只适用于 PCM 文件。
我对这些格式一无所知,但需要一种编程(脚本)方式将 GSM 转换为 PCM。
有任何想法吗?
最佳答案
Sox可以做到。您需要提供 gsm 文件的采样率和 channel 数,因为它不包含任何标题信息。像这样的东西:sox input.gsm -r 8000 -c 1 -w -s ouput.wav
关于audio - 将 wav 文件从 GSM 转换为 PCM,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35344026/