首先,我将大体上说明我要做什么,并寻求建议。然后,我将解释我目前的方法并要求我解决当前的问题。
问题
我有一个说英语的人的MP3文件,这是播客中的一个故事。我想将其分为与单词大致对应的部分。 (我将手动执行此操作,但是我们正在谈论的是我必须剪切或分离的数据小时)。
如果您有关于如何自动执行此操作的建议,我很想听听。
当前方法
我只能手动剪切Audacity。
最佳答案
好吧,首先,您的问题与MP3或开始使用的编解码器没有任何关系。要进行任何有意义的处理,您必须将其转换为常规PCM流。 FFmpeg对此非常有用,但还有许多其他MP3工具。
接下来,我建议研究语音识别库。将其剥离成裸露的组件可能会给您带来单词边界。
这个问题并不像在音频中寻找安静点并进行剪切那样简单。大多数人在讲话时会不断呼吸并发出声音,并通过关节控制气流和声音的输出。对于专业人员来说尤其如此。您将需要知道所讲内容的内容,这就是为什么我认为语音识别库可能是一个不错的起点的原因。
关于audio - 自动搜索并剪切mp3音频文件中的每个单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46385948/