audio - 自动搜索并剪切mp3音频文件中的每个单词

标签 audio mp3 diff speech-recognition cut

首先,我将大体上说明我要做什么,并寻求建议。然后,我将解释我目前的方法并要求我解决当前的问题。

问题

我有一个说英语的人的MP3文件,这是播客中的一个故事。我想将其分为与单词大致对应的部分。 (我将手动执行此操作,但是我们正在谈论的是我必须剪切或分离的数据小时)。

如果您有关于如何自动执行此操作的建议,我很想听听。

当前方法

我只能手动剪切Audacity。

最佳答案

好吧,首先,您的问题与MP3或开始使用的编解码器没有任何关系。要进行任何有意义的处理,您必须将其转换为常规PCM流。 FFmpeg对此非常有用,但还有许多其他MP3工具。

接下来,我建议研究语音识别库。将其剥离成裸露的组件可能会给您带来单词边界。

这个问题并不像在音频中寻找安静点并进行剪切那样简单。大多数人在讲话时会不断呼吸并发出声音,并通过关节控制气流和声音的输出。对于专业人员来说尤其如此。您将需要知道所讲内容的内容,这就是为什么我认为语音识别库可能是一个不错的起点的原因。

关于audio - 自动搜索并剪切mp3音频文件中的每个单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46385948/

相关文章:

visual-studio - 使用 GitExtensions 时如何区分当前文件

audio - 从音符开始进行节拍检测?

java - 从 mp4 中提取音轨并将其保存到可播放的音频文件

ios - 在后台停止音频

javascript - 我想按 jquery 的顺序播放多个 mp3

android - https .mp3 链接适用于不在 2.3 及以下版本的平板电脑(11+ api)

javascript - 如何查找array2中不在array1中的元素?

c# - Unity 5 音频音量 slider

android - 将我的 res/raw 包中的 mp3 添加到 Android 的铃声列表中

svn - 如何获取 svn 中已更改文件的列表?