audio - 自动搜索并剪切mp3音频文件中的每个单词

标签 audio mp3 diff speech-recognition cut

首先，我将大体上说明我要做什么，并寻求建议。然后，我将解释我目前的方法并要求我解决当前的问题。

问题

我有一个说英语的人的MP3文件，这是播客中的一个故事。我想将其分为与单词大致对应的部分。 (我将手动执行此操作，但是我们正在谈论的是我必须剪切或分离的数据小时)。

如果您有关于如何自动执行此操作的建议，我很想听听。

当前方法

我只能手动剪切Audacity。

最佳答案

好吧，首先，您的问题与MP3或开始使用的编解码器没有任何关系。要进行任何有意义的处理，您必须将其转换为常规PCM流。 FFmpeg对此非常有用，但还有许多其他MP3工具。

接下来，我建议研究语音识别库。将其剥离成裸露的组件可能会给您带来单词边界。

这个问题并不像在音频中寻找安静点并进行剪切那样简单。大多数人在讲话时会不断呼吸并发出声音，并通过关节控制气流和声音的输出。对于专业人员来说尤其如此。您将需要知道所讲内容的内容，这就是为什么我认为语音识别库可能是一个不错的起点的原因。

关于audio - 自动搜索并剪切mp3音频文件中的每个单词，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46385948/

上一篇：powershell - 使用Authenticationn/Access token 访问TeamCity时出现错误401未经授权

下一篇：powershell - 如何在powershell中将字符串转换为十进制？

audio - 从音符开始进行节拍检测？

java - 从 mp4 中提取音轨并将其保存到可播放的音频文件

ios - 在后台停止音频

javascript - 我想按 jquery 的顺序播放多个 mp3

android - https .mp3 链接适用于不在 2.3 及以下版本的平板电脑(11+ api)

javascript - 如何查找array2中不在array1中的元素？

c# - Unity 5 音频音量 slider

android - 将我的 res/raw 包中的 mp3 添加到 Android 的铃声列表中

svn - 如何获取 svn 中已更改文件的列表？