audio - 是否有标记的语音速率数据集?使用像快,中,慢或基于每分钟字数的标签?

标签 audio dataset speech-recognition

我正在做一个关于ML的项目,目的是从音频文件中找到语速。
我找不到它的标签数据集。
有什么建议么?

最佳答案

您可以将数据集(例如TEDLIUM)与单词时间戳进行时间对齐,并从中计算出语速。

如果您需要各种速率,则最好转储youtube音频并使用公认的单词时间戳,因为大多数数据集的速率都非常统一。

关于audio - 是否有标记的语音速率数据集?使用像快,中,慢或基于每分钟字数的标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60259237/

相关文章:

c++ - 通过语音在字典中查找单词

xcode - 将 Dragon (MacSpeech) 与 XCode 配合使用?

java - 使用 Java Sound API 播放 MP3

python - 无法在 Scikit-Learn 中获取 20 个 NewsGroups 数据集

android - 有时麦克风不会为其他应用程序发布

python - 将嵌套字典结构展平为数据集

excel - 将两个数据范围合并为一个范围(Google Drive Excel)

c# - .net 合成器

arrays - 一个按钮的随机声音生成器,该按钮使用8个不同的.wav文件。每个文件都命名为sound1.wav,sound2.wav…sound8.wav

audio - 计算机如何处理音频数据?