我正在做一个关于ML的项目,目的是从音频文件中找到语速。
我找不到它的标签数据集。
有什么建议么?
最佳答案
您可以将数据集(例如TEDLIUM)与单词时间戳进行时间对齐,并从中计算出语速。
如果您需要各种速率,则最好转储youtube音频并使用公认的单词时间戳,因为大多数数据集的速率都非常统一。
关于audio - 是否有标记的语音速率数据集?使用像快,中,慢或基于每分钟字数的标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60259237/