audio - 是否有标记的语音速率数据集？使用像快，中，慢或基于每分钟字数的标签？

我正在做一个关于ML的项目，目的是从音频文件中找到语速。
我找不到它的标签数据集。
有什么建议么？

最佳答案

您可以将数据集(例如TEDLIUM)与单词时间戳进行时间对齐，并从中计算出语速。

如果您需要各种速率，则最好转储youtube音频并使用公认的单词时间戳，因为大多数数据集的速率都非常统一。

关于audio - 是否有标记的语音速率数据集？使用像快，中，慢或基于每分钟字数的标签？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60259237/

相关文章：

c++ - 通过语音在字典中查找单词