java - "Speaker Recognition and Segmentation"

<分区>

关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。

要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，因为它们往往会吸引自以为是的答案和垃圾邮件。相反，describe the problem以及迄今为止为解决该问题所做的工作。

关闭 8 年前。

寻找一种代码，将媒体文件处理为“谁在什么时候说了什么”，换句话说，“逐个说话者分割”以及每个人的时间安排。失败的答案:做任何手动工作来处理媒体文件..谢谢!

最佳答案

您可以使用 Kaldi 的说话人二值化，设置起来并不容易，但结果很好。

还有许多其他库 - LIUM、bob 等。

关于java - "Speaker Recognition and Segmentation"，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24457722/

相关文章：

c++ - 来自基类的函数指针