<分区>
寻找一种代码,将媒体文件处理为“谁在什么时候说了什么”,换句话说,“逐个说话者分割”以及每个人的时间安排。失败的答案:做任何手动工作来处理媒体文件..谢谢!
<分区>
寻找一种代码,将媒体文件处理为“谁在什么时候说了什么”,换句话说,“逐个说话者分割”以及每个人的时间安排。失败的答案:做任何手动工作来处理媒体文件..谢谢!
最佳答案
您可以使用 Kaldi 的说话人二值化,设置起来并不容易,但结果很好。
还有许多其他库 - LIUM、bob 等。
关于java - "Speaker Recognition and Segmentation",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24457722/