java - "Speaker Recognition and Segmentation"

标签 java c++ speech-recognition voice-recognition speaker

<分区>

寻找一种代码,将媒体文件处理为“谁在什么时候说了什么”,换句话说,“逐个说话者分割”以及每个人的时间安排。失败的答案:做任何手动工作来处理媒体文件..谢谢!

最佳答案

您可以使用 Kaldi 的说话人二值化,设置起来并不容易,但结果很好。

还有许多其他库 - LIUM、bob 等。

关于java - "Speaker Recognition and Segmentation",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24457722/

相关文章:

c++ - 来自基类的函数指针

android - 用于英语以外语言的 Google 语音转文本 API

ios - 在 SKRecognizer 中检测不到语音

java - 需要帮助改进紧耦合设计

java - 在 JGoodies WindowsLookAndFeel 中更改 JButton 的颜色

c++ - 如何通过 CRTP 实现修复破坏强封装规则?

python-3.x - python 3.x 中的语音识别

java - 在Java中,将原始类型添​​加/减去/乘以/划分为装箱类型是否会创建装箱类型的新对象?

java - 从 Google Chrome 的开发者工具获取信息

c++ 从 .csv 文件中读取