audio - 检测录音中的不同说话者

标签 audio voice-recognition voice

我想制作一个应用程序来计算录音中每个发言者的讲话时间。我不在乎进行完整的语音识别并转录录音中的每个单词,我只想要每个声音的说话时间。

有没有一款软件可以提供这样的功能?

如果可能,我希望避免使用第三方服务(例如 Google Cloud)来实现此目的,并且我希望该解决方案足够轻巧,可以在现代智能手机上运行。

感谢您的帮助。

最佳答案

我也有同样的想法。看看这个https://github.com/pyannote/pyannote-audio

我自己还没试过。之后将添加编辑。

关于audio - 检测录音中的不同说话者,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73306435/

相关文章:

java - 节拍器android应用程序AudioTrack releaseBuffer()错误

javascript - AnnyangJS 的输入/输出数据库

c++ - Ubuntu中如何通过语音命令生成键盘、鼠标事件

java - 如何增加Android音频流的数量?

android - 我可以在 Corona 中使用麦克风吗?

python - 对短音频样本进行分类

browser - 如何在浏览器中录制声音?

android - 如何在Android中实现基于语音命令的导航

python - Python:将十六进制字节流转换为 “int16"

android - 在音乐识别上启动 Google Now