python - 是否可以在R中的 “autodetec”函数之后为每个对话确定说话者

标签 python r audio split speaker

我为wav文件运行以下代码,并得到4个变量:sound.files,selec,开始和结束输出。 output。有谁知道是否有可能为每次对话找说话人,以便我们知道每个星星和结尾持续时间是说话人A说话还是说话人B说话。

 autodetec(flist = sub, threshold = 0.5, env = "abs", ssmooth = 500, power = 1, redo = TRUE,
            bp=c(0,9), xl = 2, picsize = 2, res = 200, flim= c(0,10), osci = TRUE,
            wl = 300, ls = FALSE, sxrow = 2, rows = 4, mindur=0.5, maxdur=8, set = TRUE)

最佳答案

该问题基于speaker diarisation的主题。如果每个扬声器都已经有同类片段(自动检测功能的输出),则可以计算音频描述符(例如常用的MFCC)来对每个片段进行分类。像Kmeans这样的简单分类器就可以完成这项工作。

关于python - 是否可以在R中的 “autodetec”函数之后为每个对话确定说话者,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41894982/

相关文章:

python - Python数据导入错误

python - 动态 QComboBox 填充取决于用户输入 PyQt5

regex - R- 文本值连续显示多少次?

带有实时音频流的 Android 背景音频

javascript - 音量 slider 自动静音

python - Function() 正好接受 2 个参数(给定 3 个)

r - 将大距离矩阵更改为只有三列

r - R 中 S4 对象的总和

linux - linux分层系统中的声音系统是否为OSI模型?

python - 我的 DataFrame 有 NaN 值但不应该