我刚刚想到一个想法,我想开发一个应用程序来区分/自动检测不同人的声音。
示例用例:使用奥巴马和罗姆尼的数据进行训练后,应用程序将能够检测到任何一人再次讲话(不一定是训练数据中的相同内容)
我想知道是否有这方面的现有研究。 (我不知道如何搜索这个。我尝试了几个关键字,但没有得到明显的结果。)
如果没有,什么是开始的好方法?如何选择特征、数据表示、模型等
谢谢!
最佳答案
我找到了Speaker recognition维基百科上又链接到 An overview of text-independent speaker recognition: From features to supervectors (Kinnunen,李,2010)。
摘自论文摘要:
This paper gives an overview of automatic speaker recognition technology, with an emphasis on text-independent recognition. Speaker recognition has been studied actively for several decades. We give an overview of both the classical and the state-of-the-art methods.
关于machine-learning - 语音识别方面有现有的研究可以区分不同人的声音吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13244820/