我想使用python来处理一个只能识别我的声音的音频文件。例如,我与树莓派汽车谈论“前进”。它会直行,但其他说“向前”的人无法控制我的车。
或者我想将另一个人的声音视为噪音并将其消除。我能怎么做?有人告诉我可以使用 pca 或 ica 来减少这些噪音。
最佳答案
您首先识别该命令,然后使用 i 向量或 d 向量提取说话者来识别您的身份。
您可以找到算法的描述 in Apple's blog , 例如。您可以在 Kaldi 中找到上述算法的实现。 ,但它们并不是很容易集成。
关于python - 使用python降噪将其他人的声音视为噪音,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56183197/