c# - 人声识别/识别

标签 c# voice-recognition

我想录下某人的声音,然后根据我获得的关于他/她声音的信息,如果那个人再次说话,我就能认出来!问题是我没有关于哪些统计数据(如频率)导致人声差异的信息,如果有人可以帮助我如何识别某人的声音?

在研究过程中,我发现了各种关于语音识别的库,但它们无法帮助我,因为我的问题非常简单!我只想认出说话的人不是他在说什么。

最佳答案

你描述的问题并不简单,因为同一个人的声音听起来可能不同(例如,如果这个人感冒等)和/或如果这个人说话声音更大/更快/更慢等。

另一点是与其他声音(背景、其他声音等)的分离。

录制声音的设备的质量非常重要 - 有些系统使用多个麦克风来取得良好的效果......

总的来说,这不是一件容易的事 - 尤其是。如果您想获得良好的检测率。

基本上实现这个的方法是:

  • 实现稳健的声音分离
  • 实现强大的声音/语音模式提取
  • 根据理想的声音设置创建一个数据库,其中包含您要识别的声音的指纹
  • 定义一种算法,用于比较您存储的指纹和提取/归一化的声音/语音模式(有一些“可能相等”的阈值等可能是必要的...)
  • 改进您的算法,直到达到可接受的检测率(还要考虑误报率!)

有关详细概述,请参阅 http://www.scholarpedia.org/article/Speaker_recognition

关于c# - 人声识别/识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9565082/

相关文章:

c# - 除了一个(登录)之外,保护 Controller 所有操作的最佳方法是什么?

c# - 从文件夹中获取预制件然后转换为列表<GameObject>

c# - 在 C# 中使用 'unnecessary' 局部变量的性能损失?

c# - Linq 如何从 Lambda 推断类型

c# - SpeechRecognitionEngine.AudioLevel 不变

python - ModuleNotFoundError : No module named 'librosa'

javascript - recorder.js 到节点到 azure 说话者识别

ios - 使用 siri 将语音转换为文本

Android - 语音识别一个词?

c# - 带通配符的 SpeechRecognitionEngine 语法