c# - 如何使用 Microsoft Speech 从语音模式中识别说话者?

标签 c# speech

我正在使用 Microsoft Speech C# API 执行家庭自动化命令

我想知道是否有一种方法或内置的 C# 方法来散列语音输入并识别谁在说话。如果是爱丽丝或鲍勃说“你好爱丽丝”或“你好鲍勃”。

编辑:

Microsoft Speech API 可以提供.wav 的录音。它可能能够散列、处理……以了解谁在说话:

  • 声音大,调制慢,... => Bob
  • 高音,快速调制,... => Alice

最佳答案

说话人识别是一个难题,并且仍然是一个活跃的研究领域。我不认为 Microsoft speech api 有任何说话人识别支持,但不是 100% 肯定。

我发现以下文章在研究该主题时非常有用。它介绍了主题,还提供了一个非常粗略的实现。可能是一个不错的起点。

http://www.ibm.com/developerworks/opensource/library/os-sndpeek/index.html

关于c# - 如何使用 Microsoft Speech 从语音模式中识别说话者?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11796105/

相关文章:

c# - 从 LinqPad 中的类运行

swift - AVSpeechSynthesizer 在添加要说出的新字符串时不起作用 [xcode - swift 4]

java - 识别使用 Java 的人所说的字母

audio - 通过 Wifi 流式传输语音

html - 谷歌语音识别配额

c# - 获取登录用户的 AppData\Local 文件夹

c# - 读取资源文件时出错c#

javascript - 从网络应用程序中的文本合成语音

c# - 编辑 WriteableBitmap 的原始像素数据?

c# - Visual Studio 测试资源管理器无法在已编译的测试项目中运行测试