c# - 关于 .NET 中语音识别类的问题

是否可以使用 .NET 语音识别类构建应用程序并传入 WAV 文件以供其通过并创建其文本表示形式。例如，这是我正在尝试做的:

我办公室有一个 QA 部门，他们每天必须接听数百个电话，这是不可能的，而且没有足够的人接听所有电话以跟上进度。我想要做的是将音频文件上传到我们的服务器并让服务器解析它并创建它的转录本。如果它不完美也没关系，但只是一个基础，浏览几十行文本比听 2 小时的录音更容易。

基于保存的抄本，我可以在数据库中进行全文搜索，如果有人说的是虚假陈述，我还可以对抄本进行检查。

那么，是否可以使用 .NET 语音识别类创建一个应用程序，然后将 WAV 文件传递给它，然后它会输出一个粗略的抄本？

在思考这个想法时，我已经在 MSDN 的演讲课上进行了简短的挖掘，所以如果可能的话，我没有那么多的知识。

如果可能，我将不胜感激 C# 中的任何示例。话题1055347类似于我遇到的问题，并提供了链接，其中最具体的是 C++。我不是 C++ 开发人员，也没有上过编程学校，我是自学 C# 的，所以我想继续使用我知道的语言。

提前致谢!

最佳答案

这听起来像是调用中心类型的应用程序。 Microsoft Speech Server具有针对电话优化的 SR 引擎(8000 Hz 采样率)，这将产生比桌面 SR 引擎更好的识别。但是，该引擎并不是真正为转录而设计的(尽管它可以做到这一点)，并且在进行进一步处理之前肯定需要检查转录。 Microsoft Exchange Unified Communications 使用 SR 引擎生成语音邮件的抄本，虽然聊胜于无，但它经常会生成有趣的废话。

关于c# - 关于 .NET 中语音识别类的问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/1772781/

c# - 关于 .NET 中语音识别类的问题

上一篇：c# - VS 2008 中的 "Unable to start debugging"消息

下一篇：c# - Silverlight DataGrid 中的选定项