c++ - 对有限数量的命令进行快速语音识别

<分区>

关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。

要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，因为它们往往会吸引自以为是的答案和垃圾邮件。相反，describe the problem以及迄今为止为解决该问题所做的工作。

关闭 8 年前。

有没有人有使用 C++(Windows 和/或 Mac)编写有限数量的 SPEED 命令的语音识别编程经验？在这一点上，从第一个音节开始识别命令是否现实——即，命令在用户以相当快的语速进入第二个音节时被识别？所有命令都将被编程为以不同的音节开始，如果有必要，一个完全不同的音节(如“oo”、“xy”、“fay”——只需要大约 30 个命令)。已经提出了类似的问题，但这是一个快速发展的领域。最好的主意是寻找开源库还是与已编译的实现交互？

最佳答案

我在这个领域专业工作，我严重怀疑这是否可能。 C++ 不是问题，问题是计算机是否允许它。小声音片段的错误率很大，修复识别的是隐马尔可夫模型。但就您而言，您根本无法为其提供足够的数据。

并不是说人类也能做到。语音处理并不像您的大脑让您相信的那样即时。

关于c++ - 对有限数量的命令进行快速语音识别，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/21211436/

上一篇：c# - 授予非管理员用户访问权限以启动/停止服务 Windows 7

下一篇：c++ - Windows 8 SDK 中的 d3dx11.h

相关文章：

c++ - 如何在 C++ 中制作可调试文件范围(静态？)类？

java - cmd.exe 意外挂起，具体取决于我使用的文件所在的位置

java - Android语音识别与数组

android - 语音识别

c++ - 使用 `std::copy()` 和 `std::back_inserter()`

c++ - 调用 SetupDiGetDeviceInterfaceDetail 时程序崩溃

c++ - visual studio 2012 和 visual studio 2015 的双重结果不同

c# - 如何在不更改主机文件的情况下阻止对特定站点的访问，直到重新启动？

python - 如何在 Windows 上控制 Python 的交互式控制台输入/输出？

c# - 使用 Windows 语音识别时麦克风音量的最小截止值