<分区>
有没有人有使用 C++(Windows 和/或 Mac)编写有限数量的 SPEED 命令的语音识别编程经验?在这一点上,从第一个音节开始识别命令是否现实——即,命令在用户以相当快的语速进入第二个音节时被识别?所有命令都将被编程为以不同的音节开始,如果有必要,一个完全不同的音节(如“oo”、“xy”、“fay”——只需要大约 30 个命令)。 已经提出了类似的问题,但这是一个快速发展的领域。最好的主意是寻找开源库还是与已编译的实现交互?
<分区>
有没有人有使用 C++(Windows 和/或 Mac)编写有限数量的 SPEED 命令的语音识别编程经验?在这一点上,从第一个音节开始识别命令是否现实——即,命令在用户以相当快的语速进入第二个音节时被识别?所有命令都将被编程为以不同的音节开始,如果有必要,一个完全不同的音节(如“oo”、“xy”、“fay”——只需要大约 30 个命令)。 已经提出了类似的问题,但这是一个快速发展的领域。最好的主意是寻找开源库还是与已编译的实现交互?
最佳答案
我在这个领域专业工作,我严重怀疑这是否可能。 C++ 不是问题,问题是计算机是否允许它。小声音片段的错误率很大,修复识别的是隐马尔可夫模型。但就您而言,您根本无法为其提供足够的数据。
并不是说人类也能做到。语音处理并不像您的大脑让您相信的那样即时。
关于c++ - 对有限数量的命令进行快速语音识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21211436/
相关文章:
c++ - 如何在 C++ 中制作可调试文件范围(静态?)类?
java - cmd.exe 意外挂起,具体取决于我使用的文件所在的位置
c++ - 使用 `std::copy()` 和 `std::back_inserter()`
c++ - 调用 SetupDiGetDeviceInterfaceDetail 时程序崩溃
c++ - visual studio 2012 和 visual studio 2015 的双重结果不同
c# - 如何在不更改主机文件的情况下阻止对特定站点的访问,直到重新启动?