speech-recognition - CMU Sphinx 声学模型训练挂起

标签 speech-recognition cmusphinx sphinx4

我正在使用 CMU sphinx 训练声学模型。我有大约 200 小时的语音数据。当我运行训练脚本(sphinxtrain run)时,最初我的 4 个 CPU 核心处于 100%,并且我的机器变热,因此它正在进行一些计算。但是,现在脚本看起来像是卡在模块 20,第 3 阶段。经过检查,我发现我的机器上正在运行 4 个“Perl 5.12”副本,CPU 利用率为 0%,并更新了训练目录中名为 qmanager/bw.2.4.out 的文件(Baum Welch 模型?)。此文件不断更新;我有一个 SSD 驱动器。

我的问题是这是否正常(CPU 使用率为 0%)以及是否有办法加快训练速度。

最佳答案

My question is whether this is normal (that CPU usage is at 0%) and is there a way to speed up the training.

不,有错误。您可以在 logdir 文件夹中的日志中查看详细信息。您很可能错误地指定了某些数据文件或库的路径。有时重新启动就可以了。

首先确保 4 教程适合您。

there a way to speed up the training

速度一定很快。如果您启用 8 个核心的训练,则 200 小时的模型应在 1 天之内训练完毕。

关于speech-recognition - CMU Sphinx 声学模型训练挂起,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22141873/

相关文章:

netbeans - 如何使用 netbeans 设置 sphinx

Android 自定义语音识别 GUI 对话框

python-3.x - 语音识别。模块已安装但无法运行

speech-recognition - 使用 Sphinx4 的听写应用程序

javascript - 如何获取LanguageModel JS文件?

eclipse - 不知道要开始测试sphinx4的类

javascript - Internet Explorer 中的语音识别

java - 将视频或音频转换为文本而不播放?

java - 使用语音识别将单个字符识别为java

android - 使用 Sphinx4.0 构建语音识别。安卓应用