我正在寻找一个工具包/库,可以让我从音频文件中提取音素。我在 CMU Sphinx 网站上看到 sphinx3 可用于输出音素,但是我无法在我的 windows 机器上成功构建它。
除了图书馆,建立自己的图书馆的最佳方式是什么?
最佳答案
CMUSphinx ( http://cmusphinx.sourceforge.net ) 确实是最方便的方法。如果您在构建它时遇到问题,下载预构建版本或在 CMUSphinx 论坛上寻求帮助可能更容易。
关于speech-recognition - 从音频(语音)文件中提取音素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4104360/