python - python pocketsphinx 中的单词时间戳

标签 python speech cmusphinx

我在 ubuntu 11.10 上使用 pocketsphinx python 绑定(bind)。我将语法和音频文件传递给它,它运行良好。我现在正在寻找音频文件中每个单词的时间戳。我见过:

void ps_seg_frames(ps_seg_t *seg, int *out_sf, int *out_ef);

我相信它应该做我需要的。 但是我似乎无法在 python 中做到这一点。 这可能吗?

最佳答案

此功能尚未实现。这里有一个补丁,但似乎由于 sourceforge 中断而丢失了

https://sourceforge.net/tracker/?func=detail&atid=301904&aid=3480256&group_id=1904

添加这个绑定(bind)应该比较容易

关于python - python pocketsphinx 中的单词时间戳,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9349554/

相关文章:

python - 为什么在特定环境下 UNICODE 字符会触发 EncodeError 而在其他环境下则不会?

ruby-on-rails - 如何在 Ruby 应用程序中使用 CMU Sphinx 语音识别?

python - 使用 Python 和 Pocketsphinx 进行实时识别

python - 使用 3D 张量的最后一个维度中的索引索引 4D 张量的最后一个维度

python - Microsoft MPI 和 mpi4py 3.0.0、python 3.7.1 目前是否可行?

python - easy_install ReviewBoard [Errno 104] 连接被同行重置

audio - 将语音音频连接成连续声音的算法?

python - 将 Dragon NaturallySpeaking 的所有输入重定向到 Python? (使用 Natlink)

windows-8 - WinRT 演讲

android - 如何运行 CMUSphinxAndroid 示例进行语音识别