我有一个音频流,我会从中提取单词(语音)。因此,例如使用 audio.wav 我会得到 001.wav、002.wav、003.wav 等,其中每个 XXX.wav 是一个词。
我正在寻找一个库或程序来做这件事——平台无关紧要,但我更喜欢开源解决方案。
预先感谢您的帮助。
最佳答案
Nuance ,制造Dragon Naturally Speaking的公司, 有Software Development Kits号.
Audio Mining套件似乎符合您的要求:
Dragon NaturallySpeaking SDK AudioMining is a speaker-independent speech recognition toolkit that enables the indexing of 100% of the speech information within audio files. The technology uses highly accurate speech recognition to turn audio files into XML text with timestamp information. This can be integrated with standard text-search products to enable rapid access to specific audio content.
语音到语音+元数据无疑是最难正确处理的部分。获得语音 + 元数据后,将单词提取为单独的音频文件是 much more straightforward .
关于audio - 用于从音频流中提取单词(语音)的库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3178238/