audio - 用于从音频流中提取单词(语音)的库?

标签 audio extract speech

我有一个音频流,我会从中提取单词(语音)。因此,例如使用 audio.wav 我会得到 001.wav、002.wav、003.wav 等,其中每个 XXX.wav 是一个词。

我正在寻找一个库或程序来做这件事——平台无关紧要,但我更喜欢开源解决方案。

预先感谢您的帮助。

最佳答案

Nuance ,制造Dragon Naturally Speaking的公司, 有Software Development Kits号.

Audio Mining套件似乎符合您的要求:

Dragon NaturallySpeaking SDK AudioMining is a speaker-independent speech recognition toolkit that enables the indexing of 100% of the speech information within audio files. The technology uses highly accurate speech recognition to turn audio files into XML text with timestamp information. This can be integrated with standard text-search products to enable rapid access to specific audio content.



语音到语音+元数据无疑是最难正确处理的部分。获得语音 + 元数据后,将单词提取为单独的音频文件是 much more straightforward .

关于audio - 用于从音频流中提取单词(语音)的库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3178238/

相关文章:

java - 读取和播放音频文件

audio - 如何在D3js选择中播放来自音频标签的声音?

android - 在 Android 中重定向音频/创建备用声音路径

mysql - 从mysql字段中提取字符串

javascript - 提取字符串中的链接并返回对象数组

android - opus-codec 在安卓上的播放

audio - FFMPEG:生成输入文件时间最长的7.1声道音频文件

java - 以编程方式从 Eclipse 捕获编译器错误

audio - 直接来自音频/转录的语音到文本(语音识别)

windows-8 - WinRT 演讲