audio - 用于从音频流中提取单词(语音)的库？

标签 audio extract speech

我有一个音频流，我会从中提取单词(语音)。因此，例如使用 audio.wav 我会得到 001.wav、002.wav、003.wav 等，其中每个 XXX.wav 是一个词。

我正在寻找一个库或程序来做这件事——平台无关紧要，但我更喜欢开源解决方案。

预先感谢您的帮助。

最佳答案

Nuance ，制造Dragon Naturally Speaking的公司, 有Software Development Kits号.

Audio Mining套件似乎符合您的要求:

Dragon NaturallySpeaking SDK AudioMining is a speaker-independent speech recognition toolkit that enables the indexing of 100% of the speech information within audio files. The technology uses highly accurate speech recognition to turn audio files into XML text with timestamp information. This can be integrated with standard text-search products to enable rapid access to specific audio content.

语音到语音+元数据无疑是最难正确处理的部分。获得语音 + 元数据后，将单词提取为单独的音频文件是 much more straightforward .

关于audio - 用于从音频流中提取单词(语音)的库？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3178238/

上一篇：visual-studio - 管理内部第 3 方依赖项

下一篇：iis - 如何使用 IIS 7.5 更改可以在表单中发布的字段数量？

相关文章：

java - 读取和播放音频文件

audio - 如何在D3js选择中播放来自音频标签的声音？

android - 在 Android 中重定向音频/创建备用声音路径

mysql - 从mysql字段中提取字符串

javascript - 提取字符串中的链接并返回对象数组

android - opus-codec 在安卓上的播放

audio - FFMPEG:生成输入文件时间最长的7.1声道音频文件

java - 以编程方式从 Eclipse 捕获编译器错误

audio - 直接来自音频/转录的语音到文本(语音识别)

windows-8 - WinRT 演讲