python - 如何在Python中将文本与音频匹配?

标签 python audio speech-recognition speech-to-text

我有一个音频文件和与该音频文件中的语音相对应的文本。

有什么方法可以将文本与音频相匹配,以便我得到类似时间戳的信息,显示文本文件中的单词在音频中出现的位置。

最佳答案

所以我已经找到了我正在寻找的东西。

显然,将给定文本与音频进行匹配并返回准确时间戳的技术称为强制对齐

这是一个非常有用的链接,指向最佳强制对齐工具列表:https://github.com/pettarin/forced-alignment-tools

就我个人而言,我使用过Aeneas因为它对我来说非常有效。

关于python - 如何在Python中将文本与音频匹配?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67000827/

相关文章:

c# - 加载关卡后声音无法播放

ios - 带有 child 语音的 iOS 文本转语音框架

speech-recognition - pocketsphinx - 如何从关键字识别切换到语法模式

speech-recognition - 从头开始简单的语音识别

python - 无法在PyCharm Mac OS 10.13中安装turicreate

python - 如何从 `sympy.solve` 结果中消除负解?

python - Python 如何告诉 “this is called as a function” ?

audio - 我可以使用该网站的 "free"声音文件吗?

audio - Arduino播放Midi文件

python - 如何使用 PyBrain 网络拟合函数?