我注意到 some 的 wiki 转录最近的Stack Overflow Podcasts有点弱。显然,这项任务需要计算机程序。将音频转录为文本(最好带有说话者标签,以便我们知道谁说了什么)可以在软件中完成吗?是否有任何活跃的开源软件项目试图实现此类功能?
最佳答案
相信我,我以前搜索过这个。开源或免费使用的文本转语音技术很少甚至没有。从我的搜索来看,文本合成器没有任何言论自由。这些东西很难编码而且价格昂贵,以至于无法真正使用开源方法来制作。如果您确实需要这个,则必须从公司购买。 (尽管我根本不知道)。
关于audio - 自动转录软件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1275695/