nlp - 为自定义语言设计 TTS(文本转语音)系统的工具包?

标签 nlp text-to-speech cmusphinx festival htk

我想为美国本土语言 (wayuunaiki) 创建一个 TTS 系统。 该语言以拉丁(西方)字母书写。 我还有有关语音的信息(将每个单词转换为国际音标符号的规则)。

我计划创建一个原住民录音数据库。然后我想以某种方式训练该数据,使用 IPA 等效信息来生成更准确的语音模型。

我对自然语言处理完全陌生,所以我的问题是..我可以使用哪些工具来执行我的计划?

我听说 HTK 和 CMU Sphinx 在语音识别方面相当出色。不知道语音生成。也听说过 Festival,但我读到它只使用预定义的最知名语言:英语、西类牙语等。

请原谅我的打字错误。我还在学英语。提前致谢!

最佳答案

您可以在 Festival 中添加新语言,它实际上是专门为简化新语言创建而设计的。有关更多详细信息,请阅读 festvox 书籍:

http://festvox.org/bsv/

另一个值得考虑的工具包是 OpenMary,也请参阅他们的文档

https://github.com/marytts/marytts/wiki/New-Language-Support

它更现代,对您来说可能更容易。

无论如何,您都必须花一些时间编写代码来描述您的语言。通常大约有 300 行代码。之后,您可以录制单说话者 TTS 数据库并运行语音构建过程。记录的越多,结果就越好。

关于nlp - 为自定义语言设计 TTS(文本转语音)系统的工具包?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22663629/

相关文章:

ios - 在iOS应用程序中使用音频文件或文本进行语音转换

c++ - 找不到 Sphinx Ubuntu 14 c++ sphinx_config.h

nlp - OpenAI API 和 GPT-3,不清楚如何访问或设置学习/开发?

nlp - 使用(NLP)门工具命名实体

python - 无法重新创建用于训练 FastText 的 Gensim 文档。类型错误 : Either one of corpus_file or corpus_iterable value must be provided

android - 安卓语音识别

python - NLTK:包错误?朋克和泡菜?

c++ - 如何获取Microsoft TTS语音的耗时?

java - 如何异步加载文本到语音