machine-learning - 机器学习挑战: learn english pronunciation

标签 machine-learning phonetics

假设您想要 CMU's phonetic data set输入看起来像这样:

ABERRATION  AE2 B ER0 EY1 SH AH0 N
ABERRATIONAL  AE2 B ER0 EY1 SH AH0 N AH0 L
ABERRATIONS  AE2 B ER0 EY1 SH AH0 N Z
ABERT  AE1 B ER0 T
ABET  AH0 B EH1 T
ABETTED  AH0 B EH1 T IH0 D
ABETTING  AH0 B EH1 T IH0 NG
ABEX  EY1 B EH0 K S
ABEYANCE  AH0 B EY1 AH0 N S

(左边是单词,右边是一系列音素,key here)

您想将其用作机器学习系统的训练数据,该系统将接受新单词并猜测它们在英语中的发音。

至少对我来说这不是那么明显,因为没有固定的字母标记大小可以映射到音素。我有一种感觉,与马尔可夫链有关的事情可能是正确的选择。

你会怎么做?

最佳答案

该问题称为“字素到音素转换”,是 Natural Language Processing 的子问题。 。谷歌 brings up几篇论文。

关于machine-learning - 机器学习挑战: learn english pronunciation,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/673617/

相关文章:

r - 错误: unexpected string constant

machine-learning - 如何使用 Google Dialogflow 从标题中提取屏幕尺寸

python - 如何在 Python 中实现多词人名的拼音算法

algorithm - 如何检查字符串是否可以发音?

java - 印度语言的拼音搜索

algorithm - 字符串的聚类算法

python - XGBoost 错误 info.labels.size() != 0U (0 vs. 0)

machine-learning - 在 PyTorch 中使用 WeightedRandomSampler

perl - 给定一个输入词,如何生成发音相似的词列表?