open-source - 我在哪里可以获得带有结构化数据的英语词典?

标签 open-source resources phonetics

关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。












想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。

6年前关闭。




Improve this question




我想下载一本英文词典--不仅仅是 word list -- 采用结构化格式,例如 TXT、XML 或 SQL。

具体来说,我需要拼音发音词性 (不需要定义)。

令人惊讶的是,我在任何地方都无法在网上找到这个。 Wiktionary有货 for download ,但这只是 MediaWiki 文章本身。抓取所有文章并提取语音和词性将是一项巨大的练习。

这在任何地方都可用吗?我不介意付钱。

编辑:有几个人问我想做什么。我的迫切需要只是好奇心,例如“最常见的双音节动词是什么?”。最终,我希望成为一种工具,可以帮助您找到可用的域名,并通过将正确的词性与语音匹配的加分配对来实现。

注意:交叉发布于 English Language and Usage .

最佳答案

转至 http://www.speech.cs.cmu.edu/cgi-bin/cmudict您可以在 https://cmusphinx.svn.sourceforge.net/svnroot/cmusphinx/trunk/cmudict/ 找到发音词典的下载页面。

目前最新版本是 cmudict.0.7a。

这是我目前用于为 http://www.haikuvillage.com 实现音节计数器的方法。 .它在 Ruby 中,如果有帮助,我很乐意为您开源。

关于open-source - 我在哪里可以获得带有结构化数据的英语词典?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3794454/

相关文章:

open-source - 通过补丁或合并提案在启动板上提交错误修复?

Java HashMap 到矩阵

c++ - 尝试在 Visual Studio 2010 Pro SP1 中添加资源导致 C++ 项目出现 "The operation could not be completed. Unspecified error"消息

android - Android开源应用发送消息

javascript - 有没有开源的 JavaScript 解释器?

java - 为什么 getResource 为 NULL?

java - 获取 Hadoop 集群和作业统计信息

machine-learning - 波形比较

mysql - 如何检查一个字符串是否看起来是随机的,或者是人为生成的和发音的?