python - 有人解析过维基词典吗?

标签 python web-services dictionary wiktionary

Wiktionary是一个涵盖多种语言的维基词典。它甚至有翻译。我有兴趣解析它并使用数据,以前有没有人做过这样的事情?有没有我可以使用的图书馆? (最好是 Python。)

最佳答案

我曾经下载过一个维基词典,试图收集斯拉夫语言的单词和定义。我使用 elementtree 通过作为转储的 xml 文件来接近它。我会避免尝试抓取或抓取该站点,而只需下载 wikimedia 为维基词典提供的 xml 转储。转至wikimedia downloads ,查找英语维基词典转储 (enwiktionary) 并转到最近的转储。您可能需要 pages-articles.xml.bz2 文件,它只是文章内容,没有历史记录或评论。使用您在 python 中喜欢的任何 xml 处理库来解析它。我个人更喜欢元素树。祝你好运。

关于python - 有人解析过维基词典吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3364279/

相关文章:

python - rfile.read() 是如何工作的?

python - Python : bound, 未绑定(bind)和静态中的类方法差异

java - 在 CloudBees 上部署 NetBeans JAXWS

python - FFMPEG python检查字典键是否存在

typescript - 如何对键是类且值是这些类的实例的 Map 进行类型提示?

c++ - 在 map 的 map 中查找值并返回主 map 的键(或替代键)

python - 无法在 pynput 中选择文本

python - Cartopy map 可视化错误: unknown projection

asp.net - 使用asp.net发送20,000多个电子邮件

asp.net - 超出 JavaScriptSerializer.MaxJsonLength。处理这个问题的最佳做法是什么?