java - 维基百科解析器

标签 java mediawiki nlp nsxmlparser wikipedia

我下载了维基百科转储,我想将维基格式转换为我的对象格式。是否有可用的 wiki 解析器将对象转换为 XML?

最佳答案

参见 java-wikipedia-parser .我从未使用过它,但根据文档:

The parser comes with an HTML generator. You can however control the output that is being generated by passing your own implementation of the be.devijver.wikipedia.Visitor interface.

关于java - 维基百科解析器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3888063/

相关文章:

javascript - JS : Failed to execute 'getComputedStyle' on 'Window' : parameter is not of type 'Element'

php - 我怎样才能强制 MediaWiki 尊重单行中断?

mysql - 使用 MediaWiki 软件 - 如何在 MySQL 中将页面标题的长度从 255 字节更改为无限长?

python - 当我尝试导入 TextBlob 时,我得到 "ImportError: cannot import name compat"。这是什么意思?我该如何修复它?

java - java中的快速语义角色标记工具

java - 它对于 boolean 值的两个值都给出 true 。如何改进代码?

java - Xerces 在 SUN JRE v1.5 和 IBM J9 v1.5 上的行为不同

Java:更新信息的最佳实践

java - 完美数字 1 到 n

nlp - NLP中下游任务的定义