java - 如何获取维基词典页面的 Html 源?

标签 java mediawiki wiki wiktionary

我正在努力使用 Wiki Api。我如何使用 API 简单地获取页面 html。我知道这是可能的,因为我以前做过,但我不记得该怎么做。

假设我想要页面 http://en.wiktionary.org/wiki/bicycle 的页面源代码我该怎么做。我使用什么API。我不想在浏览器中查看?

最佳答案

使用 Java 和 Jsoup你可以这样做:

Document document = Jsoup
        .connect("http://en.wiktionary.org/wiki/bicycle")
        .get();

Element bodyContent = document.select("div#bodyContent").first();

System.out.println(bodyContent.html());

关于java - 如何获取维基词典页面的 Html 源?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16254480/

相关文章:

java - 在 ubuntu 终端中运行在 eclipse 包结构中创建的 java 应用程序

java - AWS Step Functions 如何处理工作线程/Activity 竞争条件?

java - 在 spring 上下文中通过类路径引用文件

mysql - 如何减小 MediaWiki 'text' 表的大小

mediawiki - 通过 wiki 页面上的下拉框导航 Mediawiki 类别页面

node.js - node-webkit 上的 TiddlyWiki 不显示内容

java - 即使在没有 READ_CALL_LOG 的情况下上传了更新的 APK,权限声明表仍然显示在 Google Play 控制台中

php - 如何获取复杂的维基百科模板的结果?

hadoop - 从维基百科加载 30000 个文档

python - 改变分解分布以匹配更多的聚合水平分布