java - 从网站扫描数据

我只是想知道是否可以使用扫描仪从网站读取数据。它不一定是文本网页，但有图片，可点击链接等。所以我怎么能只扫描文本而不扫描其他任何东西。这是一个应用程序，我会阅读可能会更改的名称。这就是为什么我想从网站上阅读它们而不是制作我自己的文本文件并以这种方式阅读。任何帮助都会很棒。谢谢

最佳答案

你应该使用 jsoup为了它。使用此工具可以轻松解析 HTML 页面。

您可以获得 HTML 文档并可以遍历这里提到的元素:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");

入门指南简单易学:

关于java - 从网站扫描数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16869132/