java - 从网站扫描数据

标签 java android web

我只是想知道是否可以使用扫描仪从网站读取数据。它不一定是文本网页,但有图片,可点击链接等。所以我怎么能只扫描文本而不扫描其他任何东西。这是一个应用程序,我会阅读可能会更改的名称。这就是为什么我想从网站上阅读它们而不是制作我自己的文本文件并以这种方式阅读。任何帮助都会很棒。谢谢

最佳答案

你应该使用 jsoup为了它。使用此工具可以轻松解析 HTML 页面。

您可以获得 HTML 文档并可以遍历这里提到的元素:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");

入门指南简单易学:

Getting started with JSoup

关于java - 从网站扫描数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16869132/

相关文章:

java - 标准 Java EE 目录结构与标准 Java EE 目录结构Intellij目录结构

java - 使默认的android模拟器更快

android - 更改抽屉导航项目语言

c# - 使用 Awesomium(与 WPF)有什么缺点?

c# - 通过C#登录网站

java - 对 map 中的对象进行分组

java - Jax-rs json漂亮的输出

java - 客户端扫描HDFS群集的内存并报告已用空间百分比

android - Gradle git 依赖项

javascript - ElectronJS。设置窗口名称或确定哪个窗口发出事件