只返回我想要的某些元素的Java Http请求

标签 java html http dom web-scraping

Java 中是否有一种方法可以向网页发出 HTTP 请求,而响应将只是我想要的一些特定元素而不是整个文档?

例如,如果我要请求 <div>称为 "example" ,响应将只是该元素,而不是页面上存在的其余内容,我不需要。

我看过的大多数方法都涉及获取整个 HTML 页面然后对其进行解析。我想查看页面,然后取出我想要的 div,只将其作为响应。我正在处理的页面包含很多我想忽略的广告内容。

最佳答案

那是不可能的。 Web 的工作方式是您向页面发送 HTTP GET 请求,然后它返回整个页面。你用它做什么(解析等)取决于你,但你对 HTTP 协议(protocol)没有影响。

但是,如果您使用自己实现的自定义服务器/API 托管网页,则可以实现这一点。您可以发送带有特定参数的请求,指定您需要什么,它可以解析 html 页面服务器端。

关于只返回我想要的某些元素的Java Http请求,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31405432/

相关文章:

java - 获取一个 XML 文件和一个 XSL 文件并从中生成一个 HTML 字符串?

java - 如何使用证书 pkcs7 签署 xml - Java

html - :last-child property not applied to element

html - 有没有办法检测 xslt 中的数字字符串?

html - 两个div上的一个div位置

delphi - 检测与 HTTP 服务器一起使用的 HTTP 客户端?

html - 如何使用我的结构显示 slice 中的表格

Java 停止服务器线程

java - Spring MVC 缺少静态资源

c# - 使用 Java 读取 REST 服务