Java 中是否有一种方法可以向网页发出 HTTP 请求,而响应将只是我想要的一些特定元素而不是整个文档?
例如,如果我要请求 <div>
称为 "example"
,响应将只是该元素,而不是页面上存在的其余内容,我不需要。
我看过的大多数方法都涉及获取整个 HTML 页面然后对其进行解析。我想查看页面,然后取出我想要的 div,只将其作为响应。我正在处理的页面包含很多我想忽略的广告内容。
最佳答案
那是不可能的。 Web 的工作方式是您向页面发送 HTTP GET 请求,然后它返回整个页面。你用它做什么(解析等)取决于你,但你对 HTTP 协议(protocol)没有影响。
但是,如果您使用自己实现的自定义服务器/API 托管网页,则可以实现这一点。您可以发送带有特定参数的请求,指定您需要什么,它可以解析 html 页面服务器端。
关于只返回我想要的某些元素的Java Http请求,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31405432/