挑选出我通过 HttpClient4 从 Apache 和 Java 发出的请求获得的 Html 页面的一部分的最佳方法是什么?具体来说,我需要一个表格(它的内容)。
解释、示例或链接会很棒。
最佳答案
您可以做的是从响应中创建一个 DOM 对象,因为它应该是一个有效的文档。
做类似的事情
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(/* your input stream from response */);
Element tableElement = document.getElementById("the-table-id");
关于java - 如何只获取HTML页面的一部分?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6035109/