java - 已解析页面的 HTML

我正在使用 Cobra 解析引擎，我希望获取已解析页面的 HTML 代码(例如，在 javascript 执行之后)。可以做吗？如果需要，Cobra 可以替换为另一个开源 Java Web 解析器。

最佳答案

哇，Cobra 似乎真的做到了:Example of Usage

它实际上为您提供了一棵 HTML DOM 节点树。您可以使用HTMLWriter如果您愿意，可以获取 HTML 文本，但如果您对其中的某些特定部分感兴趣，请使用 XPath，它比在 HTML 字符串中搜索要干净得多。

关于java - 已解析页面的 HTML，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3855383/

相关文章：

java - 有什么方法可以区分主线程和它产生的任何线程吗？