我正在使用 Cobra 解析引擎,我希望获取已解析页面的 HTML 代码(例如,在 javascript 执行之后)。可以做吗?如果需要,Cobra 可以替换为另一个开源 Java Web 解析器。
最佳答案
哇,Cobra 似乎真的做到了:Example of Usage
它实际上为您提供了一棵 HTML DOM 节点树。您可以使用HTMLWriter如果您愿意,可以获取 HTML 文本,但如果您对其中的某些特定部分感兴趣,请使用 XPath,它比在 HTML 字符串中搜索要干净得多。
关于java - 已解析页面的 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3855383/