java - 已解析页面的 HTML

标签 java parsing cobra

我正在使用 Cobra 解析引擎,我希望获取已解析页面的 HTML 代码(例如,在 javascript 执行之后)。可以做吗?如果需要,Cobra 可以替换为另一个开源 Java Web 解析器。

最佳答案

哇,Cobra 似乎真的做到了:Example of Usage

它实际上为您提供了一棵 HTML DOM 节点树。您可以使用HTMLWriter如果您愿意,可以获取 HTML 文本,但如果您对其中的某些特定部分感兴趣,请使用 XPath,它比在 HTML 字符串中搜索要干净得多。

关于java - 已解析页面的 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3855383/

相关文章:

java - 有什么方法可以区分主线程和它产生的任何线程吗?

java - 如何使字体文本可点击?

go - Cobra 中的命名位置参数

Julia - 如何在 Julia 版本 0.6.4 中更新 WinRPM

go - 您可以为 Cobra 中的标志指定可选参数吗?

java - Android在新线程中每秒写入日志

java bluetooth 有限专用查询访问代码 (LIAC)

parsing - 如何在 Julia 中解析外部命令的输出?

java - BlackBerry OS 中的自定义日期解析

c - 将十六进制字符串表示形式解析为整数