我正在尝试从先前获取的 HTML 文档中获取 DIV 内容。我正在使用 Java Swing。
final java.io.Reader stringReader = new StringReader(html);
final HTMLEditorKit htmlKit = new HTMLEditorKit();
final HTMLDocument htmlDoc = (HTMLDocument) htmlKit.createDefaultDocument();
final HTMLEditorKit.Parser parser = new ParserDelegator();
parser.parse(stringReader, htmlDoc.getReader(0), true);
final javax.swing.text.Element el = htmlDoc.getElement("id");
这段代码应该得到一个ID为“id”的DIV,我在html中拥有它。 但接下来呢?如何获取div的内容?一直在搜索它,但我唯一发现的是如何获取属性值,而不是元素内容。
我应该转向 jsoup 吗?我宁愿使用 Java native ,但到目前为止我陷入困境。
谢谢!
最佳答案
not the Element contents.
尝试如下:
int start = el.getStartOffset();
int end = el.getEndOffset();
String text = htmlDoc.getText(start, end - start);
关于java - 使用 Java Swing 获取 DIV 内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59326474/