java - 将 org.w3c.dom.Document 转换为 org.apache.html.dom.HTMLDocumentImpl

标签 java html apache parsing document

是否有办法将 org.w3c.dom.Document 的实例转换为 org.apache.html.dom.HTMLDocumentImpl。

我需要解析文档中的图像,并且 HTMLDocumentImpl 有一个提取图像的方法。

我尝试了多种方法,例如类型转换和 importNode,但它不起作用。

最佳答案

既然您说您尝试过强制转换,我假设您拥有的 Document 实例不是 org.apache.html.dom.HTMLDocumentImpl。有两件事可能值得一试:

1) getImages() 方法实际上是在接口(interface) org.w3c.dom.html.HTMLDocument 上定义的,该方法更有可能由您拥有的任何类型的 Dom 文档来实现。因此,您应该能够执行以下操作:

if (doc instanceof HTMLDocument) {
    images = ((HTMLDocument) doc).getImages();
}

2) 如果这不起作用,getImages()方法实际上不会做任何比以下更奇特的事情:

images = doc.getElementsByTagName("img");

关于java - 将 org.w3c.dom.Document 转换为 org.apache.html.dom.HTMLDocumentImpl,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3517607/

相关文章:

java - 如何用java制作扫描仪 block

java - 如何使用对象的字符串引用构建网格

java - 为什么 cd 命令不能使用 Java JSch?

javascript - 将 Javascript 注入(inject) Chrome 扩展中新创建的选项卡

php - CSS 类在 PHP 脚本后不起作用

apache - htaccess 重复重命名 php 文件

mysql - 如何在 Debian Docker 镜像中配置 PHP 7 - Apache 和 MySQL PDO 驱动程序?

java - 总结列表的每 N 个元素?

javascript - 在 JS 单击上添加边框后,填充使元素移动

php - CakePHP 缓存无法在 Centos 7 中写入