java - 在 XOM 中解析 XHTML 文档时出现 DTD 下载错误

我正在尝试解析声明使用的文档类型的 HTML 文档过渡性的dtd如下:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd ">

当我对文档执行 Builder.build 时，出现以下异常:

  java.io.IOException: Server returned HTTP response code: 503 for URL: http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd
       at sun.net.www.protocol.http.HttpURLConnection.getInputStream(HttpURLConnection.java:1305)
       at org.apache.xerces.impl.XMLEntityManager.setupCurrentEntity(Unknown Source)
       at org.apache.xerces.impl.XMLEntityManager.startEntity(Unknown Source)
       at org.apache.xerces.impl.XMLEntityManager.startDTDEntity(Unknown Source)
       at org.apache.xerces.impl.XMLDTDScannerImpl.setInputSource(Unknown Source)
       at org.apache.xerces.impl.XMLDocumentScannerImpl$DTDDispatcher.dispatch(Unknown Source)
       at org.apache.xerces.impl.XMLDocumentFragmentScannerImpl.scanDocument(Unknown Source)
       at org.apache.xerces.parsers.DTDConfiguration.parse(Unknown Source)
       at org.apache.xerces.parsers.DTDConfiguration.parse(Unknown Source)
       at org.apache.xerces.parsers.XMLParser.parse(Unknown Source)
       at org.apache.xerces.parsers.AbstractSAXParser.parse(Unknown Source)
       at nu.xom.Builder.build(Builder.java:1127)
       at nu.xom.Builder.build(Builder.java:1019)

如果我删除文档类型声明，它就可以正常解析。我可以从我的浏览器成功下载了 dtd，它告诉我网址有效。我不想删除文档类型声明。是有一种方法可以告诉构建者不要下载或提供 dtd 有备用的 dtd 吗？

最佳答案

这解决了问题:

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
            factory.setValidating(false);
            factory.setFeature("http://apache.org/xml/features/nonvalidating/load-external-dtd", false);
            Document document = factory.newDocumentBuilder().parse(is);

关于java - 在 XOM 中解析 XHTML 文档时出现 DTD 下载错误，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/998280/

java - 在 XOM 中解析 XHTML 文档时出现 DTD 下载错误

上一篇：java - 用于调试和错误的不同 log4j 布局？

下一篇：java - 仅在 Struts 1.x 中将 HTTP 请求限制为 'POST'