Java SAX 解析器验证

标签 java xml validation xsd sax

我正在使用带有自定义处理程序的 SAX 解析器来解析一些 XML 文件。到目前为止,这效果很好,但我想检查的不仅仅是给定文件的格式正确性,并通过 XSD 方案使用验证,该方案还包含可选属性的默认值。网上有很多关于这样做的教程,但我无法找到满足我所有限制的方法,如下所示:

-我事先不知道该方案,我有一堆 XML 和 XSD 文件,每个 XML 都包含有关它应该符合的 XSD 的信息

- validator 应更改处理程序获取的流,并在必要时插入来自 XSD 的可选属性的默认值

-应使用当前的自定义处理程序

我对这个主题相当陌生,所以我不能排除我在没有意识到的情况下偶然发现了该解决方案,但我目前对如何做到这一点完全感到困惑。

这是一个最小的 SSCCE,它应该显示问题和相关部分:

package parserTest;

import java.io.File;
import java.io.IOException;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import javax.xml.validation.TypeInfoProvider;
import javax.xml.validation.ValidatorHandler;

import org.w3c.dom.ls.LSResourceResolver;
import org.xml.sax.Attributes;
import org.xml.sax.ContentHandler;
import org.xml.sax.ErrorHandler;
import org.xml.sax.Locator;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

public class ParserTest
{
  public final static void main(String[] args)
  {
    //Initialize SAX parser
    final SAXParserFactory saxFactory = SAXParserFactory.newInstance();
    SAXParser saxParser = null;
    try
    {
      saxParser = saxFactory.newSAXParser();
    }
    catch(ParserConfigurationException confEx){confEx.printStackTrace();}
    catch (SAXException saxEx){saxEx.printStackTrace();}

    //Initialize Handler
    DefaultHandler saxHandler = new CustomHandler();

    ValidatorHandler vh = new ValidatorHandler()
    {
      @Override
      public void startPrefixMapping(String prefix, String uri) throws SAXException{}

      @Override
      public void startElement(String uri, String localName, String qName, Attributes atts) throws SAXException{}

      @Override
      public void startDocument() throws SAXException{}

      @Override
      public void skippedEntity(String name) throws SAXException{}

      @Override
      public void setDocumentLocator(Locator locator){}

      @Override
      public void processingInstruction(String target, String data) throws SAXException{}

      @Override
      public void ignorableWhitespace(char[] ch, int start, int length)throws SAXException{}

      @Override
      public void endPrefixMapping(String prefix) throws SAXException{}

      @Override
      public void endElement(String uri, String localName, String qName) throws SAXException{}

      @Override
      public void endDocument() throws SAXException{}

      @Override
      public void characters(char[] ch, int start, int length) throws SAXException{}

      @Override
      public void setResourceResolver(LSResourceResolver resourceResolver){}

      @Override
      public void setErrorHandler(ErrorHandler errorHandler){}

      @Override
      public void setContentHandler(ContentHandler receiver){}

      @Override
      public TypeInfoProvider getTypeInfoProvider(){return null;}

      @Override
      public LSResourceResolver getResourceResolver(){return null;}

      @Override
      public ErrorHandler getErrorHandler(){return null;}

      @Override
      public ContentHandler getContentHandler(){return null;}
    };

    vh.setContentHandler(saxHandler);

    //Do the parsing
    File input = new File("");
    try
    {
      saxParser.parse(input, saxHandler);
      //saxParser.parse(input, vh);       //<-- First attempt, gives me error message
      //saxParser.setContentHandler(vh);  //<-- Second attempt, but my parser does not seem to know this method
    }
    catch (IOException ioEx){ioEx.printStackTrace();}
    catch (SAXException saxEx){saxEx.printStackTrace();}
  }

  /*
   * This class is the handler to be used only by this class.
   */
  static private final class CustomHandler extends DefaultHandler
  {
    //Handle start of element
    public final void startElement(String namespaceURI, String localName, String qName, Attributes atts){}

    //Handle end of Element
    public final void endElement(String namespaceURI, String localName, String qName){}

    //Handle start of characters
    public final void characters(char[] ch, int start, int length){}
  }
}

最佳答案

基本原理是在 SAX 解析器和 ContentHandler 之间插入一个 ValidatorHandler

https://xerces.apache.org/xerces2-j/javadocs/api/javax/xml/validation/ValidatorHandler.html

ValidatorHandler vh = new ValidatorHandler();
vh.setContentHandler(originalContentHandler);
parser.setContentHandler(vh);

棘手的一点是,为了创建 ValidatorHandler,您需要知道正在使用什么模式。如何识别?如果它使用 xsi:schemaLocation 属性,那么您(可能)可以让 ValidatorHandler 自动选择它。如果它使用某种自定义机制,您可能必须“预先”读取(部分)源文件以发现架构,然后使用 ValidatorHandler 再次读取它。

您的 ContentHandler 将收到有关可选属性的默认值的通知。

关于Java SAX 解析器验证,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31325770/

相关文章:

java - 保存 xml 对象,以便元素在保存的 xml 文件中按排序顺序排列

java - 将 XML 转换为 Java 对象的最佳实践是什么?

regex - 什么是 ScaffoldColumn 和 RegularExpression 属性

regex - 基于GB且仅数字电话号码的正则表达式

java - Hazelcast - 通用 map 配置

java - ArrayList 循环打印 null

java - Eclipse Java 远程调试器在 VPN 上速度极慢

java - 如何导入jar apache commons cli

.net - 将 XSLT 应用于 ASP.NET 上的 XML

java - 如何配置 Jetspeed 用户密码验证