python - 自动 XSD 验证

标签 python xml lxml libxml2

根据 lxml 文档“DTD 是根据已解析文档的 DOCTYPE 自动检索的。您所要做的就是使用启用了 DTD 验证的解析器。”

http://lxml.de/validation.html#validation-at-parse-time

但是,如果您想根据 XML 架构进行验证,则需要明确引用一个架构。

我想知道为什么会这样,并且想知道是否有可以执行此操作的库或函数。甚至解释如何自己实现这一目标。问题是似乎有很多方法可以引用 XSD,我需要支持所有这些方法。

验证不是问题。问题是如何确定要验证的模式。理想情况下,这也可以处理内联模式。

更新:

这是一个例子。

简单测试.xsd:

<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified">
  <xs:element name="name" type="xs:string"/>
</xs:schema>

简单测试.xml:

<?xml version="1.0" encoding="UTF-8" ?>
<name xmlns="http://www.example.org"
  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
  xsi:schemaLocation="http://www.example.org simpletest.xsd">foo</name>

我想做如下的事情:

>>> parser = etree.XMLParser(xsd_validation=True)
>>> tree = etree.parse("simpletest.xml", parser)

最佳答案

我有一个包含 100 多种不同模式和 xml 树的项目。为了管理所有这些并验证它们,我做了一些事情。

1) 我创建了一个文件(即 xmlTrees.py),我在其中创建了每个 xml 的字典和与之关联的相应模式,以及 xml 路径。这使我可以在一个地方获取 xml 和用于验证该 xml 的模式。

MY_XML = {'url':'/pathToTree/myTree.xml', 'schema':'myXSD.xsd'}

2) 在项目中我们有同样多的命名空间(很难管理)。所以我所做的是再次创建一个文件,其中包含 lxml 喜欢的格式的所有 namespace 。然后在我的测试和脚本中,我总是会传递命名空间的超集。

ALL_NAMESPACES = {
    'namespace1':  'http://www.example.org',
    'namespace2':  'http://www.example2.org'
}

3) 对于基本/通用验证,我最终创建了一个我可以调用的基本函数:

    def validateXML(content, schemaContent):

    try:
        xmlSchema_doc = etree.parse(schemaContent);
        xmlSchema = etree.XMLSchema(xmlSchema_doc);
        xml = etree.parse(StringIO(content));
    except:
        logging.critical("Could not parse schema or content to validate xml");
        response['valid'] = False;
        response['errorlog'] = "Could not parse schema or content to validate xml";

    response = {}
    # Validate the content against the schema.
    try:
        xmlSchema.assertValid(xml)
        response['valid'] = True
        response['errorlog'] = None
    except etree.DocumentInvalid, info:
        response['valid'] = False
        response['errorlog'] = xmlSchema.error_log

    return response

基本上任何想要使用它的函数都需要将 xml 内容和 xsd 内容作为字符串发送。这为我提供了最大的灵 active 。然后我将这个函数放在一个文件中,我的所有 xml 辅助函数都在这个文件中。

关于python - 自动 XSD 验证,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9843898/

相关文章:

python - 在 Pycharm (Ubuntu 16) 中使用 Tensorflow virtualenv 时出错

python - 在 OR 工具 pywrapcp 中遇到 DLL 错误

python - 如何在opencv中捕获图片

Python SFTP - 命令 'arm-linux-gnueabihf-gcc' 失败,退出状态为 1

c# - 如何在我的 Visual Studio 2012 项目中引用 XML 文件作为项目代码中的数据源?

java - 图像在 Android 上无法正确调整大小

python - 在 python 中使用 lxml 创建元素时出现 "Invalid tag name"错误

python - 有没有一种更Pythonic的方式来使用lxml访问父元素的子元素

xml - xsd -xml 正则表达式验证不适用于使用 JAXB 的我

python - 带有 POST 的 flask 示例