根据 lxml 文档“DTD 是根据已解析文档的 DOCTYPE 自动检索的。您所要做的就是使用启用了 DTD 验证的解析器。”
http://lxml.de/validation.html#validation-at-parse-time
但是,如果您想根据 XML 架构进行验证,则需要明确引用一个架构。
我想知道为什么会这样,并且想知道是否有可以执行此操作的库或函数。甚至解释如何自己实现这一目标。问题是似乎有很多方法可以引用 XSD,我需要支持所有这些方法。
验证不是问题。问题是如何确定要验证的模式。理想情况下,这也可以处理内联模式。
更新:
这是一个例子。
简单测试.xsd:
<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified">
<xs:element name="name" type="xs:string"/>
</xs:schema>
简单测试.xml:
<?xml version="1.0" encoding="UTF-8" ?>
<name xmlns="http://www.example.org"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.example.org simpletest.xsd">foo</name>
我想做如下的事情:
>>> parser = etree.XMLParser(xsd_validation=True)
>>> tree = etree.parse("simpletest.xml", parser)
最佳答案
我有一个包含 100 多种不同模式和 xml 树的项目。为了管理所有这些并验证它们,我做了一些事情。
1) 我创建了一个文件(即 xmlTrees.py),我在其中创建了每个 xml 的字典和与之关联的相应模式,以及 xml 路径。这使我可以在一个地方获取 xml 和用于验证该 xml 的模式。
MY_XML = {'url':'/pathToTree/myTree.xml', 'schema':'myXSD.xsd'}
2) 在项目中我们有同样多的命名空间(很难管理)。所以我所做的是再次创建一个文件,其中包含 lxml 喜欢的格式的所有 namespace 。然后在我的测试和脚本中,我总是会传递命名空间的超集。
ALL_NAMESPACES = {
'namespace1': 'http://www.example.org',
'namespace2': 'http://www.example2.org'
}
3) 对于基本/通用验证,我最终创建了一个我可以调用的基本函数:
def validateXML(content, schemaContent):
try:
xmlSchema_doc = etree.parse(schemaContent);
xmlSchema = etree.XMLSchema(xmlSchema_doc);
xml = etree.parse(StringIO(content));
except:
logging.critical("Could not parse schema or content to validate xml");
response['valid'] = False;
response['errorlog'] = "Could not parse schema or content to validate xml";
response = {}
# Validate the content against the schema.
try:
xmlSchema.assertValid(xml)
response['valid'] = True
response['errorlog'] = None
except etree.DocumentInvalid, info:
response['valid'] = False
response['errorlog'] = xmlSchema.error_log
return response
基本上任何想要使用它的函数都需要将 xml 内容和 xsd 内容作为字符串发送。这为我提供了最大的灵 active 。然后我将这个函数放在一个文件中,我的所有 xml 辅助函数都在这个文件中。
关于python - 自动 XSD 验证,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9843898/