编写可以验证 HTML 的 python 模块的最佳方法是什么,尤其是对于嵌入式 RDFa?我熟悉 validator.w3.org,并且我有兴趣编写一个执行类似功能的自定义验证器,但针对的是将 RDFa 用于元素元数据的不同标准。有哪些值得关注的源代码、值得试用的 Python 库以及需要牢记的事项?
最佳答案
埃米特,
我不确定你想要达到什么目的。我确实用 Python 编写了一个 RDFa 蒸馏器。您要问的第一个问题是您是要考虑 XHTML 还是 HTML5。如果是前者,周围有一堆 XML 环境,还有用于 RDFa 使用的 DTD-s。那行得通。对于 HTML5,您可能需要使用 HTML5 parser in Python但这并不“了解”RDFa,但它可以生成一个 DOM 树(或其他表示形式),然后您可以使用它来检查 RDFa 属性。但是请注意,HTML5 解析器不会执行针对各种可能的错误条件分析 HTML5 代码的“验证”;它只是根据 HTML5 规范生成一个 DOM 树。
希望对您有所帮助。
干杯
伊万
关于python - 在 Python 中验证 HTML/RDFa,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11146520/