html - HTML 5 元素的允许内容和内容类别的文本表

标签 html specifications w3c

MDN HTML element reference页面列出有关每个元素的信息,包括:

  • 内容类别
  • 允许的内容
  • 标签遗漏

是否有从中导出的结构化文本文件?或者包含等效信息?

我找到了一个 appendix in the HTML 5 spec其中列出了类别和子项(根据隐藏良好的评论,明显 内容除外)和 a later table收集一些明显的东西。这很好,但我不想尝试抓取供人类使用的数据。


我问是因为我有 some code维护 ElementContainmentRelationships 是从规范的旧版本手工派生的。

我希望能够更轻松地跟踪规范,因此理想情况下是一些与 UCD Property Files 等效的 HTML -- 用于机器处理的表格数据。

我知道关于解析的 HTML5 一章有很多注意事项和特殊情况,但我正在寻找大部分正确并跟踪规范的内容。

最佳答案

MDN 引用是手工制作的。 CSS 数据最近被转换为机器可读格式(参见 https://github.com/mdn/data ),团队愿意以这种格式提供更多 MDN 数据,但他们的资源有限,所以我不会抱太大希望。

我不确定您是否知道 HTML 解析器的 Firefox/Gecko 实现是从 Java 实现 (The Validator.nu HTML parser) 转换而来的,它可能会有所帮助,尽管快速浏览没有找到任何表格您正在寻找的内容。

还有RNG schemas for HTML5作为同一验证器项目的一部分提供。

关于html - HTML 5 元素的允许内容和内容类别的文本表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41110211/

相关文章:

html - 如何将多个 CSS 文件编译成一个 zip/tar 文件并将它们包含在 HTML 页面标记中?

javascript - 我怎样才能改变我的按钮而不是将div从可见更改为不可见,而是做相反的事情?

html - 使图像尊重字体大小属性?

specifications - 如何确定光流所需的处理器速度?

html - 当悬停另一个元素时使一个元素可见

c# - 规范模式和性能

thrift - Thrift 格式规范在哪里?

HTML:文本是否需要符合标准的容器元素?

security - 存在“strict-dynamic”,因此禁用了基于主机的白名单

html - 哪些是标准的 W3C 元标记?