xml - 博客文章标签和类别的 HTML5 语义标记

标签 xml html metadata schema.org

许多博客使用“标签”和“类别”的概念将元数据添加到帖子中。此信息的语义标记的最佳做法是什么,以便阅读博客文章的机器可以轻松识别标签?

目前我将 "tag" 添加到链接的 rel 属性中,例如

<a rel="tag" class="tag" href="/tags.html#site-configuration">#site-configuration</a>

我想可以使用 Dublin Core 的 html 格式作为关键字:

<meta name = "DC.Subject"
          content = "site-configuration">

并将其添加到页眉,或者元标记可以放在正文中吗?是一个或另一个更可取,还是一些完全不同的选择?

在为内容提供精确和标准化的定义方面是否有更好的策略?

如果我想对元数据如此挑剔,HTML5 是一个合理的选择,还是我应该使用 XML 文档类型?

不同方法的优缺点是什么?

最佳答案

第一步将是在语义上正确获取/使用纯 HTML。对于 (X)HTML5,您应该使用分段内容元素 sectionarticleasidenav< 构建适当的大纲,并使用headerfooter将元数据内容与主要内容分开;还要考虑内联级语义,如 time(发布日期)、dfn(定义)、abbr(缩写/首字母缩略词)等。并制作使用规范中定义的 meta-namerel 值。

第二步将使用未在规范中定义但已在指定位置注册(因此它们可以有效使用)的元数据属性值,例如 name keywords for meta elementsrel values for a/area/link elements .

第三步是用语义的、机器可读的注释来增强标记。有three common ways to do this :

  • 微格式(使用预定义的 classrel 值)
  • RDFa(使用属性和 URI)
  • 微数据(使用属性和 URI)

RDFa 和微数据相似(都可扩展且相当复杂),而微格式更简单(但表现力/可扩展性不强)。我写了一个short answer在程序员那里了解差异,以及关于 differences between Microdata and RDFa 的更详细的答案.

对于 RDFa 或微数据,您的主要工作是找到能够描述/分类您的内容的词汇表/本体。每个人都可以创建这样的词汇表(你甚至可以自己创建一个),但通常建议使用众所周知/流行的词汇表,例如这样搜索引擎就可以使用你的注释(流行的例子:Schema.org)。

对于微格式,您必须找到适合您需要的微格式(在 wiki at microformats.org 上)。如果没有适合您的情况,您可以提出一个新的微格式(但这需要一些时间才能被“接受”,如果有的话)。


Is HTML5 a reasonable choice if I want to be so picky about metadata, or should I be using an XML doctype?

如果您需要/想要 XML 支持,您也可以使用 XHTML5。如果您“仅”使用规范中定义的 (X)HTML 而没有额外的 XML 模式/词汇表,那么从语义的角度来看,使用 HTML(5) 或 XHTML(5) 并不重要。

关于xml - 博客文章标签和类别的 HTML5 语义标记,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12866008/

相关文章:

java - 配置中的 Struts2 {}

javascript - 鼠标移出事件在 JavaScript D3 中无法正常工作

html - 垂直居中表单内容

javascript - 如何在:run after tests finish execution之后触发cypress

metadata - 使用条件随机字段进行命名实体识别

xml - <plugins> pom xml 中无法识别的标记

xml - UPnP 和 SOAP 到路由器

jquery - 做一个圆形的进度条

google-apps-script - 无法将DeveloperMetadata 添加到行

c# - 从 XML 读取值