许多博客使用“标签”和“类别”的概念将元数据添加到帖子中。此信息的语义标记的最佳做法是什么,以便阅读博客文章的机器可以轻松识别标签?
目前我将 "tag"
添加到链接的 rel
属性中,例如
<a rel="tag" class="tag" href="/tags.html#site-configuration">#site-configuration</a>
我想可以使用 Dublin Core 的 html 格式作为关键字:
<meta name = "DC.Subject"
content = "site-configuration">
并将其添加到页眉,或者元标记可以放在正文中吗?是一个或另一个更可取,还是一些完全不同的选择?
在为内容提供精确和标准化的定义方面是否有更好的策略?
如果我想对元数据如此挑剔,HTML5 是一个合理的选择,还是我应该使用 XML 文档类型?
不同方法的优缺点是什么?
最佳答案
第一步将是在语义上正确获取/使用纯 HTML。对于 (X)HTML5,您应该使用分段内容元素 section
、article
、aside
和 nav< 构建适当的大纲
,并使用header
和footer
将元数据内容与主要内容分开;还要考虑内联级语义,如 time
(发布日期)、dfn
(定义)、abbr
(缩写/首字母缩略词)等。并制作使用规范中定义的 meta
-name
和 rel
值。
第二步将使用未在规范中定义但已在指定位置注册(因此它们可以有效使用)的元数据属性值,例如 name
keywords for meta
elements和 rel
values for a
/area
/link
elements .
第三步是用语义的、机器可读的注释来增强标记。有three common ways to do this :
- 微格式(使用预定义的
class
和rel
值) - RDFa(使用属性和 URI)
- 微数据(使用属性和 URI)
RDFa 和微数据相似(都可扩展且相当复杂),而微格式更简单(但表现力/可扩展性不强)。我写了一个short answer在程序员那里了解差异,以及关于 differences between Microdata and RDFa 的更详细的答案.
对于 RDFa 或微数据,您的主要工作是找到能够描述/分类您的内容的词汇表/本体。每个人都可以创建这样的词汇表(你甚至可以自己创建一个),但通常建议使用众所周知/流行的词汇表,例如这样搜索引擎就可以使用你的注释(流行的例子:Schema.org)。
对于微格式,您必须找到适合您需要的微格式(在 wiki at microformats.org 上)。如果没有适合您的情况,您可以提出一个新的微格式(但这需要一些时间才能被“接受”,如果有的话)。
Is HTML5 a reasonable choice if I want to be so picky about metadata, or should I be using an XML doctype?
如果您需要/想要 XML 支持,您也可以使用 XHTML5。如果您“仅”使用规范中定义的 (X)HTML 而没有额外的 XML 模式/词汇表,那么从语义的角度来看,使用 HTML(5) 或 XHTML(5) 并不重要。
关于xml - 博客文章标签和类别的 HTML5 语义标记,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12866008/