html - 最长和最短的 HTML 字符实体名称分别是什么?

标签 html regex xhtml web character-entities

<分区>

pipe 周围有一百万个备忘单,这些备忘单列举了不同理解程度的不同版本和 HTML 规范指定的字符实体。我不想相信他们中的任何一个,所以我想我会把它扔在这里,看看是否有人发布了更权威的答案。

那么,假设我想使用正则表达式匹配所有字符引用和实体。我将从 /&(?:#(?:x[0-9a-f]+|[0-9]+)|[a-z]{???,???});/我。但是什么会进入 ??? 呢?我可以想到长度为两个字符的实体,例如 ltgt,但是在 HTML 的任何规范中是否有单字母实体?同样,最长的实体是什么?最后,那些在 HTML 中表达文字字符的仅有的三种语法,除了直接输入它们之外,不是吗?

最佳答案

HTML5 中最长的是 ,而且没有单字母名称。

但请注意,命名实体引用并不像您想象的那样起作用。一些命名字符引用不以分号结尾,因此正则表达式不会削减芥末。

关于html - 最长和最短的 HTML 字符实体名称分别是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12566098/

相关文章:

html - 带虚线边框的 CSS3 六边形

html - 使用 Css 和 HTML 创建输入文本

html - 为什么 h2 没有出现在页面的任何地方?

html - 关键帧动画仅适用于 Internet Explorer

javascript - 如何在 HTML 文件中导入 EJS 文件

php - 如何添加http ://if it doesn't exist in the URL

ruby - 意外的正则表达式行为

Java正则表达式适用于两个字符串

XHTML 元描述和带有 lang 属性的关键字

javascript - 如何获取我的表单的 Javascript 错误函数以取消表单提交并插入错误消息?