html - 有没有有效的 html css 规范化器?

标签 html css normalize

<分区>

很久以前,我编写了一个样式“规范化程序”程序来扫描一大堆经典 ASP 页面的 ASP/HTML 代码(其中大部分最初是从 MS-Word 文档生成的,所以它们自然地散落着多余的样式表和大量的一次性样式)。样式标准化器生成了一组最小的样式表和样式以及一个新的“经过净化”的 asp/html 文档,因此经过净化的文档生成与原始文档完全相同的呈现输出(通过屏幕截图图像比较验证)。

我时不时地遇到对这样的程序的需求,并且正在考虑编写一个用于商业发布的想法。

我的谷歌搜索技能没有发现任何与此完全相同的东西(HTML:Normalize Perl 模块和 HTML Tidy 元素似乎只是清理标签)。

所以,我的问题是:

  1. 是否已经有这样的工具,商业的或其他的?
  2. 如果不需要,真的有人需要吗?
  3. 如果是这样,哪些特性让它真正值得?

例如#3,为一组页面收集基本样式表,或调整所有页面以使用给定的基本样式表;保留经典的 asp 命令,遵循#includes,保留 asp.net 嵌入式脚本等。越具体、越多越好。

例子:
带有嵌入式标签的旧 html

<html><head>
<title>title</title>
<style type='css/text'>
.cls1 { font-family: arial; font-size: 10px; font-weight: bold; }
</style>
</head>
<body>
<% somefunction() %>
<div class='cls1' style='font-size:10px;'>test div</div>
</body>
</html>

新的 html

<html><head>
<title>title</title>
<style type='css/text'>
.cls1 { font-family: arial; font-size: 10px; font-weight: bold; }
</style>
</head>
<body>
<% somefunction() %>
<div class='cls1'>test div</div>
</body>
</html>

请注意,div 上的样式已消失,因为它与类 cls1 是多余的

编辑:删除了“ sanitizer ”一词,因为我不关注 XSS 攻击或过滤评论中的输入,只是关注将大量临时样式和随机 CSS 类整合到一组最小的连贯样式表中。

最佳答案

好吧,我不能肯定地说这对所描述的一切都“有效”,但 Tidy 所做的不仅仅是清理标签。

参见 HTML Tidy Configuration Options ,尤其是与 Microsoft Word 相关的那些(例如 word-2000)

关于html - 有没有有效的 html css 规范化器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/299620/

相关文章:

javascript - 一次选择多个数组元素

html - 何时使用 <strong>、<em> 或 <mark>?

javascript - Three.js HTML 背景为clearColor

javascript - 如何将 URL trim/剥离为页面名称?

CSS - 我的 HTML 和 BODY 之间的空白

python - 箭袋 matplotlib : arrow with the same sizes

html - 无单位行高代替 rem 行高的好处

html - '»' 和 '✔' 之类的字符不会出现在 Firefox 中

jquery - IE9 动画期间的阴影伪像

python - matplotlib 中的标准化颜色映射到底发生了什么?