html - 如何整洁地从 HTML 中删除所有属性和类?

标签 html linux utility tidy

我有很多 HTML 文件,例如:

<P class=MsoNormal style="MARGIN: 0cm 0cm 0pt">some text</P>
<TABLE class=MsoNormalTable style="BORDER-RIGHT: windowtext 1pt solid;" cellSpacing=0 cellPadding=0 width=568 border=1>
<TR style="HEIGHT: 12.75pt; mso-yfti-irow: 0; mso-yfti-firstrow: yes">
<TD style="BORDER-RIGHT: windowtext 1pt solid;" width=357 colSpan=2>text td</TD>
</TR>
</TABLE>

我需要从中删除所有属性和类,所以我得到:

<P>some text</P>
<TABLE>
<TR>
<TD>text td</TD>
</TR>
</TABLE>

我尝试过使用不同选项(drop-proprietary-attributes、word-2000)的 tidy 实用程序,但无法获得干净的代码。

最佳答案

这将删除所有 MS 样式:

tidy --word-2000 true --bare true -o output.html input.htm 

我使用“HTML Tidy for Linux version 5.1.25”

关于html - 如何整洁地从 HTML 中删除所有属性和类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35671329/

相关文章:

html - CSS 将表格列转换为全 Angular 堆叠元素

linux - 如何使用 UEFI 备份笔记本电脑 SSD

linux - 如何修复/usr/bin/env agrument 处理?

java - 需要类似 getTotal(ClassName, ListOfObjectsOfClass, numericFieldOfClass)

html - 我怎样才能隐藏第二个td?

javascript - 如何在 Javascript/Angular JS 中四舍五入——但删除无关紧要的数字

javascript - 在输入值中设置图像

c# - 无法将 dotnet 应用程序作为守护程序服务执行

linux - 如何使用 meld 比较不同目录中的两个同名文件(不给出路径)?

java - java/android 中的时间 + 应用程序崩溃