基本上,我是一个网络团队的一员,该团队拥有一个在 CMS 中构建的网站 EasySite(拥有 3000 多个页面)。我想知道是否有工具或任何其他方法可以扫描每个页面中的 HTML 以查找特定标记(即 style="font-size:10px"
)。
很多人都从 MS Word 复制和粘贴内容,这显然也复制了格式。虽然它不会显示在桌面网站上,但会显示在移动/平板设备上。所以需要在所有当前页面上进行这种排序。
最佳答案
我会做以下事情:
- 在本地文件系统上镜像您的站点(例如使用
wget --mirror http://example.com
,参见 manpage of wget) - 使用您最喜欢的工具(Python 或 grep – 例如
grep -rn 'style="font-size:10px"' mirror_directory
)处理下载的文件以执行搜索
关于html - 特定 HTML 标签的网站扫描器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23013421/