linux - 需要脚本或软件一次修改很多html文件

标签 linux bash shell scripting replace

我在树结构中有大约 3400 个文件(大约 80% 是 html 文件)。

  1. 我需要修改每个 html 文件以删除

    样式和字体属性等旧内容并添加另一种样式。

  2. 我需要更改 html 中所有链接的根目录。例如在 href 属性处将/old/path/更改为/new/path。
  3. 我需要删除一些链接。例如指向 google.com 的链接需要删除,因此 <a href="http://www.google.com">as google said</a>应该只是“如谷歌所说”。

有没有什么软件可以帮我做这件事? 是否可以制作脚本?

我不知道如何编写脚本来让它工作,我认为这可能是最快的方法...有人想帮助我吗?

谢谢!

最佳答案

我会设置一个脚本来打开一个 HTML 文件,用可靠的 HTML 解析器解析它(BeautifulSoup 是一个很好的例子),然后以两种方式之一遍历它:在 SAX 模型中,编写表示重写规则或 DOM 模型目标的函数,将规则编写为 XPath 查询并在匹配的 DOM 节点上执行操作。

然后只需在所有 HTML 文件上运行脚本。

关于linux - 需要脚本或软件一次修改很多html文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8542005/

相关文章:

linux - 为从头组装运行三位一体

linux - 带 Shell 的 Qt 程序

linux - 无法使用 ssh 运行包含 * 的脚本

mysql - 如何在 MYSQL - Linux 中更改函数定义器?

linux - Bash 脚本重新获取文件

Linux bash 文件 : RENAME subdirs by count of files in them

linux - tail 和 grep 文件以及按 IP 地址的独特颜色

bash - 使用 sed 提取行范围

linux - Bash 脚本 - 检查用户是否登录

php - 无法正常启动XAMPP