我有一个 html 文件,里面有这个:
<div id="date">Saturday 04.08.18<br><div id="time">23<img src="media/images/sec.gif">59</div></div>
我想从 html 文件中删除这个完整的元素,但值每分钟都在变化(因为是时间)
我试过这个从另一个人那里编辑的命令,但它不起作用。
sed -z -r -i 's#<div id="date">[^<]*</div></div>\n?##g' 1.htm
我认为这可能行不通,因为元素中开始了另一个 html 元素?
最佳答案
一种可能的解决方案如下:
sed -r -e 's#<div id="date">.*</div></div>\n?##g' 1.htm
它所做的基本上是用空字符串替换包含 div
标记和 date
id 的行,后跟大于零(或等于)的字符,以两个结束的 div 标签,加上一个换行符
关于linux - 使用 sed 删除从特定 HTML 字符串到特定字符串的所有内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51688826/