我有一个看起来像这样的文件:
<HTML>
<HEAD>
< ... stuff ... ></HEAD>
< ... stuff ... >
</HTML>
我正在尝试删除 HEAD 标签之间(包括 HEAD 标签)的所有内容,但似乎无法正常工作。
我以为
sed -i -e 's/<HEAD>.*<\/HEAD>//g' file.HTML
应该可以,但它不会删除任何内容。
sed -i -e '/<HEAD>/,/<\/HEAD>/d' file.HTML
也不做任何事情。没有错误,什么都没有。
是我的输入文件有问题,还是有其他解决方法?
最佳答案
删除标签之间的所有行离开标签:
sed '/<tag>/,/<\/tag>/{//!d}' input.txt
删除标签之间的所有行,包括标签:
sed '/<tag>/,/<\/tag>/d' input.txt
要原地更改,请使用 sed -i ...
。在备份原始 sed -i.bak ...
时更改位置,这会将原始文件另存为 input.txt.bak
。
关于regex - 如何使用 sed(或类似工具)删除两个 html 标签之间的所有行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29530441/