linux - 在 Linux 中从文本文件中删除 html 标签

标签 linux shell

如何删除所有 "<br />"来自 txt 文件。 我尝试过

sed -i 's/<br>/\n/g' test.txt > test.txt

但它不起作用

最佳答案

假设您想要删除“”和“”并将“\n”附加到该对包围的文本 block 中,您可能应该删除所有前者并仅将后者替换为“\n”。这个 sed 命令应该做到这一点:

sed -i -e 's|<b>||g' -e 's|</b>|\n|g' test.txt

如果您使用“-i”参数,我认为您不需要最终的输出重定向。

关于linux - 在 Linux 中从文本文件中删除 html 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50279154/

相关文章:

python - 尝试导入 pypyodbc 模块时出现错误 'ODBC Library is not found. Is LD_LIBRARY_PATH set?'

linux - 如何在不意外包含不相关进程的情况下匹配并终止特定进程?

linux - 如何在终端/控制台中的命令行旁边显示时间

shell - 来自 bash 脚本的操作系统系统调用

mysql - 无法远程连接到 MySQL

linux - conda 更新/安装现在在我的终端中附带大量文本

linux - 如何剪切部分 grep 值

linux - 在 Ubuntu 服务器 12.04.4 上编译 Node.js v0.11.12-release 错误

c++ - 在Windows下通过system()调用多个命令不起作用

linux - 如何找到隐藏文件