我们可以使用wget
或curl
下载页面的源代码,但我想提取没有标签的页面源代码。
我的意思是将其提取为文本。
最佳答案
您可以通过管道传输到一个简单的 sed 命令:
curl www.gnu.org | sed 's/<\/*[^>]*>//g'
关于bash - 如何使用bash提取没有标签的网页源代码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35777319/