bash - 如何使用bash提取没有标签的网页源代码?

标签 bash curl tags extract wget

我们可以使用wgetcurl 下载页面的源代码,但我想提取没有标签的页面源代码。 我的意思是将其提取为文本。

最佳答案

您可以通过管道传输到一个简单的 sed 命令:

curl www.gnu.org | sed 's/<\/*[^>]*>//g'

关于bash - 如何使用bash提取没有标签的网页源代码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35777319/

相关文章:

bash - .bash_profile 带有变量的别名

linux - 如何在 unix 或 AWK 中执行以下 grep

php - 为什么curl返回null?

php - Symfony2 : no extension to load Buzz

java - 帮助使用 Java 和 Regex 从 html 标签中提取文本

bash - 查找 : Cannot chdir to directory error message after deleting directories

linux - Lynx的自动化

elasticsearch - 无法使用curl PUT进行Elasticsearch

html - 当我可以使用自己的标签时,为什么要使用 "class="?

iOS检测UIButton Press Dynamic索引