在 Linux shell 中,我试图从下载的 HTML 脚本文件中返回指向 JPG 文件的链接。到目前为止,我只到了这一点:
grep 'http://[:print:]*.jpg' 'www_page.html'
我不想使用“tr”、“cut”、“sed”等辅助命令...“lynx”没问题!
最佳答案
单独使用 grep 而不修改文件是可行的,但正如许多人在评论中指出的那样不推荐。
如果您可以稍微放宽您的要求,那么您可以使用 html tidy修改下载的 HTML 文件,使每个 html 实体都在一行上,这样正则表达式就可以像你想要的那样更简单,像这样:
$ tidy file.html|grep -o 'http://[[:print:]]*.jpg'
注意使用“-o”选项来 grep 只打印输入的匹配部分
关于linux - 尝试在 bash shell 环境中从下载的 html 页面中获取 'grep' 链接,而无需 cut、sed、tr 命令(仅 e/grep),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7592082/