我正在尝试对一个非常大的 Url 列表进行排序。列表包含 12 个 Mio 网址。每行 1 个 Url。 我想在新文件中过滤所有带有“=”(example.com/a.php?aaa=aaa)的网址。 之后,我很乐意从 Google、Bing、Facebook 等中删除 Urls。
我该如何解决这个问题?我正在使用 Linux 终端。
最佳答案
grep = urls.dat > urls-eq.dat
grep -v = urls.dat | egrep -v -i '\<(google|facebook|bing)\.(com|net)(/|$)' > urls-filtered.dat
关于linux - 对链接中包含 "="的所有 Url 的大 URL 列表进行排序并删除特定域,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41578202/