我有一个 .txt 文件中以文件名结尾的 URL 列表 - 我需要提取该文件名。但是,反斜杠的数量和每个反斜杠之前的字符串在不同的 URL 中是不同的,例如:
https://www.something.com/something/somethingelse/file.zip
https://www.something.com/something/somethingelse/somethingnew/file2.txt
在我的 URL 中,somethingelse
和 somethingnew
都是常量(由于数据隐私协议(protocol),不能共享实际 URL),但将来可能会发生变化。以下代码适用于第一个 url,但不适用于第二个:
sed 's/^.*\/somethingelse\///g' in_file.txt > out_file.txt
是否有一个 sed
模式可以用来匹配最后一个反斜杠之后的所有内容 - 因此不需要字符串常量?
最佳答案
您可以使用 bash 中可用的 basename
命令,例如:
$ basename "https://www.something.com/something/somethingelse/file.zip"
$ file.zip
或者如果你真的想使用 sed:
sed 's#.*/##' in_file.txt > out_file.txt
关于bash - 使用 sed 从 URL 中删除最后一个反斜杠,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57558452/