我正在尝试使用新的 assignment expression第一次,需要一些帮助。
给定三行日志输出:
sin = """Writing 93 records to /data/newstates-900.03-07_07/top100.newstates-900.03-07_07/Russia.seirdc.March6-900.12.csv ..
Writing 100 records to /data/newstates-900.03-07_07/top100.newstates-900.03-07_07/India.seirdc.March6-900.6.csv ..
Writing 100 records to /data/newstates-900.03-07_07/top100.newstates-900.03-07_07/US.seirdc.March6-900.15.csv ..
"""
目的是仅提取国家
(俄罗斯、印度和美国)和记录数(93,100,100)。所以想要的结果是:
[['Russia',93],['India',100],['US',100]]
这需要将以下步骤转换为 Python:
- 将每一行转换为列表元素
- 按空格分割,例如
['写作', '93', '记录', '至', '/data/newstates-900.03-07_07/top100.newstates-900.03-07_07/Russia.seirdc.March6-900.12.csv', ' ..']
- 用“/”分割第五个这样的标记并保留最后一个元素:例如
Russia.seirdc.March6-900.12.csv
- 用“.”拆分该元素并保留第一个(第 0 个)元素,例如
俄罗斯
这是我的错误尝试:
import fileinput
y = [[ z[4].split('/')[-1].split('.')[0],z[1]]
for (z:=x.split(' ')) in
(x:=sin if sin else fileinput.input()).splitlines())]
最佳答案
对于它的值(value),您也可以使用正则表达式来获得它,这可能会更优选/更高效。
[list(reversed(l)) for l in re.findall(r'Writing (\d+).+\/([A-Z,a-z]+)\.', sin)]
或更准确地说(转换 int) 和可读性(根据评论中的 @chepner):
[[country, int(count)] for count, country in re.findall(r'Writing (\d+).+\/([A-Z,a-z]+)\.', sin)]
关于Python 3.8 列表理解中的赋值表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60606058/