每周我都会收到两个具有以下模式的文件。
EMEA_{sample}_Tracker_{year}_KW{week}
例如
EMEA_G_Tracker_2019_KW52.xlsx
EMEA_BC_Tracker_2019_KW52.xlsx
接下来的文件将如下所示
EMEA_G_Tracker_2020_KW1.xlsx
EMEA_BC_Tracker_2020_KW1.xlsx
占位符:
- 样本 = G 或 BC
- 年份 = 当前年份 [YYYY]
- 周 = 日历周 [0 - ~52]
唯一的更改是在占位符中进行的,其他所有内容都将保持不变。
如何从文件名中提取这些值并检查文件名是否具有此格式?
现在我只使用os.walk()
读取所有文件:
path_files = "Files/"
files = []
for (_, _, filenames) in walk(path_files):
files.extend(filenames)
break
最佳答案
如果filename
是您获得的文件的名称:
import re
result = re.match(r'EMEA_(.*?)_Tracker_(\d+)_KW(\d+)', filename)
sample, year, week = result.groups()
关于python - 验证 Python 中文件名的格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59820573/