Python遍历多个文件

我有一系列格式如下的文件:

file_1991.xlsx
file_1992.xlsx
# there are some gaps in the file numbering sequence
file_1995.xlsx
file_1996.xlsx
file_1997.xlsx

对于每个文件我想做这样的事情:

import pandas as pd
data_1995 = pd.read_excel(open(directory + 'file_1995', 'rb'), sheetname = 'Sheet1')

对数据做一些处理，并将其保存为另一个文件:

output_1995 = pd.ExcelWriter('output_1995.xlsx')
data_1995.to_excel(output_1995,'Sheet1')

我如何遍历多个文件并在多个文件中重复相同的操作，而不是对每个文件都执行所有这些操作？换句话说，我想遍历所有文件(它们大多遵循名称中的数字序列，但序列中存在一些间隙)。

提前感谢您的帮助。

最佳答案

您可以使用 os.listdir或 glob列出目录中所有文件的模块。

有了os.listdir，你可以使用fnmatch像这样过滤文件(也可以使用正则表达式)；

import fnmatch
import os

for file in os.listdir('my_directory'):
    if fnmatch.fnmatch(file, '*.xlsx'):
        pd.read_excel(open(file, 'rb'), sheetname = 'Sheet1')
        """ Do your thing to file """

或者使用 glob 模块(它是 fnmatch + listdir 的快捷方式)，你可以像这样(或使用正则表达式)做同样的事情:

import glob
for file in glob.glob("/my_directory/*.xlsx"):
    pd.read_excel(open(file, 'rb'), sheetname = 'Sheet1')
    """ Do your thing to file """

关于Python遍历多个文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42499498/

上一篇：oracle - Windows 的 ins-32025 oracle 11g 错误

下一篇：list - 为什么这个删除 Haskell 中的重复函数有两个参数而不是一个？

相关文章：

python - numpy.gradient 函数的反函数

python - Ajax调用不调用Django中的 View 函数

VBA:带有 INDEX MATCH 的循环不会转到下一个值

c# .net xpath 遍历时不挑选元素

javascript - 单击子元素时 react 获取父元素的状态/数据

python - 我应该使用评估生成器还是评估来评估我的 CNN 模型

python - Pydrive google drive 自动认证

java - 游程编码程序的数字在字母之前

java - 尝试随机掷两个骰子并将总和相加直至达到二十一

javascript - 如何找到二维数组中的所有路径？