我有一个脚本,当前从 .csv 文件读取原始数据并对数据执行一些 pandas 数据分析。目前 .csv 文件是硬编码的,并且是这样读入的:
data = pd.read_csv('test.csv',sep="|", names=col)
我想改变两件事:
我想把它变成一个循环,这样它就可以遍历 .csv 文件目录,并在脚本中的每个文件下面执行 pandas 分析。
我想获取每个 .csv 文件并剥离“.csv”并将其存储在另一个列表变量中,我们称它为“new_table_list”。
我想我需要像下面这样的东西,至少对于第一点(虽然我知道这并不完全正确)。我不确定如何解决第二点
感谢任何帮助
import os
path = '\test\test\csvfiles'
table_list = []
for filename in os.listdir(path):
if filename.endswith('.csv'):
table_list.append(file)
data = pd.read_csv(table_list,sep="|", names=col)
最佳答案
很多方法可以做到这一点
for filename in os.listdir(path):
if filename.endswith('.csv'):
table_list.append(pd.read_csv(filename,sep="|"))
new_table_list.append(filename.split(".")[0])
还有一个
for filename in os.listdir(path):
if filename.endswith('.csv'):
table_list.append(pd.read_csv(filename,sep="|"))
new_table_list.append(filename[:-4])
还有更多
正如@barmar 指出的那样,最好将路径也附加到 table_list
以避免与文件和脚本的路径和位置相关的任何问题。
关于python - 从 read_csv 中提取文件名 - Python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50337843/