我正在尝试将 CSV 文件读入 pandas 数据框并选择一列,但不断出现关键错误。
文件读取成功,我可以在 iPython notebook 中查看数据框,但是当我想选择第一列以外的任何列时,它会抛出一个关键错误。
我正在使用这段代码:
import pandas as pd
transactions = pd.read_csv('transactions.csv',low_memory=False, delimiter=',', header=0, encoding='ascii')
transactions['quarter']
这是我正在处理的文件: https://www.dropbox.com/s/81iwm4f2hsohsq3/transactions.csv?dl=0
谢谢!
最佳答案
使用 sep='\s*,\s*'
以便您处理列名中的空格:
transactions = pd.read_csv('transactions.csv', sep=r'\s*,\s*',
header=0, encoding='ascii', engine='python')
或者,您可以确保 CSV 文件中没有未加引号的空格并使用您的命令(未更改)
证明:
print(transactions.columns.tolist())
输出:
['product_id', 'customer_id', 'store_id', 'promotion_id', 'month_of_year', 'quarter', 'the_year', 'store_sales', 'store_cost', 'unit_sales', 'fact_count']
关于python - 在 read_csv 之后选择 pandas 数据框中的列时出现关键错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35831496/