我正在研究this数据集 我想要获得累计确诊病例,因此我按确诊病例进行筛选,按日期分组并按总和聚合。
import matplotlib.pyplot as plt
covid_tab=pd.read_csv('datasets/COVID-19 Cases.csv')
covid_tab['Date']=pd.to_datetime(covid_tab['Date'])
covid_tab.groupby(["Country_Region","Case_Type"]).agg({'Cases':'max'}).head()
cumulative_cases=covid_tab[covid_tab['Case_Type']=='Confirmed'].groupby('Date').agg({'Cases': 'sum'})
cumulative_cases.head()
我得到了这样的东西
但是,如果我尝试访问“日期”列,则会出现“键错误”,或者如果我尝试打印列名称,则只会打印“案例”
这是为什么?
最佳答案
日期在groupby方法之后被设置为索引。您可以使用reset_index()将其变成一列
covid_tab[covid_tab['Case_Type']=='Confirmed'].groupby('Date').agg({'Cases': 'sum'}).reset_index()
关于python - 为什么我在pandas中groupby后得到 'key error'?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60891602/