这是原始数据,我需要每年所有变量的平均值。
但是当我使用 groupby('year')
命令时,它会删除除“lnmcap”和“epu”之外的所有变量。
为什么会发生这种情况以及需要做什么?
最佳答案
可能其他列的数据类型是对象或字符串类型,而不是整数,因此只有 'Inmcap'
和 'epu'
获得了平均列。
使用ds.dtypes
或简单地ds.info()
检查列中数据的数据类型
它是对象/字符串类型,然后使用
ds=ds.drop('company',axis=1)
column_names=ds.columns
for i in column_names:
ds[i]=ds[i].astype(str).astype(float)
这可行
关于python - 按年份分组删除一些变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72414861/