python - 如何使用python替换数据框中缺失的年份

标签 python pandas dataframe

我有另一种情况,用零替换缺失的年份和相应的列。 我的数据框看起来像这样,

Year   Churn_Count  Churn_Rate  Customer_Count                                        
2008       1071.0    0.800149             4114
2012          0.0    0.000000                6
2013        233.0    0.174075              824
2014        101.0    0.075458              410

我需要填补2008年到2014年之间缺失的年份,

例如, 2009,2010,2011 缺少如何在中间和对应的列中用零填充这些年份

最佳答案

使用set_index + reindex + reset_index:

df.set_index('Year').reindex(
   np.arange(df.Year.min(), df.Year.max() + 1), fill_value=0
).reset_index()

   Year  Churn_Count  Churn_Rate  Customer_Count
0  2008       1071.0    0.800149            4114
1  2009          0.0    0.000000               0
2  2010          0.0    0.000000               0
3  2011          0.0    0.000000               0
4  2012          0.0    0.000000               6
5  2013        233.0    0.174075             824
6  2014        101.0    0.075458             410

关于python - 如何使用python替换数据框中缺失的年份,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49332906/

相关文章:

r - 如何将修改后的行添加到R中的数据框?

python - 尝试在 pandas 数据框中跨行插值时出错

python 复制带有时间戳的文件

python - 将日期时间列拆分为单独的日期和时间列

python - 脚本很好,但不会作为导入的模块运行

python - 从 Pivot reshape 和选择 Pandas

R数据框按行列组合

python - 二叉搜索树中的值求和错误

python - 如何由于 Django 中的不活动而使 session 过期?

scala - Spark/Scala在多个列上使用相同的函数重复调用withColumn()