python - forwardfill结合python pandas中的计算(方法='ffill' * xyz)

标签 python pandas

我需要用一个计算来填充 NaN 空间,这取决于数据帧中的先前值 = df.我到目前为止是这样的:

df = pd.DataFrame({'a': [None] * 6, 'b': [2, 3, 10, 3, 5, 8]})
df["c"] =np.NaN

df["c"][0] = 1
df["c"][2] = 3

i = 1
while i<10:
    df.c.fillna(df.c.shift(i)*df.b,inplace=True)
    i+1

不幸的是,这个 while 循环的解决方案不起作用,对于 pandas 来说肯定是一个非常糟糕的解决方案。所以我正在寻找的是一种

df.c.fillna(method='ffill'*df.b,inplace=True)

我知道这也行不通,我只是认为这让我更清楚我在寻找什么。

在填充数据框之前它看起来像这样:

   b   c
0  2   1
1  3 NaN
2 10   3
3  3 NaN
4  5 NaN
5  8 NaN

期望的结果应该是这样的:

      b   c
0     2   1  # nothing filled in since data is set from df["c"][0] = 1
1     3   3  # fill in previous c * b = 1 * 3 = 3
2    10   3  # nothing filled in since data is set from df["c"][2] = 3
3     3   9  # fill in previous c * b = 3 * 3 = 9
4     5  45  # fill in previous c * b = 9 * 5 = 45
5     8 360  # fill in previous c * b = 45 * 8 = 360

所以基本上:如果没有可用数据,应该用计算来填充。

最佳答案

我想不出在单个循环中执行此操作的方法,这里的问题是你想要某种滚动应用,然后可以查看前一行,这里的问题是前一行更新将在 apply 完成之前无法观察到,例如以下工作,因为我们运行了 apply 3 次。这不是很好的海事组织:

In [103]:
def func(x):
    if pd.notnull(x['c']):
        return x['c']
    else:
        return df.iloc[x.name - 1]['c'] * x['b']
df['c'] = df.apply(func, axis =1)
df['c'] = df.apply(func, axis =1)
df['c'] = df.apply(func, axis =1)
df

Out[103]:
      a   b    c
0  None   2    1
1  None   3    3
2  None  10    3
3  None   3    9
4  None   5   45
5  None   8  360

关于python - forwardfill结合python pandas中的计算(方法='ffill' * xyz),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30641509/

相关文章:

python - 如何使用 XlsxWriter 将多种格式应用于一列

python - Python 中非本地语句的语法错误

python - 为什么 p 永远不会超过 2

python - Django 将 ForeignKey 指向现有关系表

python - 根据两列拆分数据框并对子组应用一些操作

pandas - pandas 使用哪种方法计算百分位数?

python - Pandas "fillna"忽略 "inplace=True"关键字

python - 增加窗口的滚动均值

python - C++ 中用户定义类的动态分配,都具有相同的公共(public)函数

python - 我总是收到在分配之前引用局部变量的错误!我该如何解决?