python - 更新 pandas groupby().last() 的列值

标签 python pandas lambda apply pandas-groupby

给定的数据框:

dfd = pd.DataFrame({'A': [1, 1, 2,2,3,3],
                    'B': [4, 5, 6,7,8,9],
                    'C':['a','b','c','c','d','e']
                   })

我可以使用

找到每个 A 组的最后一个 C 值
dfd.groupby('A').last()['C']

但是,我想将 C 值更新为 np.nan。我不知道该怎么做。方法如:

def replace(df):
    df['C']=np.nan
    return replace

dfd.groupby('A').last().apply(lambda dfd: replace(dfd))

不起作用。

我想要这样的结果:

dfd_result= pd.DataFrame({'A': [1, 1, 2,2,3,3],
                    'B': [4, 5, 6,7,8,9],
                    'C':['a',np.nan,'c',np.nan,'d',np.nan]
                   })

最佳答案

IIUIC,你需要loc。使用 tail

获取最后一个值的索引
In [1145]: dfd.loc[dfd.groupby('A')['C'].tail(1).index, 'C'] = np.nan

In [1146]: dfd
Out[1146]:
   A  B    C
0  1  4    a
1  1  5  NaN
2  2  6    c
3  2  7  NaN
4  3  8    d
5  3  9  NaN

dfd.loc[dfd.groupby('A').tail(1).index, 'C'] = np.nan 也应该没问题。

关于python - 更新 pandas groupby().last() 的列值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45846102/

相关文章:

python - Sqlalchemy 在尝试连接到 clickhouse 数据库时显示 "Code 516 Authentication failed"

python - 从字符串列表中仅提取每个字符串的数字?

python - 安装 python 模块 (pbr) 时出现问题

python - 如何将数据框拆分为两行,其中两列具有特定值?

python - 为什么 DataFrame.loc[[1]] 比 df.ix [[1]] 慢 1,800 倍,比 df.loc[1] 慢 3,500 倍?

python - 如果相关性大于 0.75,则从 Pandas 的数据框中删除该列

haskell - 推断 lambda 表达式的类型

c++ - 将匿名函数 (lambda) 保存为函数类型变量

c# - 在犀牛模拟中模拟 lambda

python - 规范化二维数组