python - 跨行执行聚合函数(例如平均值)会产生 NaN

我正在使用爱荷华州艾姆斯的住房定价数据集，并遇到了一个我认为很简单的问题。

我根据年和月平均价格的数据透视表创建了一个数据框。我正在尝试计算平均每月价格。

当我这样做时，我得到 NaN 而不是 float 。

df_viz = pd.DataFrame(pd.pivot_table(df,index=['MoSold'], columns=['YrSold'],values=['SalePrice'],aggfunc='mean').to_records())
df_viz = df_viz.set_index(['MoSold'])
df_viz.columns = [hdr.replace("(", "").replace(")", "").replace("'","").replace(", ","") \
                     for hdr in df_viz.columns]
df_viz['mean_monthly_saleprice']=df_viz.mean(axis=0)
df_viz

什么给了？我该如何解决这个问题？

谢谢。

最佳答案

您可能指定了错误的轴。尝试:

df_viz['mean_monthly_saleprice']=df_viz.mean(axis=1)

<小时/>

至于为什么您的原始代码返回 na，df_viz.mean(axis=0) 按列生成平均值。结果是一个以列名作为标签的系列:

SalePrice2006    <a number>
SalePrice2007    <a number>
SalePrice2008    <a number>
SalePrice2009    <a number>
SalePrice2010    <a number>

然后，您尝试将该系列与标记为 MoSold 的 df_viz 数据框结合起来。两个索引之间没有匹配的标签。因此你的结果是 na。

故事的寓意:索引在数据框中非常重要。好好注意他们。

关于python - 跨行执行聚合函数(例如平均值)会产生 NaN，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60179036/

上一篇：python - 如何修改 Range 函数中边界值的包含/排除行为？

下一篇：python - pandas DataFrame 将代码或标签转换为分类

python - 从发电机外部控制发电机(networkx simple_cycles)

python - Pandas :DataFrame.mean() 非常慢。如何更快地计算列的均值？

python - 在 Pandas 中读取 csv 文件时出现 UnicodeDecodeError : 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte,

python - 在非 super 计算机上处理大量数据的一般技术

python - 没有迭代的 NumPy 中的累积计数

python - 修改函数内的 numpy 数组？

python - 根据条件将多列上的值替换为 nan

python - 将逻辑值与 pandas/numpy 中的 NaN 进行比较

javascript - 如何将 Kaggle 数据集添加到 elasticsearch 中？