Python Pandas 将计算写入新的 Csv 文件

标签 python python-3.x pandas

使用:Python 3.6、Pandas 0.22

我试图获取计算平均值的 DataFrame 的最后一行,并将其以特定格式写入新的 .csv 文件。

df2 = pd.read_csv("Data.csv")

gname = df2.groupby(['NAME'])

for NAME,  NAME_df2 in gname:
    df2['DATE'] = pd.to_datetime(df2['DATE'])
    df2.groupby([df2.DATE.dt.month,'NAME'])['SNOW'].mean().sort_values().to_csv('avg.csv')

这是我想要的 avg.csv 文件的输出:

NAME   MONTH    AVERAGE
    GRAND RAPIDS GERALD R FORD INTERNATIONAL AIRPORT, MI US January, 0.006451613

在我看来,逻辑应该是:

df2.groupby([df2.DATE.dt.month,'NAME'])['SNOW'].mean().sort_values().to_csv('avg.csv', columns = 'NAME', 'MONTH', 'AVERAGE')

我尝试在变量中创建月份和列标题“AVERAGE”以写入新文件,但这不起作用。我一直在搜索文档以测试更多内容,但找不到与此问题相关的任何内容。

或者尝试创建新列,但这不适用于将它们与“NAME”列链接:

df2 = df2.convert_objects(convert_numeric=True)
df['MONTH']='?'

最佳答案

(df
 .assign(MONTH=df['DATE'].dt.strftime('%B'))  # Use `%B` for full name of month
 .groupby(['NAME', 'MONTH'], as_index=False)['SNOW']
 .agg({'AVERAGE': 'mean'})  # Effectively renames the SNOW column to AVERAGE.
)

为了让月份按自然顺序排序,您可能需要使用 .strftime('(%m) %B') 这将导致 '(01) 一月', '(02 )二月'等

要将年份作为单独的列包含在内,您可以执行以下操作:

dates = pd.DatetimeIndex(df['DATE'])
(df
 .assign(MONTH=dates.dt.strftime('%B'),  # Use `%B` for full name of month
         YEAR=dates.dt.strftime('%Y'))
 .groupby(['NAME', 'YEAR', 'MONTH'], as_index=False)['SNOW']
 .agg({'AVERAGE': 'mean'})  # Effectively renames the SNOW column to AVERAGE.
)

关于Python Pandas 将计算写入新的 Csv 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48959301/

相关文章:

python - 如何从第 0 个元素开始向后重新排序 python 列表?

python - Apache Thrift Python 3 支持

python-3.x - 在 Python 3 中打印字节时强制转义可打印字符

python - Pandas 随机分配列名

python - 将 x,y 坐标放入 bin 中

python - 如何在 pandas 上自动构建多船长

python - 将默认参数传递给嵌套函数python

python - Python 中的 Hadoop 流作业失败(不成功)

python - Django 中的键错误。模板渲染期间

python-3.x - 如何在Python中从任意长度的嵌套字典中获取键