python / Pandas : create summary table

标签 python pandas dataframe pivot

在 python pandas 数据框“df”中,我有以下列:

user_id | song_id | song_duration | song_title | artist | listen_count

许多用户可能听过同一首歌 - 因此该歌曲在该表中不是唯一的。我想创建第二个仅包含歌曲信息的数据框(具有唯一的 song_ids)。

song_id | song_title | artist

我设法用 song_id 和 song_title 创建了一个表。

song_df = df.groupby('song_id').song_title.first()

我如何将“艺术家”列添加到其中?

这行不通:

song_df = df.groupby('song_id').df['song_title','artist'].first()

AttributeError: 'DataFrameGroupBy' object has no attribute 'df'

最佳答案

IIUC 尝试省略 .df:

df.groupby('song_id')['song_title','artist'].first()

关于 python / Pandas : create summary table,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37532525/

相关文章:

python - 在 Python 中正确地打破循环

python 如何查找从 2019 年 12 月开始并在两个日期列之间向前推进的每个月的天数

python - 如何将Dataframe中的字符串数据更改为数字?

codewars中的python解决方案could not pass time limit,需要优化

python - celery 周期性任务不起作用

python - 将数据框中某个值选择的行替换为数据框中某个值选择的另一行

python - Pandas :计算时间范围内的平均值

r - 变异重复第一行值

r - R:在数据帧或矩阵中使用t.test函数

Python XlsxWriter 图表 : x-axis value labels angle orientation