我有一个用 CSV 文件创建的 pandas 数据框。 数据框看起来像这样
srvr_name log_type hour
server1 impressionWin 18:00:00
server1 transactionWin 18:00:00
server2 impressionWin 18:00:00
server2 transactionWin 18:00:00
我想从中得到的是:
srvr_name impressionWin transactionWin hour
server1 true true 18:00:00
server2 true true 18:00:00
在 pandas 中实现这一目标的最佳方法是什么?
最佳答案
使用 join
和 get_dummies
df.join(pd.get_dummies(df.log_type)).groupby(['srvr_name', 'hour']).sum().astype(bool)
impressionWin transactionWin
srvr_name hour
server1 18:00:00 True True
server2 18:00:00 True True
关于python - 如何使用 pandas dataframe 对数据进行反规范化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50864475/