python - 使用 Pandas Python 进行透视以获取 bool 值

标签 python pandas dataframe merge pivot

我有以下 csv:https://github.com/antonio1695/Python/blob/master/nearBPO/facturas.csv

我使用以下代码创建了一个数据框:

import pandas as pd
df = pd.read_csv("C:/Users/Antonio/Desktop/nearBPO/facturas.csv", encoding = "ISO-8859-1")
df_du = df.iloc[:,[0,5]]
dfv = df_du.groupby('UUID')['Desc'].apply(list)
df2 = dfv.reset_index()

*注意:我在本地获取 csv。

之后的代码如下所示:

    UUID                                       Desc
0   0019A60D-78F8-E341-8D3E-9786201FE017    [TRANSPORTACION DE PASAJEROS]
1   003B8B8F-7017-E441-8C84-8C0EA577E29D    [SERVICIO POR HORA]
2   00536BC1-1B10-4146-A59B-36613090EF10    [CONSUMO Y RENTA DE SALA DE JUNTAS]
3   005BBAEE-ABEC-E341-8CED-15DA22D11F65    [VERIFICACION HOLOGRAMA DOBLE CERO]
4   006C5F2E-CAE0-4498-9288-0241C1949D8A    [C Meg XT Clas CH, Com Whop Q CH, C Meg XT Cla...
5   0075D1FC-996D-4784-9755-2F4598D16163    [Consumo]

我想制作一个数据框,其中“Desc”列的每个元素作为一列,每个 UUID 作为一行,如果 UUID 中有相应的“Desc”,则其中我将有一个 1 (或 True) 。

我想要的示例:

UUID                                     Transportacion de pasajeros    Servicio por hora
0019A60D-78F8-E341-8D3E-9786201FE017     1                              0
003B8B8F-7017-E441-8C84-8C0EA577E29D     0                              1

我试图制作一个由 0 组成的矩阵,并用 if 来制作 1。之后我会合并它并旋转它。然而,由于一些“描述”是相同的,我不知道我应该做多大。它似乎在合并部分还存在许多其他缺陷。

最佳答案

你可以使用

pd.concat([df2['UUID'], df2['Desc'].str.join('___').str.get_dummies('___')], axis=1)

它返回类似这样的内容:

Out: 
                                   UUID  SERVICIO POR HORA  \
0  0019A60D-78F8-E341-8D3E-9786201FE017                  0   
1  003B8B8F-7017-E441-8C84-8C0EA577E29D                  1   

   TRANSPORTACION DE PASAJEROS  
0                            1  
1                            0  

关于python - 使用 Pandas Python 进行透视以获取 bool 值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38729448/

相关文章:

python - 导入 MySQLdb ImportError

python - 如何在python中生成特定范围内的n维随机变量

python - 使用 df.query() 从 DataFrame 中提取行

python - 将字典转换为数据帧,其中键和值都有自己的列

基于两种情况的Python pandas dataframe回填

python - 使用简单路径找不到 Django 页面

python - 子类不继承父类

python - 检查 header 是否存在于 Python pandas

r - 在 R 的数据框中有条件地分组值

Python Pandas : output dataframe to csv with integers