python - 从数据框中提取特征并将其转换为其他数据框?

标签 python arrays pandas dataframe

我有一个数据农场 (my_data:) 如下:

   my_data:        
                    0            ...              16
      TB1     [1, 5, 24, 1]      ...        [0, 0, 0, 31]
      TB2     [7, 4, 13, 1]      ...        [0, 0, 0, 25]
      TB3     [7, 6, 20, 0]      ...        [7, 4, 2, 20]
      ...       .......          ...          ........

可以看出,在每一列中都有一个数字列表,我在 my_data 中总共有 16 列,其中包含一个数字列表。现在,我想提取这些列表并将它们用作常规列。所以我想要的 my_data 应该是这样的:

   my_data:
             0  1  2   3  ...  60  61 62
      TB1    1, 5, 24, 1  ...  0,  0, 31
      TB2    7, 4, 13, 1  ...  0,  0, 25
      TB3    7, 6, 20, 0  ...  4,  2, 20
      ...       .......   ...   ........

有什么想法吗?

最佳答案

一个简单的方法是sum沿轴 1 构建一个新的数据框:

pd.DataFrame(df.sum(1).values.tolist(), index=df.index)

     0  1   2  3  4  5  6   7
TB1  1  5  24  1  0  0  0  31
TB2  7  4  13  1  0  0  0  25
...

关于python - 从数据框中提取特征并将其转换为其他数据框?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56004323/

相关文章:

python - 如何在 tensorflow 中使用 tf.while_loop()

c - 将数组类型转换为指针?

javascript - 创建备份阵列

python - 有没有办法在Python中将数据附加到Excel文件而不读取其内容?

python - 缩进错误: expected an indented block in python (using hard tabs)

python - 将列表中的相似词典合并在一起

python - 在 Selenium 中获取文件选择器对话框的 ID 或其他句柄

arrays - 将列表的 (m,m,n) 数组组合成一个 (m,m,n) 数组

python - 使用 Pandas 创建日期范围列表

python - 如何计算重复的 Pandas 数据框