python - 如何将具有重复值的新列插入到 pandas 表中?

标签 python pandas

<分区>

我是 Python 新手。我已经通过 pandas 抓取了一个 html 表格,我正在寻找插入具有重复字符串值的新列并将其设置为表格索引的方法(如下所示:)。提醒一下, table 很长:)。

原始 df:

Age IQ
12  100
15  111
 .   .
 .   .
 .   .
 .   .
13  121

预期的 df"

Group  Age IQ
 A     12  100
 A     15  111
 .      .   .
 .      .   .
 .      .   .
 .      .   .
 A     13  121

最佳答案

使用assign创建包含新列的数据框副本:

df.assign(Group='A')

   Age   IQ Group
0   12  100     A
1   15  111     A
2   13  121     A

之后你可以重新排列列

df.assign(Group='A')[['Group'] + df.columns.tolist()]

  Group  Age   IQ
0     A   12  100
1     A   15  111
2     A   13  121

但是,您可以使用 insert 就地编辑数据框.这样做的额外好处是允许您指定新列的位置。

df.insert(0, 'Group', 'A')

df

  Group  Age   IQ
0     A   12  100
1     A   15  111
2     A   13  121

关于python - 如何将具有重复值的新列插入到 pandas 表中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44657226/

相关文章:

python - 使用比特币 trezor 的 ssh 代理

python - 两列中的 pd.groupby sum() 函数不起作用

python - 在 Pandas (python) 中如何添加由两列引用的 groupby 的列

从 URL 下载 Python 2.7 csv

python - 日志记录:记录器不记录到文件,而是记录到控制台

python - 从单行 pandas DataFrame 中提取值

python - 如何在 Django 中使用带有 extra_context 的 redirect_authenticated_user

python - 如何在 Sympy 中求解非线性方程?

Python StatsModels 时间序列分解重复图

python - 从 pandas 数据框转换为 LabeledPoint RDD