python - 从 pandas 数据框中提取多列的组合

标签 python pandas dataframe

我有以下内容。 pandas 中的数据框:

df

DAY   YEAR    REGION   VALUE
  1   2000     A         12
  2   2000     A         10
  3   2000     A         13
  6   2000     A         15
  1   2001     A         3
  2   2001     A         40
  3   2001     A         83
  4   2001     A         95
  1   2000     B         124
  3   2000     B         102
  5   2000     B         131
  8   2000     B         150
  1   2001     B         30
  5   2001     B         4
  8   2001     B         8
  9   2001     B         12

如何创建一个新的数据框,其中包含结果中年份和区域的唯一组合?结果应如下所示:

YEAR   REGION
2000    A
2001    A
2000    B
2001    B

最佳答案

您可以从 df 中进行子选择,然后调用 drop_duplicates:

In [16]:
df[['YEAR','REGION']].drop_duplicates()

Out[16]:
    YEAR REGION
0   2000      A
4   2001      A
8   2000      B
12  2001      B

关于python - 从 pandas 数据框中提取多列的组合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34618778/

相关文章:

python - 错误 : draw_bounding_box() missing 2 required positional arguments: 'r' and 'd'

python - 如何提取文本中每个可能的日期?

r - 为什么 pivot_longer() 在其输出中只嵌套了四个整数值

python - 基于 pandas 数据框中的 2 列对多列进行排序

python - 在 Selenium chrome 浏览器中假装焦点

python - 未找到 eventlet.green.urllib2 模块

python - pandas 按时间智能索引

python - 当有多个变量时使用lambda在python数据帧中实现if-else

python - 使用 Pandas 读取csv文件时如何选择多行?

python - 从 scraperwiki 上的 beautifulsoup 向 sqlite 发送数据,但出现 KeyError : 'href'