python - pandas中每组行减去不同的引用值

标签 python pandas dataframe

我搜索并找到了这个接近的答案,但我不太明白如何将它应用到我自己的情况中,因为我的引用值没有存储在同一个数据框中。

Subtracting group specific value from rows in pandas

我有一个数据框如下,我想根据存在的核从“各向同性位移”列中减去不同的引用值(在本例中为 C 和 H,但原则上元素周期表中的任何值都是可能的):

REF_H = 30
REF_C = 180
df
    Atom Number Nucleus  Isotropic Shift
0             1       C          49.3721
1             2       C          52.9650
2             3       C          36.3443
3             4       C          50.8163
4             5       C          50.0493
5             6       C          49.7985
6             7       H          24.0772
7             8       H          23.7986
8             9       H          24.2922
9            10       H          24.1632
10           11       H          24.1572
11           12       C         102.9401

所以我想返回一个 delta 列,其中的值是相应的 Ref_H 或 Ref_C 值减去各向同性偏移:

modifieddf.tail(2)
    Atom Number Nucleus  Isotropic Shift    Delta
10           11       H          24.1572   5.8428
11           12       C         102.9401  77.0599

到目前为止,我想到的最好的是:

def generateHandC(df):
    h = df[df['Nucleus'] == 'H']
    h['delta'] = REF_H - h['Isotropic Shift']
    c = df[df['Nucleus'] == 'C']
    c['delta'] = REF_C - c['Isotropic Shift']
    return h, c

generateHandC(df)

Output:
(    Atom Number Nucleus  Isotropic Shift   delta
6             7       H          24.0772  5.9228
7             8       H          23.7986  6.2014
8             9       H          24.2922  5.7078
9            10       H          24.1632  5.8368
10           11       H          24.1572  5.8428
14           15       H          28.3212  1.6788
15           16       H          28.0110  1.9890
17           18       H          29.2324  0.7676
18           19       H          26.7298  3.2702,     Atom Number Nucleus  Isotropic Shift     delta
0             1       C          49.3721  130.6279
1             2       C          52.9650  127.0350
2             3       C          36.3443  143.6557
3             4       C          50.8163  129.1837
4             5       C          50.0493  129.9507
5             6       C          49.7985  130.2015
11           12       C         102.9401   77.0599
13           14       C         122.3188   57.6812)

但这绝对不是最优的,它将数据框作为列表返回并向我抛出一个 SettingWithCopyWarning。理想情况下,我想返回原始数据框以及用于增量值的额外列。谢谢!

最佳答案

您可以 map Nucleus 列由 dict 减去 sub :

REF_H = 30
REF_C = 180
d = {'C': REF_C, 'H':REF_H}
df['Delta'] =  df.Nucleus.map(d).sub(df['Isotropic Shift'])
print (df)
    Atom  Number Nucleus  Isotropic Shift     Delta
0      0       1       C          49.3721  130.6279
1      1       2       C          52.9650  127.0350
2      2       3       C          36.3443  143.6557
3      3       4       C          50.8163  129.1837
4      4       5       C          50.0493  129.9507
5      5       6       C          49.7985  130.2015
6      6       7       H          24.0772    5.9228
7      7       8       H          23.7986    6.2014
8      8       9       H          24.2922    5.7078
9      9      10       H          24.1632    5.8368
10    10      11       H          24.1572    5.8428
11    11      12       C         102.9401   77.0599

关于python - pandas中每组行减去不同的引用值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41058760/

相关文章:

python - super 集仪表板 - 动态更新

Python:Pandas 将每一行连接成一个字符串

python - Pandas 数据框 : simplest way to find arow and select an element from that row

python - 根据列的多个条件将数据帧拆分为 block

python - 导入错误 : No module named pywintypes

python - python3如何从列表中删除线程对象

python - PyQt5 如果Python仍在运行,如何在使用evaluateJavaScript时更新GUI

python - 将元组列表转换为 Pandas 数据框的单列?

python - 标签未出现在 Seaborn distplot 中

python - 使用 R 数据框、动物园和结果的真实日期进行预测