python - 条件 If 语句应用于数据帧的多列

我有一个分钟股票 yield 的数据框，我想创建一个新列，以是否超出 yield (正数或负数)为条件，如果是，则该行等于限制(正数或负数) ，否则等于检查的最后一列。下面的例子说明了这一点:

import pandas as pd
dict = [
        {'ticker':'jpm','date': '2016-11-28','returns1': 0.02,'returns2': 0.03,'limit': 0.1},
{ 'ticker':'ge','date': '2016-11-28','returns1': 0.2,'returns2': -0.3,'limit': 0.1},
{'ticker':'fb', 'date': '2016-11-28','returns1': -0.2,'returns2': 0.5,'limit': 0.1},
]
df = pd.DataFrame(dict)
df['date']      = pd.to_datetime(df['date'])
df=df.set_index(['date','ticker'], drop=True)

目标是这样的:

                   fin_return  limit  returns1  returns2
date       ticker                                       
2016-11-28 jpm           0.03    0.1      0.02      0.03
           ge            0.10    0.1      0.20     -0.30
           fb           -0.10    0.1     -0.20      0.50

因此，在第一行中，返回值从未超出限制，因此该值等于 returns2 中的值 (0.03)。在第 2 行中，返回超出了上行范围，因此该值应该是正限值。在第 3 行中，返回率首先在下行方向上超出，因此该值应该是负限制。

我的实际数据框有几千列，所以我不太确定如何做到这一点(也许是一个循环？)。我很感激任何建议。

这个想法是测试止损或限价交易算法。每当触发下限时，它应该用下限替换最后一列，上限也相同，以该行的先到者为准。因此，一旦触发其中一个，就应该测试下一行。

我在此处添加了一个不同的示例，其中又包含一列，以使这一点更加清晰(限制为 +/- 0.1)

                   fin_return  limit  returns1  returns2 returns3
date       ticker                                       
2016-11-28 jpm           0.02    0.1      0.01      0.04    0.02
           ge            0.10    0.1      0.20     -0.30    0.6
           fb           -0.10    0.1     -0.02     -0.20    0.7

在第一行中，从未触发最终返回的限制是来自 returns3 (0.02)。在第 2 行中，returns 1 的上限被触发，因此 fin_return 等于上限(returns2 和 returns 3 中发生的任何情况与该行无关)。在第 3 行中，returns 2 的下行超出了限制，因此 fin_return 变为 -0.1，并且 returns3 中的任何内容都无关紧要。

最佳答案

用途:

dict = [
        {'ticker':'jpm','date': '2016-11-28','returns1': 0.02,'returns2': 0.03,'limit': 0.1,'returns3':0.02},
{ 'ticker':'ge','date': '2016-11-28','returns1': 0.2,'returns2': -0.3,'limit': 0.1,'returns3':0.6},
{'ticker':'fb', 'date': '2016-11-28','returns1': -0.02,'returns2': -0.2,'limit': 0.1,'returns3':0.7},
]
df = pd.DataFrame(dict)
df['date']      = pd.to_datetime(df['date'])
df=df.set_index(['date','ticker'], drop=True)

<小时/>

#select all columns without first (here limit column)
df1 = df.iloc[:, 1:]

#comapre if all columns under +-limit
mask = df1.lt(df['limit'], axis=0) & df1.gt(-df['limit'], axis=0) 
m1 = mask.all(axis=1)
print (m1)
date        ticker
2016-11-28  jpm        True
            ge        False
            fb        False
dtype: bool

#replace first columns in limit with NaNs and back filling missing values, seelct first col
m2 = df1.mask(mask).bfill(axis=1).iloc[:, 0].gt(df['limit'])
print (m2)
date        ticker
2016-11-28  jpm       False
            ge         True
            fb        False
dtype: bool

arr = np.select([m1,m2, ~m2], [df1.iloc[:, -1], df['limit'], -df['limit']])
#set first column in DataFrame by insert
df.insert(0, 'fin_return', arr)
print (df)
                   fin_return  limit  returns1  returns2  returns3
date       ticker                                                 
2016-11-28 jpm           0.02    0.1      0.02      0.03      0.02
           ge            0.10    0.1      0.20     -0.30      0.60
           fb           -0.10    0.1     -0.02     -0.20      0.70

关于python - 条件 If 语句应用于数据帧的多列，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56765781/

python - 条件 If 语句应用于数据帧的多列

上一篇：python - python Flask应用程序中使用json对象上传文件的POST方法

下一篇：python - 是否有另一种方法可以用白色填充旋转图像外部的区域？ 'fillcolor' 不适用于旧版本的 Python