python - 在数据框数据上调用函数

标签 python pandas dataframe function

我不确定我在这里做错了什么,我只是想调用一个带有 if-then-else 过滤器的函数并应用于数据框。

In [7]:
df.dtypes

Out[7]:
Filler     float64
Spot       float64
Strike     float64
cp          object
mid        float64
vol        float64
usedvol    float64
dtype: object

In [8]:
df.head()

Out[8]:
          Filler  Spot  Strike cp  mid   vol  
    0       0.0   100      50  c   0.0   25.0   
    1       0.0   100      50  p   0.0   25.0   
    2       1.0   100      55  c   1.0   24.5  
    3       1.0   100      55  p   1.0   24.5   
    4       2.5   100      60  c   2.5   24.0 

我有以下功能:

def badvert(df):
    if df['vol']>24.5:
        df['vol2'] = df['vol']*2
    else:
        df['vol2'] = df['vol']/2
    return(df['vol2'])

我在这里称之为:

df['vol2']=badvert(df)

生成此错误消息的原因:

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-14-bbf7a11a17c9> in <module>()
----> 1 df['vol2']=badvert(df)

<ipython-input-13-6132a4be33ca> in badvert(df)
      1 def badvert(df):
----> 2     if df['vol']>24.5:
      3         df['vol2'] = df['vol']*2
      4     else:
      5         df['vol2'] = df['vol']/2

C:\Users\camcompco\AppData\Roaming\Python\Python34\site-packages\pandas\core\generic.py in __nonzero__(self)
    712         raise ValueError("The truth value of a {0} is ambiguous. "
    713                          "Use a.empty, a.bool(), a.item(), a.any() or a.all()."
--> 714                          .format(self.__class__.__name__))
    715 
    716     __bool__ = __nonzero__

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

我的直觉告诉我这是一个简单的“语法”问题,但我不知所措。任何帮助将不胜感激

最佳答案

您想apply它到每一行,这将使用 apply 和 lambda 执行您想要的操作:

df["vol2"] = df.apply(lambda row: row['vol'] * 2 if row['vol'] > 24.5 else row['vol'] / 2, axis=1)
print(df)

应该输出如下内容:

   Filler  Spot  Strike cp  mid   vol   vol2
0     0.0   100      50  c  0.0  25.0  50.00
1     0.0   100      50  p  0.0  25.0  50.00
2     1.0   100      55  c  1.0  24.5  12.25
3     1.0   100      55  p  1.0  24.0  12.00
4     2.5   100      60  c  2.5  24.0  12.00

或者使用你自己的函数:

def badvert(df):
    if df['vol']>24.5:
        df['vol2'] = df['vol']*2
    else:
        df['vol2'] = df['vol']/2
    return df['vol2']
df["vol2"] = df.apply(badvert,axis=1)

axis=0 将函数应用于每一列,axis=1 将函数应用于每一行。

关于python - 在数据框数据上调用函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31090969/

相关文章:

Python:脚本逐个字母而不是整个单词打印出字典值?

Python:如何从加拿大的 shapefile 创建等值线图?

python - 使用谷歌应用引擎分页

java - 使用 SAX 在 Python 中编写 XML

python - 如何指定 Pandas 数据框的行数?

r - 更改 R 数据框中的列值

python - 如何在 Python Pandas Dataframe 中有条件地连接 2 列

python - Pandas groupby 转置

python - 在多个条件下过滤数据框

python - 使用字典创建数据框