python - Pandas v0.20 在乘以数据帧列时返回 NotImplemented

标签 python pandas dataframe array-broadcasting

为了回答另一个问题,我一直在尝试 pandas 中的按列乘法运算。

A = pd.DataFrame({'Col1' : [1, 2, 3], 'Col2' : [2, 3, 4]})
B = pd.DataFrame({'Col1' : [10, 20, 30]})

print(A)

   Col1  Col2
0     1     2
1     2     3
2     3     4

print(B)

   Col1
0    10
1    20
2    30

我尝试使用df.apply来尝试将BCol1与A的每一列相乘。所以我想要的输出是:

   Col1  Col2
0    10    20
1    40    60
2    90   120

我的第一次尝试是使用 lambda 并且效果很好。

df_new = A.apply(lambda x: B.Col1.values * x, 0) 
print(df_new)

   Col1  Col2
0    10    20
1    40    60
2    90   120

但是 lambda 总是很慢,所以我想我可以通过传递 B.col1.values.__mul__ 来加快速度,但这就是它给出的:

print(A.apply(B.Col1.values.__mul__, 0))

Col1    NotImplemented
Col2    NotImplemented
dtype: object

我打印出了__mul__,它只是一个在numpy数组中进行乘法的神奇方法:

print(B.Col1.values.__mul__)
<method-wrapper '__mul__' of numpy.ndarray object at 0x1154d9620>

为什么我会收到此错误?

最佳答案

你可以这样做:

A.apply(B.Col1.__mul__,0)

这将返回您想要的内容。

区别在于,B.Col1.values.__mul__ 正在调用 numpy 槽函数,而 B.Col1.__mul__ 正在调用 pandas 方法。

pandas 方法可能是为了避免 numpy 带来的一些低级问题而编写的:

>>>print(inspect.getsource(pd.Series.__mul__))

def wrapper(left, right, name=name, na_op=na_op):

    if isinstance(right, pd.DataFrame):
        return NotImplemented

    left, right = _align_method_SERIES(left, right)

    converted = _Op.get_op(left, right, name, na_op)

    left, right = converted.left, converted.right
    lvalues, rvalues = converted.lvalues, converted.rvalues
    dtype = converted.dtype
    wrap_results = converted.wrap_results
    na_op = converted.na_op

    if isinstance(rvalues, ABCSeries):
        name = _maybe_match_name(left, rvalues)
        lvalues = getattr(lvalues, 'values', lvalues)
        rvalues = getattr(rvalues, 'values', rvalues)
        # _Op aligns left and right
    else:
        name = left.name
        if (hasattr(lvalues, 'values') and
                not isinstance(lvalues, pd.DatetimeIndex)):
            lvalues = lvalues.values

    result = wrap_results(safe_na_op(lvalues, rvalues))
    return construct_result(
        left,
        result,
        index=left.index,
        name=name,
        dtype=dtype,
    )

找不到 np 槽函数的源代码,但它可能类似于 this

关于python - Pandas v0.20 在乘以数据帧列时返回 NotImplemented,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45814262/

相关文章:

python - 如何使用flask-restplus的fields.Url进行mongoengine文档查询集?

python - 是否可以指定之前的目录python?

python - 进位/复制 NaN 值到另一列 DF Pandas

r - 使用 mutate 创建一个新列,其中包含 R 中每个组的第一个值

r - 跨两个数据框与具有多个条目进行匹配的某些观察结果进行匹配

Python Bokeh附加Y轴问题

python - 如何将从websocket接收到的on_message数据返回到类外?使用 python websocket 客户端

Python 3 运算符.div?

python-3.x - 基于代码、日期、平均价格的股票预测

python - 使用多处理过滤 Pandas 中的大型数据框