python - 在 cython 中编写未知维度的 numpy 代码

标签 python numpy cython

假设我有一个 Cython 代码,其中的函数计算滚动移动平均值并返回与输入大小相同的数组(该函数为初始部分添加了 nan,但这不是对于当前的问题很重要)。

我编写了三个 Cython 函数(如下所示):

(a) sma_vec 处理一维的 numpy 数组

(b) sma_mat 处理二维 numpy 数组

(c) 第三个 sma 根据大小从 sma_vecsma_mat 返回值。 (我的动机是最终将 sma_vecsma_mat 之前的 cpdef 替换为 cdef,以便 Python 代码只看到sma 函数)

函数 1 - 处理一维的 numpy 数组

cimport cython
import numpy as np
cimport numpy as np
from numpy cimport ndarray as ar
ctypedef double dtype_t

@cython.boundscheck(False)
@cython.wraparound(False)
cpdef sma_vec(ar[dtype_t, ndim=1] x, int m):
    cdef int n
    cdef Py_ssize_t i, j
    cdef ar[dtype_t, ndim=1] y
    if m == 1:
        return x.copy()
    else:
        y = np.zeros_like(x) * np.nan
        n = x.shape[0]
        if n < m:
            return y
        else:
            for i in range(m-1, n):
                for j in range(i-m+1, i+1):
                    if j == i-m+1:
                        y[i] = x[j]
                    else:
                        y[i] += x[j]
                y[i] /= float(m)
            return y

函数 2 - 处理二维 numpy 数组(在 ndarray 的每一行上调用函数 1)

@cython.boundscheck(False)
@cython.wraparound(False)
cpdef sma_mat(ar[dtype_t, ndim=2] x, int m):
    cdef int n
    cdef Py_ssize_t i
    cdef ar[dtype_t, ndim=2] y
    if m == 1:
        return x.copy()
    else:
        y = np.zeros_like(x) * np.nan
        n = x.shape[0]
        if n < m:
            return y
        else:
            for i in range(0, x.shape[0]):
                y[i] = sma_vec(x[i], m)
            return y

函数3-根据维度调用函数1或函数2

@cython.boundscheck(False)
@cython.wraparound(False)
cpdef sma(ar[dtype_t] x, int m):
    if x.ndim == 1:
        return sma_vec(x, m)
    elif x.ndim == 2:
        return sma_mat(x, m)
    else:
        raise ValueError('Cannot handle more than two dimensions')

测试代码

import numpy as np
import common.movavg as mv

x1 = np.array([1.0, 1.4, 1.3, 5.3, 2.3])
y1 = mv.sma_vec(x1, 3)
y1a = mv.sma(x1, 3)

y1y1a 均正确返回 array([nan, nan, 1.233333, 2.666667, 2.966667])

x2 = np.array([[1.0, 1.4, 1.3, 5.3, 2.3], [4.2, 1.3, 2.3, 5.7, -1.3]])
y2 = mv.sma_mat(x2, 2)

y2 正确返回

array([[  nan,  1.2 ,  1.35,  3.3 ,  3.8 ],
       [  nan,  2.75,  1.8 ,  4.  ,  2.2 ]])

但是当我尝试时:

y2a = mv.sma(x2, 2)

我收到错误:

Traceback (most recent call last):
  File "C:\PF\WinPython-64bit-3.4.2.4\python-3.4.2.amd64\lib\site-packages\IPython\core\interactiveshell.py", line 2883, in run_code
exec(code_obj, self.user_global_ns, self.user_ns)
  File "<ipython-input-4-dc092e343714>", line 3, in <module>
    y2a = mv.sma(x2, 2)
  File "movavg.pyx", line 54, in movavg.sma (stat\movavg.c:2206)
ValueError: Buffer has wrong number of dimensions (expected 1, got 2)

sma函数中,问题似乎是ar[dtype_t] x(即np.ndarray[double] x)自动假定 x.ndim 的尺寸应为 1

如何重写 sma 函数,以便它可以接受尺寸未知的 np.ndarray

最佳答案

找到了答案。

从此链接:numpy_tutorial ,“...“ndim”仅关键字参数,如果未提供,则假定为一维...”

解决办法是将函数3转换为:

@cython.boundscheck(False)
@cython.wraparound(False)
cpdef sma(ar x, int m):
    if x.ndim == 1:
        return sma_vec(x, m)
    elif x.ndim == 2:
        return sma_mat(x, m)
    else:
        raise ValueError('Cannot handle more than two dimensions')

我们需要完全删除[]中的所有内容。

关于python - 在 cython 中编写未知维度的 numpy 代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30385584/

相关文章:

apache-spark - 酸洗错误-Cython 与 Pyspark : scikit-learn knn with user defined metric for large dataset

Python从字符串中删除多个字符串的最佳方法

python - 如何调整 Numpy 数组的大小以添加/替换行,其组合由数组每行中的值确定

cython - Cython中的extra_compile_args

python - 为什么 numpy 的 fromiter 函数需要指定 dtype 而其他数组创建例程不需要?

python - Numpy reshape 保留一些尺寸

python - 使用 Cython 构建部分构建

Python - 尝试控制输入时出错

python - 为什么 mmap 返回大小为零?

python - 从别名模块导入名称。是否可以?