我正在通过 py++ 将 C++ 数据密集型库与 Python 连接起来/boost.python .在分析我的程序后,我发现 70% 的运行时间花在了如下代码上:
ni = range(v2o.getHits())
tau = np.array([v2o.TofCorrectedTime[i] for i in ni])
q = [v2o.getCharge()[i] for i in ni]
v2o.TofCorrectedTime 键入 __array_1_float_2368来自 py++。 v2o.getCharge() 的类型为 _impl_details_range_iterator_也来自 py++。大小约为 2000,从这些 py++ 数组包装器到 numpy 的转换很慢:
In [42]: timeit np.array(v2o.TofCorrectedTime)
100 loops, best of 3: 2.52 ms per loop
In [43]: timeit np.array(v2o.getCharge())
100 loops, best of 3: 4.94 ms per loop
In [44]: timeit np.array([0]*2368)
1000 loops, best of 3: 310 µs per loop
In [45]: timeit np.array(np.zeros(2368))
100000 loops, best of 3: 4.41 µs per loop
我在网上搜索了解决方案。候选人是:
问题和答案(更新):
cython/memoryview容易与boost.python和py++集成吗?我想保留库包装器的其余部分。
没有。 (吉姆的回答)
cython c++ 包装器和 boost.python 具有本质上不同的基础结构。他们很难互相交谈。 (虽然原则上,我们可以教 py++ 输出 cython 代码。但那是另一回事了。)
使用 Boost.NumPy 扩展当前包装器是最易于管理的方式。
就转换开销而言,哪一个最适合我的问题?
(还没有确定的答案。)
谢谢
最佳答案
(免责声明:我是 Boost.NumPy 的主要作者。)
恐怕这些选项都不是特别好。以下是我认为赞成/反对分析的方式:
Cython 拥有大量用户和开发人员,因此如果您选择该选项,您将获得更多支持。然而,它根本没有与 Boost.Python 集成,而且我认为让 Cython 对象与 Boost.Python 对话需要大量工作,更不用说 Py++ 了;您可能需要对 Cython 和 Boost.Python 的低级实现细节有相当扎实的了解才能实现这一目标。如果您想使用 Cython,您最好放弃 Py++/Boost.Python 包装器。
Boost.NumPy 的社区要小得多,因此支持资源也更有限,但它更适合您已有的代码。 Py++ 对 Boost.NumPy 一无所知,所以它不会自动生成使用它的代码(可能是你可以教 Py++ 关于 Boost.NumPy;我对 Py++ 不够熟悉,不知道),但它非常简单将自定义 Boost.Python 代码(以及 Boost.NumPy 代码)添加到 Py++ 项目。
关于c++ - 将 numpy 数组与 boost.python : pyublas or boost. numpy 交换?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20376021/