python - 有效地将阈值函数应用于 SciPy 稀疏 csr_matrix

标签 python numpy scipy sparse-matrix array-broadcasting

我有一个 1 列 x 行的 SciPy csr_matrix(在本例中为向量)。其中有浮点值,我需要将其转换为离散类标签 -1、0 和 1。这应该使用阈值函数来完成,该函数将浮点值映射到这 3 个类标签之一。

除了Iterating through a scipy.sparse vector (or matrix)中描述的迭代元素之外,没有其他方法吗? ?我希望有一些优雅的方式来以某种方式在所有元素上映射(thresholdfunc())。

请注意,虽然它是 csr_matrix 类型,但它实际上并不是稀疏的,因为它只是涉及稀疏矩阵的另一个函数的返回。

最佳答案

如果您有一个数组,则可以使用 np.where 函数根据某些条件进行离散化。例如:

>>> import numpy as np
>>> x = np.arange(10)
>>> np.where(x < 5, 0, 1)
array([0, 0, 0, 0, 0, 1, 1, 1, 1, 1])

语法为np.where(BOOLEAN_ARRAY, VALUE_IF_TRUE, VALUE_IF_FALSE)。 您可以将两个 where 语句链接在一起以获得多个条件:

>>> np.where(x < 3, -1, np.where(x > 6, 0, 1))
array([-1, -1, -1,  1,  1,  1,  1,  0,  0,  0])

要将其应用于 CSR 或 CSC 稀疏矩阵中的数据,您可以使用 .data 属性,该属性使您可以访问包含稀疏矩阵中所有非零条目的内部数组。例如:

>>> from scipy import sparse
>>> mat = sparse.csr_matrix(x.reshape(10, 1))
>>> mat.data = np.where(mat.data < 3, -1, np.where(mat.data > 6, 0, 1))
>>> mat.toarray()
array([[ 0],
       [-1],
       [-1],
       [ 1],
       [ 1],
       [ 1],
       [ 1],
       [ 0],
       [ 0],
       [ 0]])

关于python - 有效地将阈值函数应用于 SciPy 稀疏 csr_matrix,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44873272/

相关文章:

javascript - 如何通过 python mechanize 中的 javascript 函数模拟 cookie 的设置?

python - 如何将 "step"传递给 GradientTape 中的 ExponentialDecay

python - 将用户定义的函数作为 native 调用 | Python

python - 扩展维度 xarray

python - 带有 Kivy 错误的 Pycharm [CRITICAL] [App] 无法获取窗口,中止

python - scipy.lfilter 的替代品

python - Numpy:检查数组中的某个位是否设置为 1 或 0?

python - 如何获得指数和 Gamma 分布的对数似然

python - 在python中检查矩阵中的元素

numpy - 两个二维数组的线性插值