python - 检查二维数组每行中不同列索引的值

标签 python arrays numpy multidimensional-array

我有一些二进制 2D numpy 数组(预测),例如:

[
[1 0 1 0 1 1],
[0 0 1 0 0 1],
[1 1 1 1 1 0],
[1 1 0 0 1 1],
]

二维数组中的每一行是一个句子作为某些类别的分类,二维数组中的每一列对应于该句子的一个类别的分类。例如,类别(categories 数组)为 ['A','B','C','D','E','F']

我有另一个二维数组 (catIndex),其中包含要在每行中检查的值的索引,例如

[[0],
  [4],
  [5],
  [2]
] 

对于上面的 4 个实例。

我现在想做的是循环遍历二进制二维数组,并针对为每个句子指定的列索引,检查它是 1 还是 0,然后将相应的类别追加到新数组中 (catResult = [])。如果它是 0,我会将 "no_region" 附加到新数组。

例如,在句子 1 中,我查看该句子的索引 0,并检查它是 0 还是 1 。它是 1,因此我将 'A' 附加到我的新数组中。在第 2 句中,我查看该句子的索引 4,发现它是 0,因此我将 "no_region" 附加到数组中.

当前代码:

for index in catIndex:
        for i,sentence in enumerate(prediction):
            for j,binaryLabel in enumerate(sentence):
                if prediction[i][index]==1:
                    catResult.append(categories[index])
                else:
                    catResult.append("no_region")

最佳答案

制作二维数组:

In [54]: M=[[1,0,1,0,1,1],[0,0,1,0,0,1],[1,1,1,1,1,0],[1,1,0,0,1,1]]
In [55]: M=np.array(M)

列索引为ind,行索引为[0,1,2,3]:

In [56]: ind=[0,4,5,2]    
In [57]: m=M[np.arange(len(ind)),ind]
In [58]: m
Out[58]: array([1, 0, 0, 0])

使用ind映射标签:

In [59]: lbl=np.array(list('ABCDEF'),dtype=object)    
In [60]: res=lbl[ind]
In [61]: res
Out[61]: array(['A', 'E', 'F', 'C'], dtype=object)

使用where来确定是否使用该映射值,或者使用None。使用 object dtype 可以轻松地将字符串标签替换为其他内容,例如 Noneno_region 等。

In [62]: np.where(m, res, None)
Out[62]: array(['A', None, None, None], dtype=object)

关于python - 检查二维数组每行中不同列索引的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38443808/

相关文章:

python - 为什么空字典大于 1?

python - 使用 matplotlib 建模人群运动

java - 循环中的 if 语句中的 i-- 做什么?

python - 如何根据序列替换 Numpy Ndarrays 中的值

python - 从 Pandas GroupBy 函数(和/或建议的其他方法)为 SVM 创建特征(行)向量

python - 将数组 datatime.datetime 转换为 float

python - 使用python修改fits文件时出现错误 "buffer is too small for requested array"

python - wxPython:如何将一个面板放在另一个面板上

c - 为什么我无法完成数组类型的 typedef 名称?

javascript - jquery 数组常量