python - 使用numpy数组时如何处理itertools.product?

标签 python arrays numpy python-itertools

我想获得两个 numpy 数组的张量积。例如,给定

a = np.random.uniform(-1,1,size=[10,2])
b = np.random.uniform(2,3,size=[20,3])

我想采取

products = np.array(list(prod for prod in itertools.product(a,b)))

但是,当我这样做时,结果数组将是

[[array([-0.0954691 ,  0.36734629])
  array([2.20196909, 2.02029329, 2.29627849])]
  ...
 [array([-0.07571476,  0.95934329])
  array([2.46847944, 2.3456241 , 2.28091522])]]

我想删除列表中的“数组”以获取

 [[[-0.0954691 ,  0.36734629],[2.20196909, 2.02029329, 2.29627849]]
  ...
  [[-0.07571476,  0.95934329],[2.46847944, 2.3456241 , 2.28091522]]]

也许我可以使用

for i in range(products.shape[0]):
    np.concatenate((products[i][0], products[i][1]))

但我认为还有更聪明的方法来做到这一点。 谁能帮我吗?谢谢。

最佳答案

In [129]: products = np.array(list(prod for prod in itertools.product(a,b)))    

结果是一个二维数组 - 但具有对象数据类型:

In [130]: products.shape                                                        
Out[130]: (200, 2)

该数组的第一行也是对象数据类型,有 2 个元素,每个元素一个数组:

In [131]: products[0]                                                           
Out[131]: 
array([array([-0.38279696,  0.51916671]),
       array([2.26576386, 2.50428761, 2.1463347 ])], dtype=object)

它包含ab的第一行:

In [132]: a[0]                                                                  
Out[132]: array([-0.38279696,  0.51916671])
In [133]: b[0]                                                                  
Out[133]: array([2.26576386, 2.50428761, 2.1463347 ])

由于这些数组具有不同的长度,因此生成的组合必须是对象数据类型。如果 ab 具有相同的列数,您将得到数字数组

例如使用aa:

In [134]: arr = np.array(list(prod for prod in itertools.product(a,a)))         
In [135]: arr.shape                                                             
Out[135]: (100, 2, 2)
In [136]: arr.dtype                                                             
Out[136]: dtype('float64')

如果我们将 ab 转换为列表(嵌套),我们将再次获得一个包含列表的二维对象数组:

In [137]: products = np.array(list(prod for prod in itertools.product(a.tolist()
     ...: ,b.tolist())))                                                        
In [138]: products.shape                                                        
Out[138]: (200, 2)
In [139]: products[0,:]                                                         
Out[139]: 
array([list([-0.38279696426849363, 0.5191667144605163]),
       list([2.2657638604936015, 2.50428761464766, 2.1463346999537767])],
      dtype=object)

如果我们省略array包装器,我们会得到一个元组列表(列表):

In [140]: products = list(prod for prod in itertools.product(a.tolist(),b.tolist
     ...: ()))                                                                  
In [141]: len(products)                                                         
Out[141]: 200
In [142]: products[0]                                                           
Out[142]: 
([-0.38279696426849363, 0.5191667144605163],
 [2.2657638604936015, 2.50428761464766, 2.1463346999537767])
In [143]: type(products)                                                        
Out[143]: list

product 生成元组(请参阅其文档),如以下更简单的示例所示:

In [145]: list(itertools.product('abc','def'))                                  
Out[145]: 
[('a', 'd'),
 ('a', 'e'),
 ('a', 'f'),
 ('b', 'd'),
 ('b', 'e'),
 ('b', 'f'),
 ('c', 'd'),
 ('c', 'e'),
 ('c', 'f')]

编辑

在评论时拆分 prod 元组:

In [147]: arr0 = np.array(list(prod[0] for prod in itertools.product(a,b)))     
In [148]: arr1 = np.array(list(prod[1] for prod in itertools.product(a,b)))     
In [149]: arr0.shape                                                            
Out[149]: (200, 2)
In [150]: arr1.shape                                                            
Out[150]: (200, 3)
In [151]: arr0[:3,:]                                                            
Out[151]: 
array([[-0.38279696,  0.51916671],
       [-0.38279696,  0.51916671],
       [-0.38279696,  0.51916671]])
In [152]: arr1[:3,:]                                                            
Out[152]: 
array([[2.26576386, 2.50428761, 2.1463347 ],
       [2.63018066, 2.64559639, 2.51747175],
       [2.14425882, 2.39274225, 2.6460254 ]])

这是两个数值数组。

它们可以在 axis=1 上连接起来形成一个 5 列的数组:

In [153]: arr3 = np.hstack((arr0,arr1))                                         
In [154]: arr3[:3,:]                                                            
Out[154]: 
array([[-0.38279696,  0.51916671,  2.26576386,  2.50428761,  2.1463347 ],
       [-0.38279696,  0.51916671,  2.63018066,  2.64559639,  2.51747175],
       [-0.38279696,  0.51916671,  2.14425882,  2.39274225,  2.6460254 ]])

奖金

从这两个数组创建一个结构化数组:

In [159]: dt=np.dtype([('a',float,2),('b',float,3)])                            
In [160]: arr3 = np.zeros(200,dt)                                               
In [161]: arr3['a']=arr0                                                        
In [162]: arr3['b']=arr1                                                        
In [163]: arr3[:3]                                                              
Out[163]: 
array([([-0.38279696,  0.51916671], [2.26576386, 2.50428761, 2.1463347 ]),
       ([-0.38279696,  0.51916671], [2.63018066, 2.64559639, 2.51747175]),
       ([-0.38279696,  0.51916671], [2.14425882, 2.39274225, 2.6460254 ])],
      dtype=[('a', '<f8', (2,)), ('b', '<f8', (3,))])

关于python - 使用numpy数组时如何处理itertools.product?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59082207/

相关文章:

c# - C#'s most effective counterpart to Delphi' s TStringList 是什么?

python - c malloc数组指针在cython中返回

python - 如何输入检查类属性

ios - 如何在 Swift 中获取元组数组的最大 Double 值?

python - 将多行作为一个字符串填充字典

php - 对可能包含日期和缩写月份名称的字符串数组进行排序

python - 搜索多维数组

python - 计算样本位置不均匀的 3D 梯度的函数

python - 将数组拆分为均匀分布的 block

Python boto 清除 Aws 旧 Ebs 快照 "TypeError: unsupported operand type(s) for -: ' unicode' 和 'datetime.timedelta' "