Python:具有相同键的几个字典的平均值

标签 python dictionary numpy

我试图找到具有相同键的多个词典的平均值(词典的数量将取决于用户的选择)。每个键都是一个 n 维的 numpy 数组。

我用这个方法得到了我的解决方案

ipython notebook viewer

我用的函数是

def metaa(lis,name):
    x = len(lis)
    pr=""
    for i in xrange(x):
        if i == 0:
            pr = pr+name+"["+str(i)+"][x]"
        else:
            pr = pr+"+"+name+"["+str(i)+"][x]"
    pr = "("+pr+")/"+str(x)                 
    return pr

我创建了这样的字典。

import numpy as np
a1 = np.random.randint(100,size=(3,10))
a2 = np.random.randint(100,size=(3,10))
a3 = np.random.randint(100,size=(3,10))
al=[a1,a2,a3]
dicta = {'a1':a1,'a2':a2,'a3':a3}
dictb = {'a1':a1,'a2':a2,'a3':a3}
R = [dicta,dictb]

我在两个词典中使用相同的值进行测试。 我这样调用函数。

Res = {}
for x in R[0]:
    Res[x] = eval(metaa(R,'R'))

我觉得这个方法很hackish,有没有更好的方法解决这个问题?。

最佳答案

构建一个字符串来评估它不是很优雅。更好用reduce结合np.add ,全部由 list [] 和 dict {} comprehensions 启用。首先,将字典列表 R 转换为列表字典 S:

S = {k:[ R[j][k] for j in range(len(R)) ] for k in R[0].keys()}

现在,每个键只有一个“裸”numpy 数组列表,可以使用 np.add 添加,然后除以单个列表的长度:

S = {'a1': [array([[ 32, 120,  80, 380, 360, 212, 188,  56, 312, 112],
                   [388, 348, 196, 236,  60, 200, 224, 208,  24, 104],
                   [324, 296,  24, 52, 220,  12, 104,  52, 232, 196]]),
            array([[ 32, 120,  80, 380, 360, 212, 188,  56, 312, 112],
                   [388, 348, 196, 236,  60, 200, 224, 208,  24, 104],
                   [324, 296,  24, 152, 220,  12, 104,  52, 232, 196]])],
     'a2': [array([[30, 82, 99, 72, 79, 98, 93, 93, 28, 46],
                   [ 8, 17, 50, 59, 85, 73, 48, 97, 87, 41],
                   [98, 36, 27, 55, 98, 39, 73, 51, 27, 33]]),
            array([[30, 82, 99, 72, 79, 98, 93, 93, 28, 46],
                   [ 8, 17, 50, 59, 85, 73, 48, 97, 87, 41],
                   [98, 36, 27, 55, 98, 39, 73, 51, 27, 33]])],
     'a3': [array([[78, 24, 87, 83, 30, 14, 88, 57, 55, 73],
                   [76, 94, 99, 58, 63, 34, 70, 81, 45, 20],
                   [32, 61,  0,  3, 33, 33, 38, 90, 11,  3]]),
            array([[78, 24, 87, 83, 30, 14, 88, 57, 55, 73],
                   [76, 94, 99, 58, 63, 34, 70, 81, 45, 20],
                   [32, 61,  0,  3, 33, 33, 38, 90, 11,  3]])]}

计算平均值:

T = {k:( reduce(np.add, v)/len(v) ) for k,v in S.iteritems()}

现在 T 是具有平均值的 numpy 数组的字典:

T = {'a1': array([[ 32, 120,  80, 380, 360, 212, 188,  56, 312, 112],
                  [388, 348, 196, 236,  60, 200, 224, 208,  24, 104],
                  [324, 296,  24, 152, 220,  12, 104,  52, 232, 196]]),
     'a2': array([[30, 82, 99, 72, 79, 98, 93, 93, 28, 46],
                  [ 8, 17, 50, 59, 85, 73, 48, 97, 87, 41],
                  [98, 36, 27, 55, 98, 39, 73, 51, 27, 33]]),
     'a3': array([[78, 24, 87, 83, 30, 14, 88, 57, 55, 73],
                  [76, 94, 99, 58, 63, 34, 70, 81, 45, 20],
                  [32, 61,  0,  3, 33, 33, 38, 90, 11,  3]])}

关于Python:具有相同键的几个字典的平均值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19653894/

相关文章:

python - 理解 Python 中的 dictionary.get

python - numpy 中基于索引的多重性加法

python - 属性错误 : module 'regex' has no attribute 'Pattern'

python - 将标量转换为 numpy 数组的有效方法

python - 域名下划线的问题

java - 通过接口(interface)导入 map key

MATLAB:扩展 container.Map 对象中的值列表

python - 超过 2 维的 numpy 点

Python OpenSSL 生成公钥和私钥对