下面给出文档的以下数据结构:
{
"_id" : x,
"device_model_id": x,
"device_os_id": x,
"device_status_id" : x,
}
我想按 device_status 和 device_os 对数据进行分组:
{u'ok': 1.0, u'result': [
{
u'_id': {u'device_os_id': 2, u'device_status_id': 2},
u'total': $sum,
u'models': {
'device_model_id': 1,
'total_device_model': $sum
}
},
{
u'_id': {u'device_os_id': 1, u'device_status_id': 1},
u'total': $sum,
u'models': {
'device_model_id': 4,
'total_device_model': $sum
}
},
.....
到目前为止,我有以下代码:
testing = self.collection.aggregate([
{'$group': {
'_id': {'device_os_id': "$device_os_id", 'status': '$device_status_id'},
'total': {'$sum': 1},
'models': {'$addToSet': "$device_model_id"},
}}
])
这给了我以下结果:
{u'ok': 1.0, u'result': [
{u'total': 20355, u'models': [18, 2, 3], u'_id': {u'device_os_id': 2, u'status': 2}},
{u'total': 38429, u'models': [18, 19, 2, 3], u'_id': {u'device_os_id': 2, u'status': 1}},
{u'total': 1, u'models': [15], u'_id': {u'device_os_id': 1.0, u'status': 1}}]}
我还没有找到将每个 device_model_id 的总和添加到“型号”列表中的方法。 有谁知道我怎样才能实现这个目标? 非常感谢您的帮助。
最佳答案
你可以分两步$group
来完成此操作管道阶段,首先是包括“模型”在内的所有键,然后仅用于较低级别的详细信息:
self.collection.aggregate([
{ '$group': {
'_id': {
'device_os_id': "$device_os_id",
'status': '$device_status_id',
'model': '$device_model_id'
},
'total': {'$sum': 1}
}},
{ '$group': {
'_id': {
'device_os_id': '$_id.device_os_id',
'status': '$_id.status'},
},
'models': { '$push': { 'model': '$_id.model', 'total': '$total' } },
'total': { '$sum': '$total' }
}}
])
作为“管道”,第一阶段压缩在一个级别并获取详细总计。 “第二”阶段所做的就是将“模型”现在已经唯一的内容折叠到“模型”数组中,并以其他分组项作为键。
关于python - 多个键的总计,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32386106/