我有一个集合,其中包含随着时间推移生成的一系列对象。由于我在同一个集合中存储了不同的类型,因此每个对象都有一个 TypeId
和一个 UID
(其中 UID 标识随时间推移引用同一实体的对象)。我试图从集合中选择最新的对象,并且在不手动迭代查询结果的情况下掌握如何做到这一点遇到了严重的困难 - 我宁愿避免这种情况,因为我认为当集合变大时它可能会变得昂贵。
例如:
var db; // assigned elsewhere
var col = db.collection("res");
col.primaryKey("resId");
col.insert({
resId: 1,
TypeId: "Person",
UID: "Bob",
Data: {Age: 20, Name:Bob}
});
col.insert({
resId: 2,
TypeId: "Person",
UID: "Bob",
Data: {Age: 25, Name:Bob}
});
col.insert({
resId: 3,
TypeId: "Car",
UID: "TeslaModelX",
Data: {Manufacturer: "Tesla", Owner:"Bob"}
});
col.insert({
resId: 4,
TypeId: "Person",
UID: "Bill",
Data: {Age: 22, Name:Bill}
});
从 col 中,我希望查询选择按 resId
降序排列的 TypeId="Person"
的所有对象,即我希望选择对象 4 和 2 ,按此顺序。
上面的集合是人为设计的,但实际上我预计肯定有 000 个条目,并且可能有 0000 个条目,每个 UID 可能有 000 个版本。换句话说,我不想返回完整的对象集合(无论是分组的还是其他形式),并对其进行迭代。
我已尝试以下操作,但由于 $distinct
运算符在 $orderBy
运算符之前应用,因此这没有帮助:
col.find(
{
TypeId : {$eq : "Person"}
$distinct: { UID: 1}
},
{
$orderBy: {
resId : -1
}
}
);
我认为我应该能够使用 $groupBy
、$limit
和 $aggregate
子句来识别每个组所需的 ID,然后使用子查询来查找精确的(非聚合)元素,但到目前为止我还没有设法得到任何东西来做我想做的事情。有什么想法吗?
我当前的解决方案是在我的对象中包含一个 Deleted
属性,并在插入新条目之前将数据库中所有现有的未删除对象设置为 true。这让我可以做我想做的事,但也阻止了我,例如,在已知的时间范围内或类似的时间范围内选择最好的可用方案。
最佳答案
你可以这样做:
var tmpObj = {};
col.sort({resId: -1}, coll.find({
"TypeId": "Person"
})).filter(function (doc) {
return col._match(doc, {
$distinct: {
UID: 1
}
}, {}, 'and', tmpObj);
});
它有点脏,因为它没有整齐地包含在单个命令中,但它和您在 ForerunnerDB v1.x 中得到的一样干净。
版本 2 将有一个新的查询管道系统,该系统将允许这种用途,如下所示:
col.pipeline()
.find({"TypeId": "Person"})
.orderBy({"resId": 1})
.distinct({"UID": 1})
.then(function (err, data) {
console.log(data);
});
来源:我是 ForerunnerDB 的开发者。
关于javascript - 如何从 ForerunnerDb 集合中选择对象的最新版本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41522649/