MongoDB 未在 '_id' 上使用复合索引

标签 mongodb query-optimization pymongo

我在 MongoDB 中有一个集合,其中包含以下文档。

/* 0 */
{
    "T" : [ 
        374135056604448742
    ],
    "_id" : {
        "#" : 7778532275691,
        "ts" : ISODate("2013-07-26T02:25:00Z")
    }
}

/* 1 */
{
    "T" : [ 
        1056188940167152853
    ],
    "_id" : {
        "#" : 34103385525388,
        "ts" : ISODate("2013-07-30T03:00:00Z")
    }
}

/* 2 */
{
    "T" : [ 
        1056188940167152853
    ],
    "_id" : {
        "#" : 34103385525388,
        "ts" : ISODate("2013-07-30T03:18:00Z")
    }
}

现在,我正在尝试使用以下查询来查询一些文档。

db.entries.find({
    '_id.ts': {'$gte': beginTS, '$lte': endTS}, 
    '_id.#' : 884327843395156951
    }).hint([('_id', 1)]).explain()

根据我的理解,由于_id是一个复合字段,而Mongo总是在_id上维护一个索引,因此要回答上面的查询,Mongo应该使用'_id'上的索引。但是,上述查询的答案如下:

{u'allPlans': [{u'cursor': u'BtreeCursor _id_',
   u'indexBounds': {u'_id': [[{u'$minElement': 1}, {u'$maxElement': 1}]]},
   u'n': 2803,
   u'nscanned': 4869528,
   u'nscannedObjects': 4869528}],
 u'cursor': u'BtreeCursor _id_',
 u'indexBounds': {u'_id': [[{u'$minElement': 1}, {u'$maxElement': 1}]]},
 u'indexOnly': False,
 u'isMultiKey': False,
 u'millis': 128415,
 u'n': 2803,
 u'nChunkSkips': 0,
 u'nYields': 132,
 u'nscanned': 4869528,
 u'nscannedAllPlans': 4869528,
 u'nscannedObjects': 4869528,
 u'nscannedObjectsAllPlans': 4869528,
 u'scanAndOrder': False,

可以观察到,MongoDB 正在对数据库进行全面扫描以查找少量文档。我不知道这里到底出了什么问题。

我尝试更改查询顺序,但结果相同。我不知道这里发生了什么。如果深表感谢,请提供任何帮助。

更新

我理解这里的细微差别。 _id 不是复合索引,它只是一个精确索引。这意味着如果 _id 是一个文档,那么无论文档的结构如何以及它可能有多少嵌套属性或子文档,_id 索引将只包含一个 _id 字段条目。此条目假定为 _id 文档的哈希值,并将保持唯一。

最佳答案

您正在使用一个对象作为键,但您没有使用 compund index在这里。

_id 索引有点特殊,因为它是自动创建的并且始终是唯一的。通常,_id 索引是一个 ObjectId、一个 UUID 或者可能是一个 integer 或包含某种类型的字符串散列。 MongoDB 支持将复杂对象作为键。然而,对于 MongoDB 来说,这仍然只是一个文档。它可以与其他文档进行比较,具有相同字段和值的文档将是相等的。但是由于您没有创建索引键(并且您不能手动创建该索引),MongoDB 不知道它包含一个字段 # 和一个字段 ts .

另一方面,复合索引明确引用文档的字段,例如{“product.quantity”:1,“product.created”:-1}。这必须在创建索引时指定。

看来您基本上是在尝试在主键中存储时间戳。 MongoDB 的 ObjectId 已经包含时间戳,因此您可以直接对 ObjectIds 进行基于日期的范围查询。

关于MongoDB 未在 '_id' 上使用复合索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18388434/

相关文章:

node.js - 更新子文档不起作用nodejs mongodb express

Expressjs 4 中的 Mongodb session 存储

sql - IN 参数的数量是否会改变查询的执行计划?

python - PyMongo insert_one 异常/错误处理

MongoDB:多个 $elemMatch

mongodb - 使用pymongo修复mongodb数据库

MongoDB更新子文档数组或字典

python - 在 MongoDB 中的一个查询中更新字段和 $push 到数组

sql - 甲骨文 SQL : Optimizing LEFT OUTER JOIN of two similar select statements to be smaller and/or more efficient