pagination - 在 CouchDB 中创建分页索引？

我正在尝试在 CouchDB 中创建一个分页索引 View ，其中列出找到的每个第 N 个文档的 doc._id。

我编写了以下 map 函数，但 pageIndex 变量不能可靠地从 1 开始 - 事实上，它似乎会根据发出的值或索引长度(例如 50、55 、 10、 25 - 全部以不同的文件开头，尽管我似乎得到了发出的正确文件数)。

function(doc) {
  if (doc.type == 'log') {
    if (!pageIndex || pageIndex > 50) {
      pageIndex = 1;
      emit(doc.timestamp, null);
    }
    pageIndex++;
  }
}

我在这里做错了什么？ CouchDB 专家将如何构建此 View ？

请注意，我不想使用 mentioned elsewhere 中的“startkey + count + 1”方法。，因为我希望能够跳转到特定页面或最后一页(用户期望等)，所以我希望有一个友好的“？page = 5”URI而不是“？startkey = 348ca1829328edefe3c5b38b3a1f36d1e988084b”，如果我能帮忙的话，我宁愿 CouchDB 完成这项工作，而不是增加我的应用程序的数量。

谢谢!

最佳答案

View 函数(map 和 reduce)纯粹是函数式的。不支持设置全局变量等副作用。 (当您将应用程序移至 BigCouch 时，具有任意数据子集的多个独立服务器如何知道 pageIndex 是什么？)

因此，答案必须涉及传统的 map 函数，可能由时间戳作为键控。

function(doc) {
  if (doc.type == 'log') {
    emit(doc.timestamp, null);
  }
}

如何获取每 50 个文档？最简单的方法是添加 skip=0 或 skip=50 或 skip=100 参数。但这并不理想(见下文)。

预取每 50 个文档的确切 ID 的一种方法是使用 _list 函数，该函数仅输出每 50 行。 (实际上，您可以使用 Mustache.JS 或其他模板库来构建 HTML。)

function() {
  var ddoc = this,
      pageIndex = 0,
      row;

  send("[");
  while(row = getRow()) {
    if(pageIndex % 50 == 0) {
      send(JSON.stringify(row));
    }
    pageIndex += 1;
  }
  send("]");
}

这适用于许多情况，但并不完美。以下是我想到的一些考虑因素，不一定是令人惊叹的，但这取决于您的具体情况。

不鼓励使用漂亮的 URL 是有原因的。如果我加载第 1 页，然后在前 50 个文档中插入一堆文档，然后单击第 2 页，这意味着什么？如果数据变化很大，就没有完美的用户体验，用户必须以某种方式感受到数据的变化。

skip 参数和示例 _list 函数具有相同的问题:它们无法缩放。使用skip，您仍然从头开始接触 View 中的每一行:在数据库文件中找到它，从磁盘读取它，然后忽略它，一遍又一遍，逐行，直到您点击skip值。对于较小的值，这非常方便，但由于您将页面分组为 50 个页面，我必须想象您将有数千或更多行。这可能会导致页面浏览速度变慢，因为数据库大部分时间都在运转。

_list 示例也有类似的问题，但是您预先加载了所有工作，从头到尾运行整个 View ，并且(大概)将相关文档 ID 发送到客户端，以便它可以快速跳转页面。但是，对于数十万个文档(您称它们为“日志”，所以我假设您将拥有大量文档)，这将是一个非常慢的查询，并且不会被缓存。

总之，对于小型数据集，您可以使用 page=1、page=2 表单，但是随着数据集的增加，您会遇到问题大的。随着 BigCouch 的发布，CouchDB 更适合日志存储和分析，因此(如果这就是您正在做的事情)您肯定需要考虑扩展多高。

关于pagination - 在 CouchDB 中创建分页索引？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3647101/

pagination - 在 CouchDB 中创建分页索引？

上一篇：r - 如何使用 R 中的 Leaflet 将两个坐标与一条线连接起来

下一篇：tensorflow - 多维 lstm tensorflow