php - Cassandra CQL : Batch select

您好，我在 Cassandra 中有以下表格:

* ---------------------------------------------------------------------------
* Note:
* 'curr_pos' is always fixed, so we can put it into cluster key and order
* In each crawler iteration 'prev_pos', 'domain_*' are updated
* -------------------------------------------------------------------------
* Patterns:
* <domain_name3rd>.<domain_name2nd>.<domain_name1st>
* --------------------------------------------------------------------------
CREATE TABLE IF NOT EXISTS lp_registry.keyword_position (
    engine text,
    keyword text,
    updated timestamp,
    domain_name1st text,
    domain_name2nd text,
    domain_name3rd text,
    prev_pos int,
    curr_pos int,
    PRIMARY KEY ((engine, keyword), curr_pos)   
);

在顶级应用程序中，我有一个包含大约数百个关键字的列表。

我需要什么？

对于固定引擎和关键字列表，我想选择所有域及其位置。

更新:应用程序给出的结果将是每个引擎的 NxM 矩阵，其中包含 N 个用户定义的关键字和 M 个用户定义的域。每个单元格中都有特定关键字的域位置。

我对什么感到困惑？

我需要根据关键字列表的大小发布 N 个选择。换句话说，我需要迭代应用程序中的关键字，并在每次迭代中将选择发送到数据库。

我预计 N 不会大于 100，但我仍然认为这是太多查询。

我的问题

我可以将这些选择打包到一个批处理中吗？怎么办？

最佳答案

这并不是批量查询的问题，而是你的表设计的问题。

如果您描述的查询是应用程序的“核心”查询，那么您应该以单个查询的方式设计表，即。 引擎 和 keyword 应该是集群键而不是分区键。

给出更具体的建议:如何获取引擎和关键字列表，是否有一些对它们进行逻辑分组？这可能是您表的分区键。

关于php - Cassandra CQL : Batch select，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34703638/

php - Cassandra CQL : Batch select

上一篇：codenameone - 背景图像在代号一中被挤压

下一篇：r - 两组之间 R 中的马哈拉诺比斯距离