让我们考虑下表
CREATE TABLE base_table(
partition_key uuid,
clustering_key1 uuid,
clustering_key2 uuid,
regular text,
PRIMARY KEY((partition_key), clustering_key1, clustering_key2)
);
在 Cassandra 2.2 之前,不可能执行如下查询:
SELECT * FROM base_table
WHERE partition_key=<UUID1>
AND clustering_key1 IN (<UUID2>,<UUID3>)
AND clustering_key2 < UUID4
事实上,只有前一个聚类键受到相等关系的限制,才能限制该聚类键。
自 Cassandra 2.2 起,这是可能的,但有人知道这样做是否有一些警告吗? 与没有 IN 子句(或接近)一样,可以预期什么性能?它是否像平等关系一样缩放?
更多,Cassandra 3.X 新存储引擎可能已经考虑了优化此类请求...如果有人对此有想法:)
谢谢!
最佳答案
因为您正在从同一分区读取数据,所以在 IN
中有许多元素之前,不会对性能产生很大的影响。关系...但是,如果您通过 <
选择太多条目,则可能会出现问题比较(也可能是单个 =
的问题)。
关于performance - 在集群键上使用 IN 子句的 Cassandra 性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49319172/