很抱歉不得不再次向 Cassandra 提问,非常感谢你的建议:
我读过这个:http://wiki.apache.org/cassandra/FAQ#batch_mutate_atomic并且完全迷失并想知道:
这是真的吗,在 Cassandra 中,针对一个行键在一个单一节点上的写入(使用 batch_mutate 在同一列中更新许多列)与在同一节点上的读取不隔离 到相同的行键的列,保证读取没有准备好“部分更改的数据”?示例:
Current Status: [KEY=1 , ColumnName=A with Value=A , ColumnName=B with Value=B] on Node 1
Client A => Writes: [KEY=1 , ColumnName=A with Value=C , ColumnName=B with Value=D] on Node 1
原子性:
根据 cassandra 文档,对于执行写入的客户端,写入是原子的:
上面的写法要么完全成功,要么完全失败!?
就像是
[KEY=1 , ColumnName=A with Value=C , ColumnName=B with Value=B]
(=一半的列更新成功,
但另一半尚未应用/失败)在发生错误的情况下不能是写入的结果?
这是正确的吗?
隔离:
对于在同一节点上读取同一行的人来说,即使在一个单一节点(此处为节点 1)上,写入也不是孤立的,这是真的吗? 如上所述,如果客户端 A 更新了其一半的要更改的列(此处 ColumnName=A 和 Value=C ), 真的吗,另一个连接节点 1 的客户端 B 确实会将记录视为
Client B => Reads: [KEY=1 , ColumnName=A with Value=C , ColumnName=B with Value=B] on Node 1
几毫秒后,再次读取它会看到 ?
Client B => Reads: [KEY=1 , ColumnName=A with Value=C , ColumnName=B with Value=D] on Node 1
.
为什么更新没有在每个节点的基础上隔离?
对我来说这似乎很容易而且便宜? 为什么节点 1 上没有内存锁,KEY=1 当前正在更新,因此读取可以等待完成此写入? (这只是一个非常小的开销,因为锁在本地保存在 Node1 的内存中,并且可以配置为读取客户端可以接受“锁”或简单地读取一个脏值? 所以它类似于“可配置隔离级别”?如果我需要高性能,我会忽略锁/禁用它们,如果我需要在每个节点的基础上进行隔离并接受 负面性能影响,然后我等待内存锁(在节点 1 上)被释放? (请注意,我不是在谈论集群锁/分布式锁,而是在单个处理上保证写入在每个行键的基础上被隔离的锁!)
或者在“更改现有列”与“附加/添加列”操作方面,隔离是否不同。因此,链接 columsn(如上例所示是孤立的)但添加新的 columsn 不是孤立的。从我的角度来看,更改现有列必须是隔离的/原子的...。添加列不需要隔离...
我为什么要问这个问题:如果像上面描述的那样的事情可能发生,那读取真的读取了部分更改的记录,什么 那么用例对于 nosql/cassandra 是合法的吗?这意味着任何类型的随机列数据都可以作为列存在于每行的基础上 可能处于任何随机读/写状态?我几乎不知道每行允许“任意”更改的任何数据和用例 基础。
非常感谢!!! 延斯
最佳答案
Why is there no in memory lock held on Node 1, that KEY=1 is currently in the process of being updated so a read can wait to finish this write?
因为 Cassandra 非常强调性能的非规范化(分布式连接不扩展,是的,我在这里正确使用“扩展”——分布式连接在集群中的机器数量上是 O(N)),写入量“实体化 View ”行可能非常高。因此,行级锁定会为许多现实世界的工作负载引入 Not Acceptable 争用。
关于java - Cassandra = 单个节点上单个行上的列更新的原子性/隔离?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6033888/