Datastax 代理偶尔无法报告指标

标签 datastax datastax-enterprise opscenter

我正在使用 OpsCenter 5.1.1 运行 DSE 4.6.5 集群 (Cassandra 2.0.14.352)

一天一两次,其中一个节点(有时更多)停止报告指标,直到我手动重新启动 datastax-agent。

在我重新启动代理之前,它是事件的。这是代理日志:

WARN [Thread-13] 2015-04-14 23:20:23,277 Cassandra operation queue is full, discarding cassandra operation
WARN [Thread-13] 2015-04-14 23:20:23,277 131176 operations dropped so far.
WARN [Thread-13] 2015-04-14 23:20:23,277 Cassandra operation queue is full, discarding cassandra operation
WARN [Thread-13] 2015-04-14 23:20:23,277 131177 operations dropped so far.
WARN [Thread-13] 2015-04-14 23:20:23,278 Cassandra operation queue is full, discarding cassandra operation
WARN [Thread-13] 2015-04-14 23:20:23,278 131178 operations dropped so far.
WARN [Thread-13] 2015-04-14 23:20:23,278 Cassandra operation queue is full, discarding cassandra operation
WARN [Thread-13] 2015-04-14 23:20:23,278 131179 operations dropped so far.
WARN [Thread-13] 2015-04-14 23:20:23,278 Cassandra operation queue is full, discarding cassandra operation
WARN [Thread-13] 2015-04-14 23:20:23,278 131180 operations dropped so far.
ERROR [cassandra-processor-1] 2015-04-14 23:20:24,387 Error when proccessing cassandra callcom.datastax.driver.core.exceptions.NoHostAvailableException: All host(s) tried for query failed (no host was tried)

请注意:

  • 所有节点都在同一个数据中心,具有相同的硬件 规范和相同的配置。
  • 节点使用两个 NIC,因此 rpc_address 和 listen_address 在不同的网络上
  • OpsCenter 在其中一个集群节点上运行
  • 写得很密集:请查看我的其他question

总而言之,在其中一台机器上(以循环方式),代理停止报告数据,而在另一台机器上工作正常。 重新启动代理服务可以解决问题,但它不应该自行重启吗?这是一个错误吗?我该如何解决这个问题?

如果您需要更多信息,请告诉我。 谢谢。

最佳答案

我见过同样的事情。您可以尝试两件事。

1) 排除或限制您从中收集指标的键空间/CF。 http://docs.datastax.com/en/opscenter/5.1/opsc/configure/opscControllingDataCollection_c.html?scroll=concept_ds_jlq_xk4_gk

2) 在单独的集群上运行 Opscenter(例如与主集群分开的一个或两个节点的小型集群)。 http://www.datastax.com/dev/blog/storing-opscenter-data-in-a-separate-cluster

老实说,选项 2 是更明智的做法,您不需要大型节点,如果您在主集群上收集指标并且该集群崩溃,那么您就在盲目运行。

关于Datastax 代理偶尔无法报告指标,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29647022/

相关文章:

database-design - 在 cassandra 中更改或创建新表以添加新列

datastax-enterprise - 用于 OpsCenter 备份到 S3 用户的 IAM 策略

java - Cassandra 写入后读取与 LOCAL_QUORUM 不一致

cassandra - datastax cassandra java驱动程序的访问器是否使用分页?

cassandra - Cassandra CQL 中 Varchar 和文本类型有什么区别

mysql - 运行 Sqoop 演示。无主机可用异常

solr - 如何查明 DSE 使用的 Solr 版本

apache-spark - 如何获取 saveToCassandra 并使用它?

cassandra - 自动配置Opscenter以管理现有的Cassandra集群

cassandra多数据中心数据同步滞后