hadoop - 连接 Cassandra 和 Hive

标签 hadoop cassandra hive

目前我正在使用 Cassandra 2.1.5、Hive 1.2.1 和 Hadoop 2.7.1。我尝试使用本教程将 Cassandra 连接到 Hive:

http://frommyworkshop.blogspot.com/2013/09/real-time-data-processing-with.html

但我似乎陷入了创建外部表的困境:

CREATE EXTERNAL TABLE test.pokes(foo int, bar string) STORED BY 'org.apache.hadoop.hive.cassandra.CassandraStorageHandler' WITH SERDEPROPERTIES ("cassandra.host" = "127.0.0.1" , "cassandra.port" = "9160", "cql.primarykey" = "foo", "comment"="check", "read_repair_chance" = "0.2", "dclocal_read_repair_chance" = "0.14", "gc_grace_seconds" = "989898", "bloom_filter_fp_chance" = "0.2", "compaction" = "{'class' : 'LeveledCompactionStrategy'}", "replicate_on_write" = "false", "caching" = "all");

出现这样的错误:

FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe.initSerdeParams(Lorg/apache/hadoop/conf/Configuration;Ljava/util/Properties;Ljava/lang/String;)Lorg/apache/hadoop/hive/serde2/lazy/LazySimpleSerDe$SerDeParameters;

有人知道如何解决这个问题吗?

最佳答案

解决这个 hive-cassandra 存储处理程序问题可能很乏味。

您在 shell 上发现的错误日志可能并不总是有用。

请引用配置单元日志文件,该文件主要位于/tmp/<user-id>/hive.log。 , 以获取有关失败的实际详细错误消息。

大部分原因可能是因为错误的 cassandra 主机名/端口、 key 空间、 key 配置等

希望这对您有所帮助。

关于hadoop - 连接 Cassandra 和 Hive,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32196732/

相关文章:

hadoop - Apache pig : Filter one tuple on another?

sql - hive - 是否可以从另一列创建一列

java - 正则表达式提取 hive 在以下情况?

java - 如何用Java在cassandra中实现批处理

hadoop - oozie - 捕获日期并将其作为配置单元参数传递

hadoop - 如何使用Hadoop API确定文件是否为空?

hadoop - 字符引用 "&#1"是无效的 XML 字符

hadoop - 在 Oozie 工作流的 Pig Action 中传递 JVM 选项以指向 log4j.properties 文件

java - Cassandra 断言错误

python - 模拟函数调用实际函数