r - Cloudera RImpala 连接不工作

标签 r hadoop cloudera impala

我正在尝试在 AWS 上使用 R 连接到我们运行 Cloudera hadoop 的集群。按照这里提到的步骤 - http://blog.cloudera.com/blog/2013/12/how-to-do-statistical-analysis-with-impala-and-r/

到目前为止,我可以启动 jdbc 驱动程序,但无法连接到 impala。

enter image description here .

通过一些调查,我可以看到 impala 守护程序正在我们所有的工作节点中运行。端口是这样配置的。

enter image description here

另外,我登录到其中一个工作节点并检查了正在监听的端口。我可以看到端口 21050 正在监听,这里是,

enter image description here

在 rimpala connect 中,我使用的是工作节点的公共(public) IP。仍然无法连接到那个。我可以使用公共(public) IP 和端口 25000 来查看 impala Web UI,但无法连接到该端口监听 jdbc 请求。任何人都可以帮助我吗?

最佳答案

如果有人在寻求帮助,这是我从 Cloudera 支持部门得到的答案。

"The problem is not with the Impala or Cloudera distro. The problem is with the driver being used by “Rimpala”. RImapla is using HIVE JDBC driver. If you check the source code at https://github.com/Mu-Sigma/RImpala/blob/master/java/src/main/java/com/musigma/ird/bigdata/RImpala.java you will see that the calls being used as the drive is “org.apache.hive.jdbc.HiveDriver” . So ideally RImpala package is outdated and it is not updated to work."

关于r - Cloudera RImpala 连接不工作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38578621/

相关文章:

r:使用库读取 libsvm 文件(e1071)

r - 使用 ggplot2 手动着色置信区间

java - 如何从需要一些快速矿工jar的Hadoop运行Java jar

linux - cloudera 安装中的 PIG_HOME、PIG_INSTALL 是什么?

java - 不兼容的类更改错误: Implementing class

hadoop - 并行停用多个 Hadoop DataNode

r - 如何使用整洁的求值语义来选择、复制和重命名 tibble 中的多个列?

r - R中的pdftools在不同机器上的表现不同

mongodb - Mongo DB 上有 100 TB 的数据?可能的?

hadoop - Spark - 寻找重叠值或寻找共同 friend 的变体