我正在尝试在 AWS 上使用 R 连接到我们运行 Cloudera hadoop 的集群。按照这里提到的步骤 - http://blog.cloudera.com/blog/2013/12/how-to-do-statistical-analysis-with-impala-and-r/
到目前为止,我可以启动 jdbc 驱动程序,但无法连接到 impala。
.
通过一些调查,我可以看到 impala 守护程序正在我们所有的工作节点中运行。端口是这样配置的。
另外,我登录到其中一个工作节点并检查了正在监听的端口。我可以看到端口 21050 正在监听,这里是,
在 rimpala connect 中,我使用的是工作节点的公共(public) IP。仍然无法连接到那个。我可以使用公共(public) IP 和端口 25000 来查看 impala Web UI,但无法连接到该端口监听 jdbc 请求。任何人都可以帮助我吗?
最佳答案
如果有人在寻求帮助,这是我从 Cloudera 支持部门得到的答案。
"The problem is not with the Impala or Cloudera distro. The problem is with the driver being used by “Rimpala”. RImapla is using HIVE JDBC driver. If you check the source code at https://github.com/Mu-Sigma/RImpala/blob/master/java/src/main/java/com/musigma/ird/bigdata/RImpala.java you will see that the calls being used as the drive is “org.apache.hive.jdbc.HiveDriver” . So ideally RImpala package is outdated and it is not updated to work."
关于r - Cloudera RImpala 连接不工作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38578621/