r - 使用RJDBC从Hive导入数据到R

标签 r hadoop jdbc

我的数据驻留在Azure云上的Hive数据库中,链接为“https://onetaxsitintegratedcluster.azurehdinsight.net/#/main/view/HIVE/random_instance
“。我具有相同的用户名和密码。我尝试使用以下方法从R中读取数据,但会引发错误

drv <- JDBC("org.apache.hive.jdbc.HiveDriver", 
            "C:/Users/japrab/Documents/R/win-library/3.4/RJDBC/java/hive-jdbc-2.0.0.jar")

conn <- dbConnect(drv,"https://integratedcluster.azurehdinsight.net/#/main/view/HIVE/random_instance", "userid", "passwords")

我得到的错误是:
options( java.parameters = "-Xmx8g" )
drv <- JDBC("org.apache.hive.jdbc.HiveDriver", "C:/Users/japrab/Documents/R/win-library/3.4/RJDBC/java/hive-jdbc-2.0.0.jar")
conn <- dbConnect(drv, "integratedcluster.azurehdinsight.net/#/main/view/HIVE/random_instance", "user", "password")

.verify.JDBC.result(jc,“无法将JDBC连接到”,url)中的错误:
无法将JDBC连接到Integratedcluster.azurehdinsight.net/#/main/view/HIVE/auto_hive20_instance

请帮忙。我看到的所有示例都有本地主机,但是不确定数据在云上时该怎么办!

最佳答案

我认为问题可能出在您从自己的系统引用 hive jar 。如果您的数据已加载到云中的Hive数据库中,则云服务器必须正在运行Hadoop和Hive本身。我相信您需要引用这些 jar 。

关于r - 使用RJDBC从Hive导入数据到R,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45734175/

相关文章:

r - 编写创建列的 R 函数

hadoop - 如何从 sequenceFile 创建一个 spark DataFrame

hadoop - 当我在 Hadoop 上运行我自己的代码时出现 ClassNotFoundException

java - SQLite 无法通过 JDBC 和 jOOQ 在 SELECT 中找到现有列

java - Java 中的 addBatch() 执行

r - 将 R 连接到 Quickbooks

从 ggplot2 中的误差条中删除端点

r - 数据框排列/重新排列和删除重复列

python - 程序在具有hadoop的AWS EMR上失败(在本地计算机上正常)

java - 配置单元 jdbc 连接超时