java - 在远程客户端计算机上运行sqoop

标签 java hadoop sqoop sqoop2

我正在尝试使用Java从客户端计算机运行sqoop导入。我将关注sqoop客户端api文件。

我有以下查询

  • 我从中运行客户端Java类的机器不需要在其上安装hadoop
  • 我在此系统上安装了cloudera 5.5.1,并且安装了sqoop,我可以使用它吗

  • 如果我问的是愚蠢的问题,请原谅我。我已经从CLI实现了sqoop,但是在远程访问方面很挣扎

    最佳答案

    Sqoop 2作为两个单独的软件包分发:客户端软件包(sqoop2-client)和服务器软件包(sqoop2-server)。将服务器软件包安装在群集中的一个节点上;由于Sqoop 2服务器充当MapReduce客户端,因此该节点必须已安装并配置了Hadoop。

    在将充当客户端的每个节点上安装客户端软件包。 Sqoop 2客户端将始终连接到Sqoop 2服务器以执行任何操作,因此无需在客户端节点上安装Hadoop。

    因此,您的问题的答案如下:

    问题1:客户端不充当mapreduce客户端,因此您不需要在仅充当Sqoop客户端的节点上安装Hadoop。

    问题2:,只要是sqoop的客户端版本,我想是的,您可以使用它。

    关于java - 在远程客户端计算机上运行sqoop,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37176933/

    相关文章:

    java - 如何获取和查看从HDFS到本地系统的Oracle BLOB(图像)数据?

    java - 如何将旧的 Java 版本与新版本一起安装以在 eclipse spring 中使用?

    Java 理解 I/O 流

    python - 并行化 GZip 文件处理 Spark

    mongodb - mongo-hadoop,如何在配置单元中查询时间戳列

    hadoop - pig 压扁错误

    mysql - 使用带有 Sqoop 的 Oozie 将数据从 HiveQL 导出到 MySQL

    hive - 当我有\N 作为数据时,sqoop-export 失败

    java - 我在某些计算机上收到 "Topic not present in metadata after 60000 ms"消息

    java - 将图像渲染到JPanel的向后兼容性问题上-我在做什么错?