shell - 使用 azure 数据工厂 (ADF) 从 Pig/Hive 事件运行 shell 脚本

标签 shell azure hadoop azure-hdinsight azure-data-factory

我正在使用 Azure Blob 存储、带有 HDInsight 群集的数据工厂。 我有一个 shell 脚本,其中包含 hadoop 和 hive 相关代码,我正在尝试在 ADF 中添加/创建 hive/Pig 事件,从 pig/hive 的代码中我调用 shell 脚本;如

myFile.pig

sh /myFolder/myscript.sh

============================

myFile.hql

!/myFolder/myscript.sh

执行时,我收到 Java.IO.Excption |没有这样的文件或目录 。 根据异常 pig/hive 文件无法识别 shell 脚本路径;

是否有人遇到过类似的问题,或者是否有人部署了 Pig/Hive 事件以及 ADF 的 shell 脚本。

我尝试了多种方法和所有可能的路径组合来传递 shell 脚本的位置,但它没有被采纳,任何帮助/建议/指针都将非常值得赞赏。

提前致谢。

最佳答案

将 shell 脚本上传到 blob 存储,然后调用该脚本到 pig 或 hive,步骤如下。

Hive 

    !sh hadoop fs -ls wasbs://<a href="https://stackoverflow.com/cdn-cgi/l/email-protection" class="__cf_email__" data-cfemail="b2d1dddcc6cbd3dbdcd7fcd3dfd7f2e1c6ddc0d3d5d7f3d1d1ddc7dcc6fcd3dfd79cd0deddd09cd1ddc0d79cc5dbdcd6ddc5c19cdcd7c6" rel="noreferrer noopener nofollow">[email protected]</a>/pathToScript/testshell.ksh

Pig 
    sh hadoop fs -ls wasbs://<a href="https://stackoverflow.com/cdn-cgi/l/email-protection" class="__cf_email__" data-cfemail="05666a6b717c646c6b604b6468604556716a776462604466666a706b714b6468602b67696a672b666a77602b726c6b616a72762b6b6071" rel="noreferrer noopener nofollow">[email protected]</a>/pathToScript/testshell.ksh

关于shell - 使用 azure 数据工厂 (ADF) 从 Pig/Hive 事件运行 shell 脚本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43803573/

相关文章:

java - 在 hadoop 中使用 ImageJ 并获得 awt headless 异常

linux - Shell - 抑制单个命令的输出

linux - 更改/etc/fstab 的位置

bash - 在 bash 中,如何设置变量来包含可变数量的命令行参数?

Hadoop: `hdfs getconf -confKey [key]` 有哪些关键参数可用?

hadoop - HDFS 主目录

shell - 创建一个 shell 脚本以在 mongodb 中自动导出 csv

image - 将Redmine docker容器部署到应用服务

sql-server - 文件组中没有足够的空间来完成空文件操作

azure - 如何从应用程序洞察中删除前门运行状况探测