hadoop - 配置单元 cli 中的 "Add <directory>"

标签 hadoop hive bigdata hadoop-streaming

我想要类似的东西

$hive
> ADD FILE <directory_path>;

添加一个目录到 hive 的工作目录。

我正在使用配置单元 0.7。
我需要这个来添加 python 包以供 mapper/reducer 脚本使用。
我有哪些选择?

最佳答案

对于 0.7.1,您可以使用 shell 转义符 (!) 来运行 !hadoop fs -mkdir <path>或“dfs”命令 dfs -mkdir <path> .查看cli wiki page获取更多信息。不确定这些是否在 0.7 中。

关于hadoop - 配置单元 cli 中的 "Add <directory>",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12189367/

相关文章:

hadoop - 如何从本地磁盘而不是HDFS上的数据在Hive上创建外部表?

hadoop - 使用 MapReduce 解析 Freebase RDF 转储

hadoop - hive 外部表中的 RELY 约束是什么?

xml - 如何在Hive中使用横向 View explode 以获取XML数据格式?

amazon-dynamodb - Dynamodb updateitem 仅具有全局二级索引

hadoop - 如何在 Hive 中使用 NOT IN

hadoop - 如何高效查找top-k元素?

hadoop - Oozie MR 启动器有什么意义?

python - 使用python 3连接hive

bigdata - 如果 kafka 的一个副本宕机以跟上复制因子,kafka 会创建一个新的追随者吗