当前分类:apache-pig

hadoop - 在 Apache Pig 中合并两个数据集

hadoop - 使用 PigLatin (Hadoop) 加载多个文件

node.js - 跑 pig 脚本

regex - pig : extracting email details from raw text using REGEX

hadoop - 如何根据输入大小设置 reducer 数量

hadoop - 运行 Cassandra + Pig 时出错

java - 在 yarn 上运行时 apache Pig 出现错误 "org.apache.hadoop.ipc.Client - Retrying connect to server: tasktracker3/10.201.2.169:50000"

cassandra - 导入 Cassandra - 使用 python UDF 和 CqlStorage 传递列表对象

hadoop - 从 CSV 文件加载中删除 header

hadoop - 我需要在oozie 的workflow.xml 和job.properties 中提供配置吗?

apache-pig - 使用 JsonStorage 和 Apache Pig 保存为 bz2 格式

hadoop - 在 Hadoop 2.2 上安装 oozie

hadoop - pig 脚本中的代理键

hadoop - 用 Pig 分割字符串

apache-pig - Piglatin 中的窗口函数(rank over() 等)

apache-pig - pig : positionals counting from right?

hadoop - 如何重命名包中的字段

apache-pig - 减去 Pig 中的两个包/关系

python - 如何在 Amazon EMR 上的 Pig 中使用 Python 流 UDF

hadoop - 无法从 loadFunc org.apache.pig.builtin.AvroStorage 获取架构

热门标签: