hadoop - 添加对 scalding 的 parquet-avro 支持

标签 hadoop avro cascading scalding parquet

如何创建一个 Scalding Source 来处理 avroparquet 之间的转换。

解决方案应该:

 1. Read from parquet format and convert to avro memory representation
 2. Write avro objects into a parquet file

注意:我注意到 Cascading 有一个用于利用 thrift 和 parquet 的模块。我突然想到这将是一个开始寻找的好地方。我还在 google-groups/scalding-dev 上开了一个帖子

最佳答案

关于hadoop - 添加对 scalding 的 parquet-avro 支持,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25809463/

相关文章:

hadoop - 配置单元 hadoop : selecting data from table getting error

hadoop - java.io.IOException : Not a data file 异常

javascript - 在 javascript 中访问级联 JSON

scala - 如何在烫金工作结束时只执行一次操作?

hadoop - Hadoop jar命令和job命令的区别

sql-server - Sqoop导出到SQL Server-无法解析字符串值(NTL-NATIONAL)

serialization - avro-rs解释 `uuid`给出SerdeError

java - Java 中的关联数组

php - 如何从其他表中删除数据 - WordPress

shell - 当我使用ssh进入Sandbox时,只需在shell中键入hive,就可以在stderr中获得此输出