用Hadoop(或pig或Hive)生成时间序列的最简单方法是什么?或者在哪里可以获取有关适当功能的信息?
例如,我想从2010年1月1日00:00:00到2010年12月31日23:59:59生成一个1秒的序列。
对于其他程序,例如R,非常简单,因为它们具有处理日期和时间的许多功能。
问候
最佳答案
您可以使用一个空的map()方法编写一个映射器。在cleanup()方法中,使用多个Java包(例如Joda)中的任何一个,以帮助在将时间戳写入上下文之前进行迭代并格式化时间戳。
关于date - 如何使用Hadoop生成时间序列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18487962/