我有一个 DataFrame,其中包含以下数据:
+----+-----+---+-----+
|Year|Month|Day|... |
+----+-----+---+-----+
|2012| 2| 20| |
|2011| 7| 6| |
|2015| 3| 15| |
我想添加一个包含日期的列
最佳答案
将列合并在一起,然后使用 unix_timestamp
和 to_date
获取时间戳列。对于输入数据帧df
:
df.withColumn("merge", concat_ws("-", $"Year", $"Month", $"Day"))
.withColumn("date", to_date(unix_timestamp($"merge", "yyyy-MM-dd").cast("timestamp")))
.drop("merge")
关于dataframe - 如何从spark(scala)中的不同年、月、日列获取日期,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47151297/