scala - 如何更改 Spark 中的日期格式?

标签 scala apache-spark apache-spark-sql

我有以下数据框:

+----------+-------------------+
| timestamp|            created|
+----------+-------------------+
|1519858893|2018-03-01 00:01:33|
|1519858950|2018-03-01 00:02:30|
|1519859900|2018-03-01 00:18:20|
|1519859900|2018-03-01 00:18:20|

如何正确创建时间戳`?

我能够创建timestamp列,它是纪元时间戳,但日期不一致:

df.withColumn("timestamp",unix_timestamp($"created"))

例如,1519858893 指向2018-02-28

最佳答案

只需使用date_formatto_utc_timestamp内置函数

import org.apache.spark.sql.functions._
df.withColumn("timestamp", to_utc_timestamp(date_format(col("created"), "yyy-MM-dd"), "Asia/Kathmandu"))

关于scala - 如何更改 Spark 中的日期格式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49321166/

相关文章:

java - 安装scala出现错误

python - 将 UDF 余弦相似度应用于 Pyspark 中的分组 ML 向量时出现问题

dataframe - 如何创建具有指定模式的空 DataFrame?

scala - 2 种可能状态下的参数类型 T

java - 如何从字符串列表数据集创建字符串数据集 Spark Java

apache-spark - 如何使用 Dataset API 使用序数(例如 SQL 的 'GROUP BY 1' 或 'ORDER BY 2' )?

python - 如何将 pandas 的 DataFrame 转换为 Spark 中的 DataFrame 或 LabeledPoint?

apache-spark - 什么是 DataProcSparkOperator?

Scala 类扩展了 {}

java - 如何在不删除配置单元表的情况下基于 DataFrame 从 SparkSQL 更改表,如删除/添加列?