我在 Spark 数据框中有一列
时间跨度
值采用 ISO 8601 持续时间
例如:P0Y0M0DT0H5M35S
。我想将该值转换为秒。 Spark 或 Scala 中是否有函数可以帮助我做到这一点?我正在寻找方法但没有成功
我尝试了持续时间
import java.time.Duration
java.time.Duration.parse("P0Y0M0DT0H5M35S")
这给了我错误:
java.time.format.DateTimeParseException: Text cannot be parsed to a Duration
我在将值传递给函数时做错了什么吗?我找到了这个文档 https://docs.oracle.com/javase/8/docs/api/java/time/Duration.html
如果我成功地以这种方式做到了这一点,那么将不得不应用额外的逻辑来在整个数据帧列上做到这一点
最佳答案
希望以下方法对您有所帮助。
import org.apache.spark.sql.types._
import org.apache.spark.sql.functions._
val isoToSecondsUDF = udf( (value: String) => (java.time.Duration.parse("PT".concat(value.split("T")(1))).get(java.time.temporal.ChronoUnit.SECONDS)))
val df=Seq(("P0Y0M0DT0H5M35S")).toDF("value")
df.withColumn("seconds",isoToSecondsUDF($"value")).show()
/*
+---------------+-------+
| value|seconds|
+---------------+-------+
|P0Y0M0DT0H5M35S| 335|
+---------------+-------+
*/
关于java - 如何将 ISO 8601 持续时间转换为秒,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63361924/