apache-spark - 如何显示已排序的 Dataframe 列名称?

标签 apache-spark pyspark spark-dataframe

我有一个超过 250 列的数据框。我可以使用 df.printSchema 显示列或者我可以使用 df.columns 获得它, 有没有办法以 asc/desc 的排序顺序获取列名(只是列名 - 而不是列的内容)?

最佳答案

PySpark:

sorted(df.columns)

斯卡拉:
df.columns.sorted

关于apache-spark - 如何显示已排序的 Dataframe 列名称?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46896971/

相关文章:

xml - Spark 流 xml 文件

python - Spark DAG 与 'withColumn' 和 'select' 不同

pyspark - 在独立集群上运行 spark 时出错

hadoop - 将BerkeleyDB与Hadoop和Spark结合使用

scala - 从案例类创建 DataFrame

scala - 使用约束将 Apache Spark (Scala) 数据框中的 bool 列转换为数值列?

scala - 使用 Spark 从数据中删除管道分隔符

pyspark - Delta Live Table (DLT) 是否可以作为参数传递给 Databricks 中的用户定义函数 (UDF)?

apache-spark - 嵌套列上的 DataFrame partitionBy

apache-spark - application_的应用报告(YARN上状态: ACCEPTED) never ends for Spark Submit (with Spark 1. 2.0)