当前分类:apache-spark-sql

hive - 为什么 Spark SQL 使用来自 Hive 的 hive-site.xml 会失败并显示 "NumberFormatException: For input string: "1s""?

jdbc - Spark作业服务器错误类未找到异常

scala - SqlContext 不是包 org.apache.spark.sql 的成员

apache-spark - 将聚合列添加到 Spark DataFrame

apache-spark - updateStateByKey函数返回的DStream是否只包含一个RDD?

java - JDBC 连接无法从 apache Spark 连接 Teradata

scala - 在 Spark sql 数据帧(UDAF)上的自定义案例类上实现总和聚合器

apache-spark - Spark任务反序列化时间

java - Apache-spark dataframe 列名称不一致,为什么会发生这种情况?

scala - 从 Kafka 进行流聚合时在 "deadlock"中运行

scala - 使用 dataframe : Collect return empty array 进行 Spark 单元测试

apache-spark - 使用日期字段对 Dataframe 进行 Spark 分区并在每个分区上运行算法

scala - Apache Spark reduceByKey 对小数求和

apache-spark - 使用 map 创建新列

caching - SparkSQL序列化缓存

scala - 配置 Spark 和独立的 Hive MetaStore 将 DafaFrames 持久保存到 s3

sql - SparkSQL : conditional sum on range of dates

python - "normalize"将句子的数据帧转换为更大的单词数据帧

sql - Spark SQL中如何计算满足某个条件的总数的百分比

apache-spark-sql - 读取列中具有混合数据类型的 Parquet 文件

热门标签: