python - Spark "sum"命令给出方法 sum([class java.util.ArrayList]) 不存在

标签 python arrays apache-spark sum aggregate-functions

我是不是疯了?

from pyspark.sql.functions import *
sum([2,3,2])

给予:

py4j.Py4JException: Method sum([class java.util.ArrayList]) does not exist

我怎样才能得到一个简单的总和?

幕后到底发生了什么,让事情变得如此困难?

最佳答案

通过 from pyspark.sql.functions import *,您将使用 pyspark.sql.functions 模块中的 sum 函数覆盖 python 标准库中的 sum 函数。为了避免覆盖,您可以导入模块:

import psypark.sql.functions as f

并将两个求和函数称为 f.sumsum

或者为 pyspark 中的 sum 函数指定一个别名。

from pyspark.sql.functions import sum as fsum

这样您就不会在同一作用域中引入两个 sum 函数。

关于python - Spark "sum"命令给出方法 sum([class java.util.ArrayList]) 不存在,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58436789/

相关文章:

java - 如何确定数组中是否还有未分配的值?

python - 单 GPU 上的 Tensorflow 2.0 训练模型

Python 寻找质因数

python - 如何理解开放图像数据集的边界框注释?

java - 如何从 Spark 运行独立的 jar。

mysql - java.sql.BatchUpdateException : transaction too large, 长度:300200

python - 如何通过id合并Spark数据帧?

python - 输入 : type hinting when function returns tuple with unpacked list

c# - 采用 List<T>[] 的 Action 委托(delegate)的问题

java - 在另一个类的参数中将数组设置为空的最佳方法