apache-spark - Windows 上的 Pyspark : WARN Failed to load NativeSystemBLAS and NativeRefBLAS

标签 apache-spark pyspark lapack blas

我是 Spark 的新手。我在 Windows 10 中安装了 Spark 2.3.0 以使用 PySpark。 我使用 Pyspark 编写了一段代码,然后当我运行它时,它给了我以下警告:

WARN  BLAS:61 - Failed to load implementation from: com.github.fommil.netlib.NativeSystemBLAS
WARN  BLAS:61 - Failed to load implementation from: com.github.fommil.netlib.NativeRefBLAS

我在网上搜索并找到了一些解决方案,但步骤对我来说不清楚,而且大多数都是针对 Ubuntu 而不是 Windows..

我认为解决方案是安装 BLAS 和 LAPACK ,我从这里下载了二进制包 OpenBLAS https://sourceforge.net/projects/openblas/files/

但我不知道下一步该怎么做才能安装它们以供 Spark 使用?

最佳答案

这可以通过仔细阅读 https://github.com/fommil/netlib-java/ 上的指南来解决。 。

很可能是以下原因之一或两者兼而有之:

  1. 您没有使用 -Pnetlib-lgpl 编译 Apache Spark,或添加 com.github.fommil.netlib:all:1.1.2 作为依赖项。没有它,将不会使用任何外部库。建筑很简单,请参阅Failed to load implementation NativeSystemBLAS HiBench
  2. 您的系统不知道在哪里可以找到这些库。确保它们位于 %PATH% 上,以便 netlib 可以找到它们。

再次强调,阅读 https://github.com/fommil/netlib-java/ 上的指南是有意义的。

关于apache-spark - Windows 上的 Pyspark : WARN Failed to load NativeSystemBLAS and NativeRefBLAS,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50310883/

相关文章:

hadoop - Oozie 堆栈跟踪

scala - 无法使用 Spark 结构化流覆盖默认值 "spark.sql.shuffle.partitions"

c++ - LAPACK 函数 dgtsv 使用 c++/Visual Studio 提供未解析的外部符号

c++ - LAPACK zgemm op(A) 维度

hadoop - 使用 Spark on YARN 支持构建 Oozie 4.2.0

python - 计算 PySpark DataFrame 列的模式?

Pyspark - groupby 按顺序连接字符串列

python-2.7 - PySpark 动态 When 语句

python - 使用备用 LAPACK/BLAS 在 Mac OS X Mavericks 上安装 numpy

apache-spark - PySpark:当另一列值满足条件时修改列值