python - java.io.IOException : Cannot run program "python" using Spark in Pycharm (Windows) 异常

标签 python windows pycharm pyspark

我正在尝试在 Pycharm 中使用 Spark 编写一个非常简单的代码,我的操作系统是 Windows 8。我一直在处理几个问题,除了一个问题之外,它们都以某种方式设法解决了。当我使用 pyspark.cmd 运行代码时,一切正常,但我在 pycharm 中使用相同的代码时运气不好。我使用以下代码修复了 SPARK_HOME 变量的问题:

import sys
import os
os.environ['SPARK_HOME'] = "C:/Spark/spark-1.4.1-bin-hadoop2.6"
sys.path.append("C:/Spark/spark-1.4.1-bin-hadoop2.6/python")
sys.path.append('C:/Spark/spark-1.4.1-bin-hadoop2.6/python/pyspark')

所以现在当我导入 pyspark 时一切正常:

from pyspark import SparkContext

当我想运行其余代码时,问题出现了:

logFile = "C:/Spark/spark-1.4.1-bin-hadoop2.6/README.md"
sc = SparkContext()
logData = sc.textFile(logFile).cache()
logData.count()

当我收到以下错误时:

15/08/27 12:04:15 ERROR Executor: Exception in task 0.0 in stage 0.0 (TID 0)
java.io.IOException: Cannot run program "python": CreateProcess error=2, The system cannot find the file specified

我已将 python 路径添加为环境变量,并且它可以使用命令行正常工作,但我无法弄清楚这段代码的问题所在。非常感谢任何帮助或评论。

谢谢

最佳答案

我遇到了和你一样的问题,然后我做了如下修改: 在 Pycharm 的 Edit Configurations 中设置 PYSPARK_PYTHON 为环境变量指向 python.exe,这是我的例子:

PYSPARK_PYTHON = D:\Anaconda3\python.exe

SPARK_HOME = D:\spark-1.6.3-bin-hadoop2.6

PYTHONUNBUFFERED = 1

关于python - java.io.IOException : Cannot run program "python" using Spark in Pycharm (Windows) 异常,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32255018/

相关文章:

python - 使用 Python 的 PowerShell 中的 Unicode? Windows 中的替代 shell?

python-3.x - Pycharm 控制台更新后无法连接

python - wordnet路径相似度是可交换的吗?

python - 在每个页面上搜索输入。 Django

Python .read() 无法将 CSV 正确读入字符串

python - 无法在 Windows 上安装 Fiona

html - C++ Windows 套接字 : Downloading an html file

python - 将 3 个不同的数据集保存到同一 Excel 文件下的 3 个不同的工作表中

PyCharm 热键在插入符号处缩进/取消缩进一行?

python - 谁能帮我解决这个 PyCharm 和 Import Modular 错误?