python - 基于 JSON 文件创建 DataFrame 时 Spark SQL "No input paths specified in jobs"

标签 python json

我是 Spark 的初学者，我正在尝试按照指南使用 PySpark 创建一个基于 JSON 文件内容的 DataFrame:http://spark.apache.org/docs/1.6.1/sql-programming-guide.html#overview

但是，每当我执行这个命令时(同时使用相对路径或绝对路径)

df = sqlContext.read.json("examples/src/main/resources/people.json")

总是给我错误

java.io.IOException: No input paths specified in job

Snapshot of error

这些问题的原因是什么，或者是否有我遗漏的任何 Spark 配置？我正在使用 Spark 1.6.1 和 Python 2.7.6。

最佳答案

我也遇到了这个问题，添加“file://”或“hdfs://”对我有用!感谢杰西卡的回答!!!

总之，如果你的json文件在你的本地文件系统中，使用

df = sqlContext.read.json("file:///user/ABC/examples/src/main/resources/people.json")

否则，如果您的 json 文件在 hdfs 中，请使用

df = sqlContext.read.json("hdfs://ip:port/user/ABC/examples/src/main/resources/people.json")

关于python - 基于 JSON 文件创建 DataFrame 时 Spark SQL "No input paths specified in jobs"，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38150311/

上一篇：python - 如何在没有相应值的列表中添加 None ？

下一篇：python - 在python中递归调用类内部的方法

相关文章：

python - 将文件中的一行文本加载到 Kivy 标签

python - 如何计算一个单词在文本中出现的次数

python - 将词袋 scikits 分类器与任意数字字段合并

python - 在 intellij 中导入新的 python 模块的最佳方法是什么？

json - -- 带有完成 URLRequest - JSON 的函数调用

c# - 如何在 json 请求的方法中路由

php - 如何在 PHP :json_encode 中使用 UTF-8

python - 如何使用 print 在 Python 中显示特殊字符

javascript - 将返回值从 php 传递给 js

javascript - Parse.Object.extend 的 JSON.stringify 返回 "[object Object]"