apache-spark - var hFile = sc.textFile ("hdfs://localhost:9000/ex1/cen.csv") 输入路径不存在错误

标签 apache-spark hadoop

我试图在 spark 中访问 hadoop 文件,但出现此错误

org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: hdfs://localhost:9000/ex1/cen.csv
  at org.apache.hadoop.mapred.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:287)

我可以在hadoop中显示文件

hadoop dfs -cat ex1/cen.csv

最佳答案

当你尝试

hadoop dfs -cat ex1/cen.csv

HDFS中读取文件的路径为

/user/.../ex1/cen.csv 

但如果你尝试

hadoop dfs -cat /ex1/cen.csv

目录/ex1 必须放在根目录/ 你想做什么

 hdfs://localhost:9000/ex1/cen.csv

是从根目录读取,我想,你的文件不在那里是因为

/ex1/cen.csv

ex1/cen.csv

是不同的路径。

关于apache-spark - var hFile = sc.textFile ("hdfs://localhost:9000/ex1/cen.csv") 输入路径不存在错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61873840/

相关文章:

hadoop - 在 Cassandra 表上运行 PIG 脚本

python-2.7 - PySpark 使用统计信息写入 Parquet 二进制列(signed-min-max.enabled)

apache-spark - 获取数组中项目的索引,该数组是 Spark 数据帧中的一列

bash - 如何让 HBase 等到 HDFS 准备好后才开始?

hadoop - 是否每次都需要伪分发模式下的Namenode格式

hadoop - 如何设置首选项以在 Eclipse 中运行 PIG 脚本?

scala - 在 Scala 中转换所有数据框列的有效方法

apache-spark - 下载页面上Spark的包类型有什么区别?

scala - Spark消费者不读取Kafka生产者消息Scala

hadoop - Hive 3.1.1安装问题: Cannot find hadoop installation: $HADOOP_HOME or $HADOOP_PREFIX must be set or hadoop must be in the path