apache-spark - var hFile = sc.textFile ("hdfs://localhost:9000/ex1/cen.csv") 输入路径不存在错误

我试图在 spark 中访问 hadoop 文件，但出现此错误

org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: hdfs://localhost:9000/ex1/cen.csv
  at org.apache.hadoop.mapred.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:287)

我可以在hadoop中显示文件

hadoop dfs -cat ex1/cen.csv

最佳答案

当你尝试

hadoop dfs -cat ex1/cen.csv

HDFS中读取文件的路径为

/user/.../ex1/cen.csv

但如果你尝试

hadoop dfs -cat /ex1/cen.csv

目录/ex1 必须放在根目录/ 你想做什么

 hdfs://localhost:9000/ex1/cen.csv

是从根目录读取，我想，你的文件不在那里是因为

/ex1/cen.csv

ex1/cen.csv

是不同的路径。

关于apache-spark - var hFile = sc.textFile ("hdfs://localhost:9000/ex1/cen.csv") 输入路径不存在错误，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/61873840/

上一篇：.net - 在 Jenkins 上构建和部署 Docker 需要越来越长的时间

下一篇：scala - 带有 Hive Warehouse Connector 的 Spark 应用程序在 Hive 表中错误地保存数组和映射字段

相关文章：

hadoop - 在 Cassandra 表上运行 PIG 脚本

python-2.7 - PySpark 使用统计信息写入 Parquet 二进制列(signed-min-max.enabled)

apache-spark - 获取数组中项目的索引，该数组是 Spark 数据帧中的一列

bash - 如何让 HBase 等到 HDFS 准备好后才开始？

hadoop - 是否每次都需要伪分发模式下的Namenode格式

hadoop - 如何设置首选项以在 Eclipse 中运行 PIG 脚本？

scala - 在 Scala 中转换所有数据框列的有效方法

apache-spark - 下载页面上Spark的包类型有什么区别？

scala - Spark消费者不读取Kafka生产者消息Scala

hadoop - Hive 3.1.1安装问题: Cannot find hadoop installation: $HADOOP_HOME or $HADOOP_PREFIX must be set or hadoop must be in the path