csv - 将 CSV 文件导入 Hadoop

标签 csv hadoop2

我是 Hadoop 的新手,我有一个文件可以通过命令行导入到 hadoop(我通过 SSH 访问机器)

如何在hadoop中导入文件?
之后如何检查(命令)?

最佳答案

导入csv文件的2个步骤

  • 使用 winscp 或 Cyber​​duck 将 csv 文件移动到 hadoop sanbox (/home/username)。
  • 使用 -put 命令将文件从本地位置移动到 hdfs。
        hdfs dfs -put /home/username/file.csv /user/data/file.csv
    
  • 关于csv - 将 CSV 文件导入 Hadoop,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34277239/

    相关文章:

    java - 使用 Java 将 .csv 文件解析为 xml

    php - 使用 PHP/MySQL 导入 CSV 数据

    arrays - Swift 5 将文本文件读入 Int/Doubles 的二维数组

    apache-spark - 带有类型安全配置的 Spark 2.1.1

    hadoop - Map-Reduce 没有像预期的那样减少复杂的键和值

    python - 我如何从 csv 文件中获取 dict 作为 dict

    c# - 使用标题 c# 拆分 CSV 文件

    hadoop - 未指定行号时使用 MapReduce 进行矩阵转置

    hadoop - 如何为大数据集群分配物理资源?

    hadoop - 尽管表中有主键,但导入时 Sqoop --split-by 错误