Hadoop - HDFS - 查看文件如何拆分的命令

Hadoop FsShell 中是否有命令行(或 hdfs 命令)来查看文件的拆分情况或查看文件在放入 HDFS 时如何在数据节点上拆分？

最佳答案

hdfs fsck 似乎是您所追求的:

$ hdfs fsck /import/collections/part-00000 -files -blocks
Connecting to namenode via http://vm28-hulk-priv:50070
FSCK started by usrhadoop (auth:SIMPLE) from /10.237.241.28 for path /import/collections/part-00000 at Thu Mar 19 07:35:15 EDT 2015
/import/collections/part-00000 3620228 bytes, 1 block(s):  OK
0. BP-1201623000-10.237.241.28-1421858661680:blk_1074635302_894483 len=3620228 repl=3

Status: HEALTHY
 Total size:    3620228 B
 Total dirs:    0
 Total files:   1
 Total symlinks:                0
 Total blocks (validated):      1 (avg. block size 3620228 B)
 Minimally replicated blocks:   1 (100.0 %)
 Over-replicated blocks:        0 (0.0 %)
 Under-replicated blocks:       0 (0.0 %)
 Mis-replicated blocks:         0 (0.0 %)
 Default replication factor:    3
 Average block replication:     3.0
 Corrupt blocks:                0
 Missing replicas:              0 (0.0 %)
 Number of data-nodes:          4
 Number of racks:               1
FSCK ended at Thu Mar 19 07:35:15 EDT 2015 in 1 milliseconds


The filesystem under path '/import/collections/part-00000' is HEALTHY

关于Hadoop - HDFS - 查看文件如何拆分的命令，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29143289/

上一篇：hadoop - 计划的数据加载到 Hadoop 中

下一篇：hadoop - 如何在具有单节点(CentOS)Yarn 集群的单机(CentOS)上安装 spark

相关文章：

sql - Hive 连接或子查询混淆

hadoop - hadoop-1.0.3 sequenceFile.Writer会覆盖而不是将图像附加到sequencefile中

java - 本地程序如何访问hdfs目录？

hadoop - HDFS系统在磁盘上的物理路径在哪里？

hadoop - Hive:对于通过 HiveServer2 具有超过 5000 行的表，select * from table 失败

apache-spark - 无法使用 Apache Hudi 编写非分区表

hadoop - Phoenix sql 查询不适用于大型数据集

hadoop - Hadoop中localhost的端口9000的连接异常

hadoop - Hue 不想为用户创建主目录 - MapR

hadoop - 如何将mac连接到hadoop/hdfs集群