json - JSON 数据结构中的文件路径

标签 json perl

我正在做一个使用 File::Find 的磁盘空间报告在目录树中收集累积大小。

我从 File::Find 得到的(很容易)是目录名。

例如。:

/path/to/user/username/subdir/anothersubdir/etc

我在运行 File::Find收集以下尺寸:
/path/to/user/username

并构建目录和每个子目录的累积大小报告。

我目前得到的是:
while ( $dir_tree ) {
   %results{$dir_tree} += $blocks * $block_size;
   my @path_arr = split ( "/", $dir_tree ); 
   pop ( @path_arr );
   $dir_tree = join ( "/", @path_arr ); 
}

(是的,我知道这不是很好。)。

这样做的目的是当我stat每个文件,我将它的大小添加到当前节点和树中的每个父节点。

这足以生成:
username,300M
username/documents,150M
username/documents/excel,50M
username/documents/word,40M
username/work,70M
username/fish,50M,
username/some_other_stuff,30M

但我现在想更像这样将其转换为 JSON:
{ 
    "name" : "username",
    "size" : "307200",
    "children" : [
        { 
            "name" : "documents",
            "size" : "153750",
            "children" : [
                  { 
                      "name" : "excel",
                      "size" : "51200"
                   }, 
                   {
                       "name" : "word",
                       "size" : "81920"
                   }
             ]
         }
    ]
}

那是因为我打算对该结构进行 D3 可视化 - 大致基于 D3 Zoomable Circle Pack

所以我的问题是 - 整理我的数据的最简洁方法是什么,以便我可以拥有累积(理想情况下是非累积)大小信息,但按层次填充散列。

我正在考虑“光标”方法(这次使用 File::Spec):
use File::Spec; 
my $data;
my $cursor = \$data; 
foreach my $element ( File::Spec -> splitdir ( $File::Find::dir ) ) {
   $cursor -> {size} += $blocks * $block_size;
   $cursor = $cursor -> {$element} 
}

虽然......这并没有完全创建我正在寻找的数据结构,尤其是因为我们基本上必须通过散列键进行搜索才能完成该过程的“汇总”部分。

有没有更好的方法来实现这一点?

编辑 - 我已经拥有的更完整的例子:
#!/usr/bin/env perl

use strict;
use warnings;

use File::Find;
use Data::Dumper;

my $block_size = 1024;

sub collate_sizes {
    my ( $results_ref, $starting_path ) = @_;
    $starting_path =~ s,/\w+$,/,;
    if ( -f $File::Find::name ) {
        print "$File::Find::name isafile\n";
        my ($dev,   $ino,     $mode, $nlink, $uid,
            $gid,   $rdev,    $size, $atime, $mtime,
            $ctime, $blksize, $blocks
        ) = stat($File::Find::name);

        my $dir_tree = $File::Find::dir;
        $dir_tree =~ s|^$starting_path||g;
        while ($dir_tree) {
            print "Updating $dir_tree\n";
            $$results_ref{$dir_tree} += $blocks * $block_size;
            my @path_arr = split( "/", $dir_tree );
            pop(@path_arr);
            $dir_tree = join( "/", @path_arr );
        }
    }
}

my @users = qw ( user1 user2 );

foreach my $user (@users) {
    my $path = "/home/$user";
    print $path;
    my %results;
    File::Find::find(
        {   wanted   => sub { \&collate_sizes( \%results, $path ) },
            no_chdir => 1
        },
        $path
    );
    print Dumper \%results;

    #would print this to a file in the homedir - to STDOUT for convenience
    foreach my $key ( sort { $results{$b} <=> $results{$a} } keys %results ) {
       print "$key => $results{$key}\n";
    }
}

是的 - 我知道这不是可移植的,并且做了一些有点讨厌的事情。我在这里所做的部分工作是试图改进这一点。 (但目前它是基于 Unix 的 homedir 结构,所以很好)。

最佳答案

如果您自己进行目录扫描而不是使用 File::Find,您自然会得到正确的结构。

sub _scan {
   my ($qfn, $fn) = @_;
   my $node = { name => $fn };

   lstat($qfn)
      or die $!;

   my $size   = -s _;
   my $is_dir = -d _;

   if ($is_dir) {
      my @child_fns = do {
         opendir(my $dh, $qfn)
            or die $!;

         grep !/^\.\.?\z/, readdir($dh);
      };

      my @children;
      for my $child_fn (@child_fns) {
         my $child_node = _scan("$qfn/$child_fn", $child_fn);
         $size += $child_node->{size};
         push @children, $child_node;
      }

      $node->{children} = \@children;
   }

   $node->{size} = $size;
   return $node;
}

其余代码:
#!/usr/bin/perl

use strict;
use warnings;    
no warnings 'recursion';

use File::Basename qw( basename );
use JSON           qw( encode_json );

...    

sub scan { _scan($_[0], basename($_[0])) }

print(encode_json(scan($ARGV[0] // '.')));

关于json - JSON 数据结构中的文件路径,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32374350/

相关文章:

ruby-on-rails - 如何轻松地从 json 更新属性

带有虚拟占位符的 Perl 赋值

python - 编写相当于 Perl 代码的 Python 代码

windows - 使用 Perl 在 Windows 中输入和读取文件时遇到问题

Mysql 不转义反斜杠并按照需要的方式引用

javascript - 如何在不了解文件内容的情况下用 javascript 解析 JSON 文件?

json - XML 到 json 转换

android - 如何使用 volley 在 android 中解析 json 数组

linux - Perl 处理日志文件

perl - 如何使用perl建立两个变量之间的关系,类似于代谢网络