给定一个包含各种语言字符的 UTF-8 文件,我如何计算它包含的唯一字符的数量,同时排除选定数量的符号(例如:“!”、“@”、 "#", ".") 从这个算起?
最佳答案
这是一个 bash 解决方案。 :)
bash$ perl -CSD -ne 'BEGIN { $s{$_}++ for split //, q(!@#.) }
$s{$_}++ || $c++ for split //;
END { print "$c\n" }' *.utf8
关于python - 如何计算文件中唯一字符的数量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9848290/