python - 如何计算文件中唯一字符的数量？

给定一个包含各种语言字符的 UTF-8 文件，我如何计算它包含的唯一字符的数量，同时排除选定数量的符号(例如:“!”、“@”、 "#", ".") 从这个算起？

最佳答案

这是一个 bash 解决方案。 :)

bash$ perl -CSD -ne 'BEGIN { $s{$_}++ for split //, q(!@#.) }
                     $s{$_}++ || $c++ for split //;
                     END { print "$c\n" }' *.utf8

关于python - 如何计算文件中唯一字符的数量？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9848290/

上一篇：ruby - 如何获得随机的 0 和 1 数字

下一篇：ruby-on-rails - Ruby/Rails - 检查 HABTM 关系记录中是否存在子 ID

相关文章：

perl - 测试::更多:由于转义序列而导致的糟糕计划

python 2.7 : replace method of string object deprecated

python - 使用 python 和 selenium 单击复选框元素

python Regex 返回匹配的字符串，但也会在无法匹配的地方返回空白

multithreading - Perl 多线程不运行批处理命令

linux - 如何在linuxexpect脚本中传递perl形式的参数？

python - 是否可以使用 Plotly 生成时钟图？

ruby 1.9.x，奇怪的解析，这是怎么回事？

Ruby:BigDecimal:同时是一个类和一个方法？

java - 生成相邻子集的序列(从列表的列表中)