search - 在文件中查找唯一字符

标签 search parsing scripting

我有一个包含450,000+条目行的文件。每个条目的长度约为7个字符。我想知道的是此文件的唯一字符。

例如,如果我的文件如下:


Entry
-----
Yabba
Dabba
Doo



那么结果将是


唯一字符:{abdoy}


注意,我不在乎大小写,也不需要订购结果。有件事告诉我,这对于Linux人员来说很容易解决。

更新资料

我正在寻找一个非常快速的解决方案。我真的不想创建代码来遍历每个条目,遍历每个字符...等等。我正在寻找一个不错的脚本解决方案。

更新2

所谓快速,我指的是快速实施...不一定要快速运行。

最佳答案

这是一个PowerShell示例:

gc file.txt | select -Skip 2 | % { $_.ToCharArray() } | sort -CaseSensitive -Unique


产生:


d
ÿ
一个
b
Ø


我喜欢它,很容易阅读。

编辑:这是一个更快的版本:

$letters = @{} ; gc file.txt | select -Skip 2 | % { $_.ToCharArray() } | % { $letters[$_] = $true } ; $letters.Keys

关于search - 在文件中查找唯一字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/387623/

相关文章:

java - Java 中获取子标签值的 xml 解析问题

c++ - 如何设计一个简单的 std::string-to-boost::posix_time::ptime 解析库

linux - 使用 Ctrl+C 杀死从 Bash 脚本运行的 Java 应用程序进程树

java - 埃克托普 CouchDb : Query for pattern with multiple contains

regex - 简化时间文字的正则表达式(如 "10h50m")

powershell - 暂停 PowerShell 脚本直到操作完成,即打开和关闭记事本

linux - 使用 shell 脚本将文件中的日期格式从 dd/mm/yyyy 更改为 yyyy-mm-dd

c# - 如何在 asp.net mvc 4 中创建具有局部 View 的搜索功能

c# - ASP :NET MVC multiple words in search

jquery - 搜索表单 css 类加载两次并影响 ajaxcomplete 函数后的位置