我有一个文本文件存储为字符串变量。文本文件经过处理,因此仅包含小写单词和空格。现在,假设我有一个静态词典,它只是特定单词的列表,并且我想从文本文件中计算词典中每个单词的出现频率。例如:
Text file:
i love love vb development although i m a total newbie
Dictionary:
love, development, fire, stone
我希望看到的输出类似于以下内容,列出了字典单词及其计数。如果使编码更简单,它也只能列出文本中出现的词典单词。
===========
WORD, COUNT
love, 2
development, 1
fire, 0
stone, 0
============
使用正则表达式(例如“ \ w +”),我可以获得所有单词匹配,但是我不知道如何获取字典中的计数,因此我陷入了困境。这里的效率至关重要,因为字典很大(约100,000个单词),文本文件也不小(每个约200kb)。
感谢您的帮助。
最佳答案
var dict = new Dictionary<string, int>();
foreach (var word in file)
if (dict.ContainsKey(word))
dict[word]++;
else
dict[word] = 1;
关于c# - 计算文本文件中特定单词的频率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4520876/