目标:找到文件中所有单词的数量。文件包含 1000 多个单词
我的方法:使用 HashMap<String,Integer>()
存储和统计每个单词在文件中出现的次数。
问题:
会 HashMap()
是最好的方法还是使用二叉树来确保更快的查找更好,因为文件中有大量单词?
或者有更好的方法吗?
HashMap 会导致大量内存开销,这是不希望的。
最佳答案
所以你在寻找不同的词?
我能想到的最有效的结构是 Trie
这是一个开源实现:Google Code patricia-trie
尽管我倾向于同意 Mitch Wheat 的观点——听起来 HashMap 应该可以正常工作(最好避免过早优化……因此您应该使用 HashMap 直到您证明它是瓶颈)
关于java - 计算文件中重复的单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3942444/