我需要为文本文件(至少 20 kb)编写一个解析器,并且需要确定一组单词中的单词是否出现在该文本文件(大约 400 个单词和数字)中。因此,我正在寻找最有效的可能性来执行此操作(如果找到匹配项,我需要对此及其上一行进行进一步处理)。
我目前所做的,是排除不包含任何信息的行(元数据行),然后逐字比较 - 但我不认为仅逐字比较是最有效的可能性。
任何人都可以提供一些提示/提示/想法/...
非常感谢
最佳答案
这取决于你所说的“高效”是什么意思。
如果您想要一种非常简单的方法来编码,请记住 java 中的 String 对象具有 String.contains(CharSequence 序列) 方法。
然后,您可以将文件内容放入字符串中,然后使用 contains() 方法迭代您要检查的关键字,以查看其中是否有任何关键字出现在字符串中。
关于Java解析文本文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11756385/