我正在处理大约 1GB 的增量文件,我想搜索特定的模式。 目前我正在使用 Java 正则表达式,你知道我怎样才能更快地做到这一点吗?
最佳答案
听起来像是 Apache Lucene 的工作.
您可能不得不重新考虑您的搜索策略,但这个库是为做这样的事情和增量添加索引而创建的。
它的工作原理是为您的数据(用 Lucene 的说法是文档)构建反向索引,然后快速检查反向索引中哪些文档具有您的模式的一部分。
您可以将元数据与文档索引一起存储,这样您就可以在大多数用例中不必查阅大文件。
关于java - 模式搜索如何使速度更快?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3988926/