java - 模式搜索如何使速度更快?

标签 java regex

我正在处理大约 1GB 的增量文件,我想搜索特定的模式。 目前我正在使用 Java 正则表达式,你知道我怎样才能更快地做到这一点吗?

最佳答案

听起来像是 Apache Lucene 的工作.

您可能不得不重新考虑您的搜索策略,但这个库是为做这样的事情和增量添加索引而创建的。

它的工作原理是为您的数据(用 Lucene 的说法是文档)构建反向索引,然后快速检查反向索引中哪些文档具有您的模式的一部分。

您可以将元数据与文档索引一起存储,这样您就可以在大多数用例中不必查阅大文件。

关于java - 模式搜索如何使速度更快?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3988926/

相关文章:

python - 将时间段字符串转换为值/单位对

使用带有转义字符的正则表达式分割 Java 字符串

Java正则表达式检测句子结尾但忽略(num)(句点),例如15

java - JSTL c :if tag condition

java - 保存实体时避免重复键错误

java - 为什么以下对象不符合垃圾回收条件?

regex - Perl 脚本中的 Linux grep 命令不起作用

java - 读取其他 Controller 中是否选择了 RadioButton

java - 按值对 Map<Key, Value> 进行排序

java - 如何使用 RegExp 替换除双引号之外的所有标点符号