java - 使用 lucene 定期将新文档刷新到索引

标签 java

我需要定期刷新索引。这意味着 索引将随着文档的添加而定期更新。做什么 你认为这是解决方案吗?我需要一个示例源代码 能够刷新索引。

好的,就像下面的源代码一样。

public class SimpleFileIndexer {
    public static void main(String[] args) throws Exception {
           File indexDir = new File("C:/Users/Raden/Documents/lucene/LuceneHibernate/adi");
           File dataDir = new File("C:/Users/Raden/Documents/lucene/LuceneHibernate/adi");
           String suffix = "txt";

           SimpleFileIndexer indexer = new SimpleFileIndexer();

           int numIndex = indexer.index(indexDir, dataDir, suffix);

           System.out.println("Total files indexed " + numIndex);
    }

    private int index(File indexDir, File dataDir, String suffix) throws Exception {
           IndexWriter indexWriter = new IndexWriter(
                           FSDirectory.open(indexDir),
                           new SimpleAnalyzer(),
                           true,
                           IndexWriter.MaxFieldLength.LIMITED);
           indexWriter.setUseCompoundFile(false);

           indexDirectory(indexWriter, dataDir, suffix);

           int numIndexed = indexWriter.maxDoc();
           indexWriter.optimize();
           indexWriter.close();

           return numIndexed;
    }

    private void indexDirectory(IndexWriter indexWriter, File dataDir, String suffix) throws IOException {
           File[] files = dataDir.listFiles();
           for (int i = 0; i < files.length; i++) {
                   File f = files[i];
                   if (f.isDirectory()) {
                           indexDirectory(indexWriter, f, suffix);
                   }
                   else {
                           indexFileWithIndexWriter(indexWriter, f, suffix);
                   }
           }
    }

    private void indexFileWithIndexWriter(IndexWriter indexWriter, File f, String suffix) throws IOException {
           if (f.isHidden() || f.isDirectory() || !f.canRead() || !f.exists()) {
                   return;
           }
           if (suffix!=null && !f.getName().endsWith(suffix)) {
                   return;
           }
           System.out.println("Indexing file " + f.getCanonicalPath());

           Document doc = new Document();
           doc.add(new Field("contents", new FileReader(f)));
           doc.add(new Field("filename", f.getCanonicalPath(), Field.Store.YES, Field.Index.ANALYZED));

           indexWriter.addDocument(doc);
    }
}

上面的源代码可以在给定目录时索引文档 文本文件。现在我要问的是如何让代码运行 连续地?我应该使用什么类?这样每次都有新的 添加到该目录的文档然后 lucene 将索引这些文档 自动生成文档,你能帮我解决这个问题吗?我真的 需要知道什么是最好的解决方案。

最佳答案

Lucene 本身无法做到这一点。您将需要为此监视文件系统。

看看How to detect filesystem has changed in java .

关于java - 使用 lucene 定期将新文档刷新到索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3810813/

相关文章:

java - 自动处理依赖关系

java - 如何使用 Java 在 OpenCV 3.0.0 中使用 BackgroundSubtractorMOG?

Java - 将 .csv 导入数据库 - 排除第一行

java - .vscode 目录中的最小 launch.json 用于运行 Maven 项目的主类(带有 `F5` )

java - 使用 Spring data JPA 获取单列,无需查询

java - 如何使用 i18n 在我的 Controller 中返回自定义 hibernate 验证消息?

java - SharedPreferences 中的多个值

java - 延迟影响整个区 block

java - 当我将 recyclerview 版本从 23.0.1 更改为 23.2.1 时,gradle 文件错误

java - 需要廉价虚拟主机的 Java 开发人员的好选择