java - Apache Solr - 如何索引源代码文件

标签 java apache indexing solr

我想编写一个程序,能够在源代码文件中搜索特定模式...换句话说:输入是一段代码,例如:

int fib (int i) {
  int pred, result, temp;

  pred = 1;
  result = 0;

  while (i > 0) {
    temp = pred + result;
    result = pred;
    pred = temp;
    i = i-1;
  }
  return(result);
}

输出是包含这段代码或类似代码的文件。

在开源世界中,代码可以在其他项目中重用。特别是库经常被复制到项目中。为了使错误修复更容易,我需要能够知道在哪些项目中使用了特定的库或代码。

因此我想尝试使用apache solr。我不知道这是否是一个好主意(我很高兴能够帮助我的一切)

我的计划是索引我的源代码文件...因此我需要一些工具?标记源代码文件。比如给我所有函数、变量等的名称。我可以使用输出来提供 solr 索引。但我不确定 apache solr 中是否已经有 tokenizer 或 dataimporthandler 可以做到这一点?

最佳答案

我不确定这是否可以使用 solr 来完成,因为不同的项目可能使用不同的命名约定。

看看下面的链接是否有帮助:

Tools for Code Seacrh

关于java - Apache Solr - 如何索引源代码文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36403247/

相关文章:

apache - 单个服务器进程可以从多个端口监听吗?

sql - 表扫描与添加索引——哪个更快?

javascript - 从具有多个 ID 的单个 JS 对象中获取数据并被搜索引擎索引

java - 将 jar 文件 URI 转换为文件

java - MySQL复杂查询语句

java - 为什么 Cloneable 没有 clone()?

java - 字段 component.x 不可见

linux - 安装后 Bugzilla 错误 : "TEST-FAILED Web Server is not executing CGI files"

Mysql 强制我在多列唯一键的情况下创建多个索引

php - 无法在 PDO 中连接到 mysql 数据库,在端口 8080 上使用带有 easyPHP 的 apache