solr 将 java 源文件索引为文本

标签 solr lucene

我想将大量源文件(例如 java)上传到 solr 以允许对它们进行索引搜索。 它们应该以纯文本文件的形式发布。

不需要特殊的解析。 当尝试上传一个 java 文件时,我收到“未知来源”相关错误。

java.lang.NoClassDefFoundError: com/uwyn/jhighlight/renderer/XhtmlRendererFactory

当我重命名文件并在最后添加.txt时,它就上传成功了。

我每天有数千个文件要上传,需要保留原始名称。 如何告诉 solr 将目录中的所有文件视为 .txt? 先进的感谢!

最佳答案

对于 Google 用户,关于 Solr 错误:

java.lang.NoClassDefFoundError: com/uwyn/jhighlight/renderer/XhtmlRendererFactory

您可以通过在 Solr 中添加 jar“jhighlight-1.0.jar”来纠正此问题。为此:

  • 下载旧版 solr 4.9 。在最近的版本中,jhighlight 不存在。

  • 提取 solr-4.9.0\contrib\extraction\lib\jhighlight-1.0.jar

  • 将jhighlight-1.0.jar复制到solr安装目录下的solr/server/lib/ext/

  • 重新启动服务器。

关于solr 将 java 源文件索引为文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36812181/

相关文章:

java - 有没有办法找出一天中更新/写入的文档到 solr 索引

lucene - 如何设计自动QA系统?

通过外部字段搜索 SOLR

Solr:在 bool 字段上使用过滤器查询?

mongodb - 如何在 SOLR Query 中进行多词搜索

java - 多文档查询的 Solr 性能

elasticsearch - ElasticSearch查询速度慢,并且第一次查询总是花费太多时间

python - 全文搜索和 Python

java - Hibernate Search(Lucene 索引)如何工作?

search - 在 Solr 中搜索确切短语时,是否可以包含停用词?