solr - 如何在 solr4 中索引存储在其他服务器上的 XML 文件

标签 solr dataimporthandler data-import solr4

我将所有 XML 文件都存储在另一台服务器上,并且在不同的服务器上安装和配置了 SOLR。如何将这些 XML 文件索引到 SOLR 中。我检查过 nutch,但它的主要目的是抓取 html 页面并为它们编制索引。我不需要爬行。我在其他服务器上的特定路径上拥有所有这些文件。我只需要在 SOLR 中为这些 XML 文件编制索引。我已经安装并配置了 SOLR4。

如果有人做过这样的事情,请告诉我怎么做。 谢谢

最佳答案

为什么不从您的 Solr 服务器挂载驱动器,然后执行以下操作:

java -jar post.jar "Z:\home\data\delivery\textarticles.xml"

post.jar 位于 exampledocs 文件夹中。您也可以将其用作示例应用程序并构建您自己的应用程序以从其他服务器发布这些 xml 文件

关于solr - 如何在 solr4 中索引存储在其他服务器上的 XML 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14489450/

相关文章:

python - 对于应用程序的用户,以 "easy"的方式将数据导入 Google App Engine

apache solr 作为服务托管

mysql - 新字段未显示在搜索中

mongodb - org.apache.solr.common.SolrException : TransactionLog doesn't know how to serialize class org. bson.types.ObjectId;尝试实现 ObjectResolver?

Mysql Workbench导入数据SQL错误1142

python - 'utf- 8' codec can' t 解码字节 0x92 在位置 18 : invalid start byte

ubuntu - 如何使用 Ubuntu 预装的 solr-common 和 solr-jetty 运行 solr/example

ruby-on-rails-3 - 太阳黑子 - solr - 如何进行精确匹配

javascript - 如何将日期范围字符串转换为可用的 JSON?

oracle - solr clobtransformer