elasticsearch - 如何使用Elasticsearch使目录中的文件可搜索?

标签 elasticsearch full-text-search

我是搜索引擎和Elasticsearch的新手,所以如果这个问题听起来含糊,请多多包涵。我有一个很大的目录,其中包含许多.csv和.hdr文件,并且我希望能够在这些文件中搜索文本。我已经完成了教程并阅读了一些文档,但是我仍在努力理解索引的概念。似乎所有教程都向您展示了如何一次索引一个文档,但是由于我有很多文件,这将花费很长时间。有没有更简单的方法可以使elasticsearch索引此目录中的所有文档并能够搜索我想要的内容?

最佳答案

Elasticsearch只能搜索已建立索引的文档。建立索引意味着Elasticsearch一次消耗了一个文档并将其存储在内部。
通常,内部结构很重要,因此您了解自己在做什么以获取最佳性能。
因此,您需要一种使文件进入 flex 搜索的方法,我深信没有实现这种目标的“一键式”方法。
你需要

  • 运行群集
  • 为文件
  • 设计的索引
  • 将文件从文件系统获取到Elasticsearch

  • 您的问题集中在3)。
    为此,搜索脚本示例或可以爬网目录并为Elasticsearch提供文档的工具。
    5秒钟使用Google的经历
  • https://github.com/dadoonet/fscrawler
  • https://gist.github.com/stevehanson/7462063
  • 从理论上讲,可以使用Logstash(https://www.elastic.co/guide/en/logstash/current/plugins-inputs-file.html)完成,但我会尝试fscrawler。
  • 关于elasticsearch - 如何使用Elasticsearch使目录中的文件可搜索?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48065342/

    相关文章:

    php - PHP 中的 MySQL 全文搜索

    mysql - 全文搜索字段和 Doctrine 2

    elasticsearch - 如何将不同服务器的日志收集到中央服务器( Elasticsearch 和 kibana)

    elasticsearch - 如何保护 Titan - Elasticsearch 与 ssl/tls 的连接?

    logging - Kibana 3 里程碑 4 和 Graphite 集成

    php - 为什么全文搜索找不到它?

    c - 将精确的字符串与 strstr 匹配

    search - 为什么我无法搜索标题包含 "latex"的帖子?

    elasticsearch - 按其他字段中的最佳匹配对结果进行排序

    Elasticsearch 无痛脚本不使用 if 条件替换嵌套对象字段值