javascript - 我怎样才能获得有关文档的最重要信息以及我在 MarkLogic/Query Console 中搜索的单词周围的一些行?

标签 javascript pdf search marklogic nosql

我是 MarkLogic 新手,已经将一些 PDF 作为 .xml 文件加载并转换到我的数据库中。

我的 10 个 PDF 每份大约有 500 页长。如果我在查询控制台中搜索这样的单词,

cts.search("Infrastructurefunctions")

我将看到每个包含“Infrastructionfunctions”一词的文档及其整个正文/内容(大约 500 页)。而且您看不到新文档从哪里开始。

我的目标是获得与您在 Google 上获得的结果类似的结果:

  • 仅文档名称
  • 我搜索的单词会突出显示,并周围有一些单词以获取上下文

谢谢你帮助我:)

最佳答案

函数cts.search(以及所有其他 cts 函数)是一个低级工具。还有更多的抽象库会更适合您。对于 XQuery,我们有 search:search 函数和相关函数。对于 JavaScript,您可以使用 JSearch。我强烈建议您研究一下:

呵呵!

关于javascript - 我怎样才能获得有关文档的最重要信息以及我在 MarkLogic/Query Console 中搜索的单词周围的一些行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38397838/

相关文章:

javascript - 这是什么类型的 jquery/javascript 事件?

javascript - jQuery 流程图 : "Scroll" months

java - 如何合并多个pdf

java - Vaadin - 如何从单个按钮打开 BrowserWindowOpener

c# - 是否 AvalonEdit :TextEditor have quick search/replace functionality?

javascript - 应用于 selected() select 的重置也会重置占位符

javascript - 了解智威汤逊

r - 为什么 R 中的 postscript 或 pdf 驱动程序生成的线宽 (lwd) 小于 1 没有区别?

jquery - 使用 JQuery 按值检查 XML 节点是否存在

c++ - C++ 中带线程的强力搜索算法的并行化