我是 MarkLogic 新手,已经将一些 PDF 作为 .xml 文件加载并转换到我的数据库中。
我的 10 个 PDF 每份大约有 500 页长。如果我在查询控制台中搜索这样的单词,
cts.search("Infrastructurefunctions")
我将看到每个包含“Infrastructionfunctions”一词的文档及其整个正文/内容(大约 500 页)。而且您看不到新文档从哪里开始。
我的目标是获得与您在 Google 上获得的结果类似的结果:
- 仅文档名称
- 我搜索的单词会突出显示,并周围有一些单词以获取上下文
谢谢你帮助我:)
最佳答案
函数cts.search
(以及所有其他 cts 函数)是一个低级工具。还有更多的抽象库会更适合您。对于 XQuery,我们有 search:search
函数和相关函数。对于 JavaScript,您可以使用 JSearch
。我强烈建议您研究一下:
- 搜索API:http://docs.marklogic.com/guide/search-dev/search-api
- J搜索:http://docs.marklogic.com/guide/search-dev/javascript
呵呵!
关于javascript - 我怎样才能获得有关文档的最重要信息以及我在 MarkLogic/Query Console 中搜索的单词周围的一些行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38397838/