marklogic - 如何从marklogic中的xml文档中获取json结果

标签 marklogic marklogic-8

我正在尝试使用 2 层服务器端 javascript 应用程序以 JSON 格式返回 XML 文档。我知道 MarkLogic 可以使用 REST api 在 JSON 和 XML 格式之间轻松切换。

但是,以下返回 xml:

cts.search('something', ['format-xml']) // options may be omitted

但这没有任何返回:
cts.search('something', ['format-json'])

根据文档,我认为我已经正确使用了该功能。

这可以使用服务器端javascript吗?

更新:

使用 transformToJsonObject如下:
var json = require('/MarkLogic/json/json.xqy');
var doc = fn.doc('/content/rss/72eb9bf835521446be8d2176e1ac9d22.xml')
var jsonDoc = json.transformToJsonObject(doc, json.config('custom'));
jsonDoc

我收到以下错误:
500 Internal Server Error

XDMP-STACKOVERFLOW: Stack overflow
in /MarkLogic/json/custom.xqy, at 493:23,
in json-custom:is-ignore-attribute#2(json:object(<json:object xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:json="http://marklogic.com/xdmp/json"><json:entry key="element-qname-from-json-name"><json:value xsi:t...</json:object>...XDMP-ATOMIZEFUNC: (err:FOTY0013) Functions cannot be atomized...), fn:doc("/content/rss/72eb9bf835521446be8d2176e1ac9d22.xml")/newsitem/article/*:html/*:head/*:script[5]/*:script/*:script/*:script/*:link/*:script/*:script/*:script/*:script/*:script/*:script/*:style/*:script/*:script/*:script/*:script/*:script/*:script/*:script/*:script/*:script/*:script/*:link/*:script/*:script/*:noscript/*:link/*:meta/*:body/*:div/*:div/*:div/*:script/*:div/*:div/*:script/*:script/*:div/*:div/*:script/*:script/*:script/*:script/*:noscript/*:p/*:header/*:div/*:div/*:div/*:a/*:section/*:div/*:h2/*:ul/*:li/*:a/*:li/*:a/*:div/*:div/*:a/*:img/*:span/*:script/*:nav/*:div/*:h2/*:ul/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:li/*:a/*:span/*:div/*:a/*:form/*:div/*:label/*:div/*:script/*:div/*:div/*:div/*:div/*:div/*:a/*:svg/*:title/*:h2/*:a/*:div/*:button/*:div/*:ul/*:li/*:a/*:span/*:li/*:a/*:span/*:span/*:li/*:a/*:span/*:li/*:a/*:span/*:li/*:a/*:span/*:li/*:a/*:span/*:li/*:a/*:span/*:li/*:a/*:span/*:li/*:a/*:span/*:li/*:a/*:span/*:li/*:a/*:span/*:li/*:a/*:span/*:li/*:a/*:span/*:li/*:a/*:span/*:li/*:a/*:span/*:li/*:a/*:span/*:li/*:a/*:span/*:li/*:a/*:span/*:li/*:a/*:span/*:div/*:nav/*:a/*:span/*:span/*:ul/*:li/*:a/*:span/*:li/*:a/*:span/*:span/*:div/*:div/*:script/*:script/*:div/*:div/*:span/*:span/*:a/*:div/*:div/*:script/*:script/*:div/*:div/*:div/*:span/*:span/*:a/*:div/*:div/*:script/*:script/*:div/*:div/*:div/*:div/*:h1/*:div/*:ul/*:li/*:div/*:li/*:span/*:a/*:div/*:figure/*:span/*:img/*:span/*:span/*:figcaption/*:span/*:span/*:p/*:p/*:p/*:p/*:p/*:div/*:div/*:script/*:script/*:h2/*:p/*:p/*:figure/*:span/*:div/*:span/*:span/*:figcaption/*:span/*:span/*:p/*:p/*:p/*:p/*:p/*:p/*:p/*:p/*:div/*:a/*:h2/*:a/*:ul/*:li/*:a/*:span/*:li/*:a/*:span/*:li/*:a/*:span/*:li/*:a/*:span/*:li/*:a/*:span/*:div/*:div/*:div/*:h2/*:div/*:ul/*:li/*:a/*:div/*:div/*:div/*:span/*:div/*:div/*:li/*:a/*:div/*:div/*:div/*:span/*:div/*:div/*:li/*:a/*:div/*:div/*:div/*:span/*:div/*:div/*:li/*:a/*:div/*:div/*:div/*:span/*:div/*:div/*:li/*:a/*:div/*:div/*:div/*:span/*:div/*:div/*:li/*:a/*:div/*:div/*:div/*:span/*:div/*:div/*:li/*:a/*:div/*:div/*:div/*:span/*:div/*:div/*:li/*:a/*:div/*:div/*:div/*:span/*:div/*:div/*:li/*:a/*:div/*:div/*:div/*:span/*:div/*:div/*:div/*:div/*:div/*:h2/*:div/*:ul/*:li/*:div/*:div/*:a/*:div/*:span/*:p/*:div/*:div/*:div/*:div/*:script/*:script/*:div/*:div/*:script/*:script/*:div/*:div/*:script/*:script/*:div/*:div/*:h2/*:a/*:strong/*:p/*:div/*:a/*:strong/*:div/*:a/*:strong/*:div/*:div/*:div/*:script/*:script/*:div/*:div/*:h2/*:div/*:div/*:a/*:div/*:div/*:div/*:h3/*:p/*:div/*:a/*:div/*:div/*:div/*:h3/*:p/*:div/*:a/*:div/*:div/*:div/*:h3/*:p/*:div/*:a/*:div/*:div/*:div/*:h3/*:p/*:div/*:a/*:div/*:div/*:div/*:h3/*:p/*:div/*:a/*:div/*:div/*:div/*:h3/*:p/*:div/*:a/*:div/*:div/*:div/*:h3/*:p/*:div/*:a/*:div/*:div/*:div/*:div/*:div/*:span/*:span/*:span/*:h3/@class) [1.0-ml]
$config = json:object(<json:object xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:json="http://marklogic.com/xdmp/json"><json:entry key="element-qname-from-json-name"><json:value xsi:t...</json:object>...XDMP-ATOMIZEFUNC: (err:FOTY0013) Functions cannot be atomized...)
$a = fn:doc("/content/rss/72eb9bf835521446be8d2176e1ac9d22.xml")/newsitem/article/*:html/*:head/*:script[5]/*:script/*:script/*:script/*:link/*:script/*:script/*:script/*:script/*:script/*:script/*:style/*:script/*:script/*:script/*:script/*:scr

最佳答案

format-xmlformat-json cts.search() 的选项按这些格式过滤搜索结果;他们不做任何转换(见 cts.search() options documentation)。

有很多方法可以使用 MarkLogic 将 XML 转换为 JSON;最简单的可能是 json XQuery library ,特别是 json:transform-to-json-object() .您可以像这样在服务器端 JS 中使用该库:

var json = require('/MarkLogic/json/json.xqy');

var doc = cts.doc('/triplestore/97a5ab126bddeea0.xml');
var jsonDoc = json.transformToJsonObject(doc, json.config('custom'));

您可以使用 json.config() 配置和自定义转换。
cts.search()返回 Iterator ,所以你需要一个 for-of循环(或某种累加器函数)以获取实际的 XML 文档,然后您可以对其进行转换。

更新 :

该错误可能是 JSON 库中的一个错误,但这是一个非常深的 HTML 路径;而且我认为将 HTML 元素转换为 JSON 对象属性没有多大意义。相反,我们将序列化 HTML,并将字符串添加回我们的 JSON 对象。

这是搜索结果转换的示例;展示如何打开 Iterator 、自定义 JSON 转换、序列化 XHTML 内容以在 JSON 中使用等。

笔记:
  • 这使用 fn.subsequence限制Iterator到前 10 个结果。
  • 我正在序列化排除的 <html/>元素到字符串(使用 xpath() method of the Node object xdmp.quote() ,并将其添加到 JSON 对象作为 escapedContent

  • 这是组合示例;您可以在 MarkLogic QConsole 中运行它:
    var json = require('/MarkLogic/json/json.xqy');
    var conf = json.config('custom');
    
    var htmlNs = 'http://www.w3.org/1999/xhtml';
    
    // exclude <html:html/> elements
    
    // Note: this is a little awkward because the JSON library is XQuery
    // and requires an XDM sequence, not an Array
    conf['ignore-element-names'] = json.arrayValues([
      fn.QName(htmlNs, 'html')
    ]);
    
    var results = fn.subsequence(
      cts.search(cts.andQuery(null), 'format-xml'),
      1,
      10
    );
    
    var transformedResults = [];
    var transformed = [];
    
    for (var result of results) {
      // transformToJson() returns an object-node() wrapped in a document-node()
      // convert it to a regular JS object
      transformed = json.transformToJson(result, conf).toObject()
    
      transformed.escapedContent = xdmp.quote(
        result.xpath('.//html:html', { html: htmlNs}) 
      );
    
      transformedResults.push(transformed);
    }
    
    transformedResults
    

    关于marklogic - 如何从marklogic中的xml文档中获取json结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33379822/

    相关文章:

    javascript - MarkLogic 9 cts.parse 未正确解析查询

    replication - 我们可以在不同版本的 marklogic 之间建立森林或数据复制吗?

    marklogic - 如何使用rest api在marklogic中将文档的属性指定为uri

    java - 使用 Java 客户端 API 在 marklogic 中创建或添加集合

    marklogic - 是否可以在没有管理员角色的情况下在 MarkLogic 9 上使用 ml-gradle?

    marklogic - "purge-journal-archiving"设置在哪里?

    Marklogic 大删除

    java - Liferay 与 MarkLogic XDBC 数据库集成

    marklogic - 在 Marklogic 中监控备份和恢复

    xml - Marklogic XSLT 异常处理