c++ - 如何使用 casablanca (PPL) http_client 返回的 XmlLite 处理 XML?

标签 c++ c++11 asynchronous ppl xmllite

我想向网络服务发出请求,获取 XML 内容,然后解析它以获取服务返回的特定值。

代码将使用原生 C++11 (MS Visual Studio 2013) 编写。 Cassablanca选择了 PPL 库。对于 XML 解析,选择了 XmlLite。

我习惯了C++编程;然而,PPL 库中的异步任务编程——这种方法——对我来说是新的。我知道什么是异步编程,也知道并行编程的原理。但是,我不习惯使用延续 (.then(...)),我只是慢慢地思考这个概念。

到目前为止,我已经修改了示例以获取 XML 结果并将其写入文本文件:

// Open a stream to the file to write the HTTP response body into.
auto fileBuffer = std::make_shared<concurrency::streams::streambuf<uint8_t>>();
file_buffer<uint8_t>::open(L"test.xml", std::ios::out)
    .then([=](concurrency::streams::streambuf<uint8_t> outFile) -> pplx::task < http_response >
{
    *fileBuffer = outFile;

    // Create an HTTP request.
    // Encode the URI query since it could contain special characters like spaces.
    // Create http_client to send the request.
    http_client client(L"http://api4.mapy.cz/");

    // Build request URI and start the request.
    uri_builder builder(L"/geocode");
    builder.append_query(L"query", address);

    return client.request(methods::GET, builder.to_string());
})

    // Write the response body into the file buffer.
    .then([=](http_response response) -> pplx::task<size_t>
{
    printf("Response status code %u returned.\n", response.status_code());

    return response.body().read_to_end(*fileBuffer);
})

    // Close the file buffer.
    .then([=](size_t)
{
    return fileBuffer->close();
})

    // Wait for the entire response body to be written into the file.
    .wait();

现在,我需要了解如何修改代码以获得可以使用 XmlLite 的结果(Microsoft 实现作为 xmllite.hxmllite.lib , 和 xmllite.dll。我知道拉式解析器是什么。但同样,我对这个库还是很陌生。我对 PPL 相关的流和其他类仍然有点迷茫。我不知道如何正确使用它们。非常欢迎任何解释。

cassablanca 的人说他们使用 XmlLite 和 Cassablanca 来处理结果,但我没有找到任何例子。你能指点我一些吗?谢谢。

更新(2014 年 6 月 4 日): 上面的代码实际上被包装成这样的函数(wxString 来自 wxWidgets,但可以很容易地用 std::stringstd::wstring):

std::pair<double, double> getGeoCoordinatesFor(const wxString & address)
{
    ...the above code...
    ...here should be the XML parsing code...
    return {longitude, latitude};
}

目标实际上不是将流写入 test.xml 文件以提供给 XmlLite 解析器。 XML 相当小,它包含一个或多个(如果地址不明确)具有我想要提取的 x 和 y 属性的项目元素——如下所示:

<?xml version="1.0" encoding="utf-8"?>
<result>
    <point query="Vítězství 27, Olomouc">
        <item
                x="17.334045"
                y="49.619723"
                id="9025034"
                source="addr"
                title="Vítězství 293/27, Olomouc, okres Olomouc, Česká republika"
        />
        <item
                x="17.333067"
                y="49.61618"
                id="9024797"
                source="addr"
                title="Vítězství 27/1, Olomouc, okres Olomouc, Česká republika"
        />
    </point>
</result>

我不需要那个 test.xml 文件。如何获取流以及如何将其重定向到 XmlLite 解析器?

最佳答案

我还没有用过卡萨布兰卡,所以这可能有点不对劲。 (我很想和 Casablanca 一起工作,但我必须先凑齐更多时间。)也就是说,看起来您显示的代码将下载一个 xml 文件并将其保存到本地文件 test.xml .从那时起,如果 xml 文件以 UTF-8 编码,则可以直接将文件加载到 XmlLite 中。如果它不是 UTF-8,你将不得不跳过一些额外的环节来解码它,要么在内存中,要么通过 CreateXmlReaderInputWithEncodingName 。或 CreateXmlReaderInputWithCodePage ,我不会在这里介绍。

获得 UTF-8 文件或处理编码后, CreateXmlReader 的文档中显示了使用 XmlLite 开始 XML 解析的最简单方法。 :

//Open read-only input stream
if (FAILED(hr = SHCreateStreamOnFile(argv[1], STGM_READ, &pFileStream)))
{
    wprintf(L"Error creating file reader, error is %08.8lx", hr);
    return -1;
}

if (FAILED(hr = CreateXmlReader(__uuidof(IXmlReader), (void**) &pReader, NULL)))
{
    wprintf(L"Error creating xml reader, error is %08.8lx", hr);
    return -1;
}

在你的例子中,你想跳过这个文件,所以你需要创建一个 IStream在内存中。您有三个主要选择:

  1. 将您的字符串视为内存缓冲区并使用 pMemStream = SHCreateMemStream(szData, cbData)
  2. 从卡萨布兰卡流式传输到 IStream使用 CreateStreamOnHGlobal(NULL, true, &pMemStream) 创建然后在完成检索后将其用作您的来源
  3. 创建 IStream卡萨布兰卡的 wrapper concurrency::streams::istream将其异步性隐藏在 IStream 之后界面

一旦你有了你的流,你必须用 IXmlReader::SetInput 告诉你的读者.

hr = pReader->SetInput(pStream);

无论上述选项如何,我建议使用 RAII 类,例如 ATL 的 CComPtr<IStream>CComPtr<IXMLReader>对于它们显示为 pFileStream 的变量和 pReader ,或者我建议的 pMemStream .这也是您需要 override any properties 的时候,假设您是否必须处理比 XmlLite 默认处理的更深层次的递归。然后就是拉读文件。 IXmlReader::Read 中记录了最简单的循环方法;这里有一些最重要的部分,但请注意,为了便于阅读,我省略了错误检测:

void Summarize(IXmlReader *pReader, LPCWSTR wszType)
{
    LPCWSTR wszNamespaceURI, wszPrefix, wszLocalName, wszValue;
    UINT cchNamespaceURI, cchPrefix, cchLocalName, cchValue;

    pReader->GetNamespaceURI(&wszNamespaceURI, &cchNamespaceURI);
    pReader->GetPrefix(&wszPrefix, &cchPrefix);
    pReader->GetLocalName(&wszLocalName, &cchLocalName);
    pReader->GetValue(&wszValue, &cchValue);
    std::wcout << wszType << L": ";
    if (cchNamespaceURI) std::wcout << L"{" << wszNamespaceURI << L"} ";
    if (cchPrefix)       std::wcout << wszPrefix << L":";
    std::wcout << wszLocalName << "='" << wszValue << "'\n";
}

void Parse(IXmlReader *pReader)
{
    // Read through each node until the end
    while (!pReader->IsEOF())
    {
        hr = pReader->Read(&nodeType);
        if (hr != S_OK)
            break;

        switch (nodeType)
        {
            //  : : :

            case XmlNodeType_Element:
                Summarize(pReader, L"BeginElement");
                while (S_OK == pReader->MoveToNextAttribute())
                    Summarize(pReader, L"Attribute");
                pReader->MoveToElement();
                if (pReader->IsEmptyElement())
                    std::wcout << L"EndElement\n";
                break;

            case XmlNodeType_EndElement:
                std::wcout << L"EndElement\n";
                break;

            //  : : :
         }
    }
}

该示例代码中的其他一些部分包括对 E_PENDING 的检查如果整个文件尚不可用,这可能是相关的。拥有卡萨布兰卡可能会“更好”http_resposne::body喂定制IStream XmlLite 可以在下载的同时开始处理的实现; this discussion thread涵盖了这个想法,但似乎没有规范的解决方案。根据我的经验,XmlLite 非常快,它造成的延迟无关紧要,因此从完整文件处理它可能就足够了,特别是如果您确实需要完整文件才能完成处理。

如果您需要将其更好地集成到异步系统中,则会出现更多问题。显然是 while上面的循环本身不是异步的。我的猜测是,使其异步的正确方法在很大程度上取决于文件的内容和阅读时必须进行的处理,以及是否将其绑定(bind)到自定义 IStream。可能没有所有可用数据。由于我对 Casabalanca 的异步性没有任何经验,因此我无法对此发表有用的评论。

这是否解决了您正在寻找的问题,或者这是您已经知道的部分并且您正在寻找 IStream卡萨巴兰卡的 wrapper http_response::body或使 XmlLite 的处理异步化的技巧?

关于c++ - 如何使用 casablanca (PPL) http_client 返回的 XmlLite 处理 XML?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23906145/

相关文章:

C++:转发参数包和 std::tuple/array 的总和

c++ - vector 子集的迭代器

node.js - 检查 NodeJS 中延迟的异步代码

c++ - 按不同字段对结构队列进行排序

c++ - 如何将 MVS C++ 代码转换为可执行应用程序?

c++ - C++ 中公共(public)子表达式消除的局限性

c++ - boost 正则表达式和令人困惑的错误

c++ - 意外警告 : inline function used but never defined

java - 使用内在锁内置于 Java 中的同步决策(好或坏)

javascript - 我可以使用标准 JavaScript 函数创建 XMLHttpRequest 吗?