c++ - 从原始 xml 创建 xml 文件的子集,同时保持相同的结构

标签 c++ c xml libxml2

我的问题是我想从原始 xml 创建 xml 文件的子集,同时保持相同的结构。您可以说我想过滤以获得子集。

处理此类任务的最佳方法是什么,以及我处理 Medline 数据库时最有效的方法是什么!

最佳答案

这里有一个广泛的概述。

  1. 完整读取输入的 xml 文件。

  2. 决定要在哪个级别拆分 xml 文件。 (例如3级)

  3. 确定感兴趣的标签。您可以提前决定标签或向用户提供一些 GUI 来选择需要哪些标签。您还可以将输入文件拆分为多个包含输入文件所有标签的文件。

  4. 创建输出文件。例如直到级别 3,文件都是相同的。从第 4 级开始,您将拥有许多不同的文件。

例如如果你有像

这样的 xml 文件
<L1> .... 
    <L2> ...
        <L3> ....
           <L4a> .... </L4a>
           <L4b> .... </L4b>
           <L4c> .... </L4c>
        </L3>
    </L2>
</L1>    

你可以制作3个输出文件

<L1> .... 
    <L2> ...
        <L3> ....
           <L4a> .... </L4a>
        </L3>
    </L2>
</L1>    

<L1> .... 
    <L2> ...
        <L3> ....
           <L4b> .... </L4b>
        </L3>
    </L2>
</L1>    

等等

关于c++ - 从原始 xml 创建 xml 文件的子集,同时保持相同的结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56884962/

相关文章:

c++ - cuda - nvcc 如何编译 __host__ 代码?

C++ 按值传递和按引用传递函数内的赋值之间有区别吗?

c++ - 我可以使用函数指针调用虚拟析构函数吗?

c - 使用 scanf "%f"读取 float 然后分配给 double 的奇怪结果

xml - 如何在 xsl-fo 中的元素后分页

C++ 以不区分大小写的字母顺序打印 map

c - Frama-C 是否捕获了读取未初始化堆栈变量的 UB?

c - 从链表更新数据

多种类型的 C# XML 列表

MYSQL : Importing an XML data file using LOAD XML