我的问题是我想从原始 xml 创建 xml 文件的子集,同时保持相同的结构。您可以说我想过滤以获得子集。
处理此类任务的最佳方法是什么,以及我处理 Medline 数据库时最有效的方法是什么!
最佳答案
这里有一个广泛的概述。
完整读取输入的 xml 文件。
决定要在哪个级别拆分 xml 文件。 (例如3级)
确定感兴趣的标签。您可以提前决定标签或向用户提供一些 GUI 来选择需要哪些标签。您还可以将输入文件拆分为多个包含输入文件所有标签的文件。
创建输出文件。例如直到级别 3,文件都是相同的。从第 4 级开始,您将拥有许多不同的文件。
例如如果你有像
这样的 xml 文件<L1> ....
<L2> ...
<L3> ....
<L4a> .... </L4a>
<L4b> .... </L4b>
<L4c> .... </L4c>
</L3>
</L2>
</L1>
你可以制作3个输出文件
<L1> ....
<L2> ...
<L3> ....
<L4a> .... </L4a>
</L3>
</L2>
</L1>
<L1> ....
<L2> ...
<L3> ....
<L4b> .... </L4b>
</L3>
</L2>
</L1>
等等
关于c++ - 从原始 xml 创建 xml 文件的子集,同时保持相同的结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56884962/