java - 如何使用 SAX 正确解析 XML?

标签 java xml parsing sax

我正在从 REST 服务接收 XML 文档,该文档将使用 SAX 进行解析。请参阅以下从 XSD 生成的示例。

设置解析器不是问题。我的主要问题是 startElement()endElement() 方法等中的实际处理。我不明白如何提取我需要的项目并按原样存储它们有点“嵌套”。

例子

ConnectionList 可以出现一次或两次,并且可以包含任意数量的 Connection 元素,这些元素依次包含有关连接的详细信息。基本上,我需要一个包含所有连接的列表及其DateTransfersTime。我必须为每个元素创建一个类吗?

据我所知,我需要以某种方式执行以下操作: 如果解析器遇到...

  • ConnectionList:创建新的ConnectionList对象并将其放入ConnectionList列表
  • Connection:创建一个新的Connection对象并将其放入Connections列表中
  • DateTransfersTime(仅当 parent 为 Duration 时):将节点值存储在当前 Connection 对象

我非常感谢任何帮助、提示、想法和片段,我可以如何实现这一目标。

谢谢:-)

罗伯特

<?xml version="1.0" encoding="UTF-8"?>
<ResC xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
    <Err code="r5E5a1Wm" text="tk-gWYbw" level="E"/>
    <Err code="takVDd34" text="XtvyjmjPuscK" level="E"/>
    <Err code="hQ1-:aDQ" text="YWc5qtY.gkwCeJW2S" level="E"/>
    <ConRes dir="R">
        <Err code="ZfwPC:tj" text="RKKFuLXoM0oOfp3a" level="E"/>
        <Err code="bhDjSJPa" text="BJoHuOMdwzhcddW" level="E"/>
        <Err code="CX-NhK9r" text="j55qy-WiNPXu" level="E"/>
        <ConResCtxt b="1" f="1">0815</ConResCtxt>
        <ConnectionList type="IV">
            <Err code="WI3WX.jo" text="rK3H5jwa-Zfen3" level="E"/>
            <Connection id="ID000">
                <Overview>
                    <Date>b3lcM_Yiyq7dqL9</Date>
                    <Departure>
                        <BasicStop type="NORMAL" index="-1086549314">
                            <Address externalId="t.EdKe93xkqFqLwPzgd-4vHSJemy8"
                                externalStationNr="1332105793" name="fdREYJPu83WV503V8szdCX"
                                x="951177990" y="-1579782776" z="1807457957" type="WGS84"/>
                        </BasicStop>
                    </Departure>
                    <Arrival>
                        <BasicStop type="NORMAL" index="1897526979">
                            <Address externalId="l7h_GTUit6fv" externalStationNr="-1670310329"
                                name="WJznDTzkTvyET51pfr7X" x="-1738098662" y="-170353174"
                                z="-475585957" type="WGS84"/>
                        </BasicStop>
                    </Arrival>
                    <Transfers>dZbgZfDH8j1hb1i</Transfers>
                    <Duration>
                        <Time>00d00:18:00</Time>
                    </Duration>
                    <ServiceDays> </ServiceDays>
                    <Products>
                        <Product cat="qmrN2dShHJp"/>
                        <Product cat="Hg"/>
                        <Product cat="nurxhdl3w.P0x7FRv2J3UoF"/>
                    </Products>
                    <ContextURL url="http://FzgEqiVC/"/>
                </Overview>
            </Connection>
            <Connection id="ID004">
                <Overview>
                    <Date>W5a47DRkc7XDZjhwq_s5Un.</Date>
                    <Departure>
                        <BasicStop type="NORMAL" index="-1014429844">
                            <Address externalId="RMnzjEFOTTdM1oaAUw" externalStationNr="1429101638"
                                name="HF-1" x="1005198487" y="570832676" z="975615566" type="WGS84"
                            />
                        </BasicStop>
                    </Departure>
                    <Arrival>
                        <BasicStop type="NORMAL" index="-58308182">
                            <Address externalId="rVdwdQvAukfj2QcA7b3OSdGOyW"
                                externalStationNr="1142334006" name="g" x="-1791416159"
                                y="-541300941" z="478129823" type="WGS84"/>
                        </BasicStop>
                    </Arrival>
                    <Transfers>GG56XN6zgiJF804mE_N4o</Transfers>
                    <Duration> </Duration>
                    <ServiceDays> </ServiceDays>
                    <Products>
                        <Product cat="fs_Oyoy9NYBai-qaxbty6j9Y7r1St"/>
                        <Product cat="P2CbaSGpC"/>
                        <Product cat="CGZrqSIDM6M4kUlb8_xZ8jRlH4c"/>
                    </Products>
                    <ContextURL url="http://JkRhuXtu/"/>
                </Overview>
            </Connection>
        </ConnectionList>
        <ConnectionList type="IV">
            <Err code="0lFWRY2X" text="KLmdczFRhV" level="E"/>
            <Connection id="ID012">
                <Overview>
                    <Date>t8mn634zjCZsRPyxj_e_-UYMH</Date>
                    <Departure>
                        <BasicStop type="NORMAL" index="-2095085423">
                            <Address externalId="ftKAFG-Uk7x" externalStationNr="1390920810"
                                name="JQrQXOQbm.FLaCMeSiTYjT" x="1970142849" y="-655980297"
                                z="2102464970" type="WGS84"/>
                        </BasicStop>
                    </Departure>
                    <Arrival>
                        <BasicStop type="NORMAL" index="1552118247">
                            <Address externalId="qcBpeuPDRzvSt1o" externalStationNr="-1133118359"
                                name="AJiJOB1t" x="-1422533132" y="-1158953133" z="484831466"
                                type="WGS84"/>
                        </BasicStop>
                    </Arrival>
                    <Transfers>D0MiUwW9nuuM_uykvawg2C07pwHL</Transfers>
                    <Duration> </Duration>
                    <ServiceDays> </ServiceDays>
                    <Products>
                        <Product cat="LpGOZbLDbJm"/>
                        <Product cat="JIv-szQVX2icPb"/>
                        <Product cat="Q7-pthWoOT"/>
                    </Products>
                    <ContextURL url="http://zGWgivvi/"/>
                </Overview>
                <IList>
                    <I header="ze4Wt3hVD-DvjujY6QKae" text="lVwB4RxAHcYq3.F"
                        uriCustom="iVjQJCoU1MVOv2Z9lwarP"/>
                    <I header="z-i.au59soMzXLZCbV" text="PoTP" uriCustom="ksrbwEH6scNR"/>
                    <I header="N" text="jHDA4" uriCustom="ub95811lMIa_495ZbPOuNWL0rRWh"/>
                </IList>
                <CommentList>
                    <Comment id="ID013">
                        <Text lang="EN"> </Text>
                        <Text lang="FR"> </Text>
                        <Text lang="PL"> </Text>
                    </Comment>
                    <Comment id="ID014">
                        <Text lang="DK"> </Text>
                        <Text lang="IT"> </Text>
                        <Text lang="IT"> </Text>
                    </Comment>
                    <Comment id="ID015">
                        <Text lang="MACRO"> </Text>
                        <Text lang="IT"> </Text>
                        <Text lang="EN"> </Text>
                    </Comment>
                </CommentList>
            </Connection>
        </ConnectionList>
    </ConRes>
</ResC>

最佳答案

我发现(到目前为止)使用 SAX 解析 XML 的最佳方法是在相关回调中使用堆栈和条件语句。 Here's an article describing it ,以及我的总结:

基本前提是,当你解析文档时,你创建对象来存储解析的数据,在你进行的时候将它们插入堆栈,查看堆栈顶部以将数据添加到当前元素,并在每个元素的末尾将其弹出堆栈并将其存储在父元素中。

效果是您首先解析元素树的深度,然后在每个分支的末尾将其回滚到父级,直到您剩下一个包含所有元素的对象(例如您的 ConnectionList)准备好使用的已解析数据。本质上,您最终会得到一系列反射(reflect)原始 XML 结构的对象

这意味着您需要一些可以将数据存储在与 XML 相同的结构中的数据对象。复杂元素通常会成为类,而简单元素通常会成为类中的属性。根元素通常由某种列表表示。

首先,您创建一个堆栈对象来保存您解析的数据。

然后,在每个元素的开头,您使用 localName.equals() 方法确定它的类型,创建相应类的实例,并将其插入堆栈。如果该元素是一个简单元素,您可能会将其建模为表示父元素的类中的属性,并且您将需要一系列标志来告诉解析器是否遇到了这样的元素以及它是什么元素,以便它可以在 characters() 方法中处理。

使用 characters() 方法读取实际数据,然后您再次使用条件逻辑根据标志的值来确定如何处理数据。本质上,您查看堆栈的顶部并使用适当的方法将数据写入对象,并在必要时从文本转换。

在每个元素的末尾,弹出堆栈的顶部并再次使用 localName.equals() 来确定如何将它存储在它之前的对象中(例如,哪个 setter 方法需要被调用)

当您到达文档末尾时,您应该已经捕获了文档中的所有数据。

关于java - 如何使用 SAX 正确解析 XML?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4200115/

相关文章:

c# - 如何将 XML 读入数据集

xml - 有海洋温度的 API 吗?

jquery - jQuery ajax 成功函数的额外参数

python - 解析问题

java - 如果数组中的所有值都相同,如何打印字符串

java - 不从 ArrayList 中删除对象

parsing - 我应该如何在 yacc/bison 和 lex 中制定递归规则?

ios - 尝试解析 iOS 项目的 restful web APS 返回的 json 数组

java - 如何创建一个为测试脚本传递参数的 webdriver 函数?

java - 无法将动态创建的复选框添加到 jPanel