python - 使用 Python 解析 XML

标签 python xml

我有几个大的 .xml 文件。我想解析文件来做几件事。

我只想拔出:

  • XML-/title1 并将其保存到列表 A(例如)
  • XML-/title2 保存到列表B
  • XML-/title3 保存到列表C
  • 等等,等等

使用 Python 2.x 最好导入/使用哪个库。我将如何设置它? 有什么建议吗?

例如:

 <PubmedArticle>
    <MedlineCitation Owner="NLM" Status="MEDLINE">
        <PMID Version="1">8981971</PMID>
        <Article PubModel="Print">
            <Journal>
                <ISSN IssnType="Print">0002-9297</ISSN>
                <JournalIssue CitedMedium="Print">
                    <Volume>60</Volume>
                    <Issue>1</Issue>
                    <PubDate>
                        <Year>1997</Year>
                        <Month>Jan</Month>
                    </PubDate>
                </JournalIssue>
                <Title>American journal of human genetics</Title>
                <ISOAbbreviation>Am. J. Hum. Genet.</ISOAbbreviation>
            </Journal>
            <ArticleTitle>mtDNA and Y chromosome-specific polymorphisms in modern Ojibwa: implications about the origin of their gene pool.</ArticleTitle>
            <Pagination>
                <MedlinePgn>241-4</MedlinePgn>
            </Pagination>
            <AuthorList CompleteYN="Y">
                <Author ValidYN="Y">
                    <LastName>Scozzari</LastName>
                    <ForeName>R</ForeName>
                    <Initials>R</Initials>
                </Author>
            </AuthorList>
        <MeshHeadingList>
            <MeshHeading>
                <DescriptorName MajorTopicYN="N">Alleles</DescriptorName>
            </MeshHeading>
            <MeshHeading>
                <DescriptorName MajorTopicYN="Y">Y Chromosome</DescriptorName>
            </MeshHeading>
        </MeshHeadingList>
        <OtherID Source="NLM">PMC1712541</OtherID>
    </MedlineCitation>
</PubmedArticle>

最佳答案

尝试查看 lxml模块。

要找到标题,您可以使用 Xpath使用 lxml,或者您可以使用 lxml 中的 xml 对象结构将您“索引”到标题元素。

关于python - 使用 Python 解析 XML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9487817/

相关文章:

python - 404 HTTP 错误,尽管能够在浏览器中看到该页面

python - 当数据库是第二个位置参数时,Pandas 应用函数

python - 在没有root权限的情况下安装python包

python - 我如何(快速)使用 PyQT4 缩略图 300 张图像?

xml - 如何轻松调试布局 Xml 警告/错误?

c - XML : Get an array of string from text cut by element

python - 如何用 pandas 中的特定值填充缺失值(日期和时间)

php - 简单的xml如何在没有命名空间的情况下读取节点?

xml - Web 服务 API 设计 : XML elements vs. 属性

java - 使用 Java 和 XMLType 将 XML 数据作为关系数据存储到 Oracle 表中