python - 如何在 xml 文件中搜索单词并在 python 中打印它

标签 python xml nlp nltk tokenize

我想在.xml 文件中搜索特定单词(由用户输入)。这是我的 xml 文件。

<?xml version="1.0" encoding="UTF-8"?>
<words>
<entry>
<word>John</word>
<pron>()</pron>
<gram>[Noun]</gram>
<poem></poem>
<meanings>
<meaning>name</meaning>
</meanings>
</entry>
</words>

这是我的代码

import nltk
from nltk.tokenize import word_tokenize
import os
import xml.etree.ElementTree as etree


sen = input("Enter Your sentence - ")

print(sen)
print("\n")
print(word_tokenize(sen)[0])

tree = etree.parse('roman.xml')
node=etree.fromstring(tree)

#node=etree.fromstring('<a><word>waya</word><gram>[Noun]</gram> 
<meaning>talking</meaning></a>')
s = node.findtext(word_tokenize(sen)[0])
print(s)

我已经尝试了一切,但仍然给我错误

a bytes-like object is required, not 'ElementTree'

我真的不知道如何解决。

最佳答案

发生错误是因为您将 elementtree 对象传递给 fromstring () 方法。这样做:

>>> import os
>>> import xml.etree.ElementTree as etree
>>> a = etree.parse('a.xml')
>>> a
<xml.etree.ElementTree.ElementTree object at 0x10fcabeb8>
>>> b = a.getroot()
>>> b
<Element 'words' at 0x10fb21f48>
>>> b[0][0].text
'John'

使用 find() 和 findall() 方法进行搜索。

有关更多信息,请检查库:https://docs.python.org/3/library/xml.etree.elementtree.html

简单的例子:

test.xml

<?xml version="1.0" encoding="UTF-8"?>
<words>
  <word value="John"></word>
  <word value="Mike"></word>
  <word value="Scott"></word>
</words>

示例.py

root = ET.parse("test.xml")
>>> search = root.findall(".//word/.[@value='John']")
>>> search
[<Element 'word' at 0x10be9c868>]
>>> search[0].attrib
{'value': 'John'}
>>> search[0].tag
'word'

关于python - 如何在 xml 文件中搜索单词并在 python 中打印它,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52908989/

相关文章:

python - 使用多个输入提供 keras 模型

python - 在 `any` 函数中找到失败的元素

machine-learning - 哪种深度学习模型可以对不互斥的类别进行分类

java - 在 Java 中将单词转换为名词/形容词/动词形式

python - 保存文本分类模型后获取真实的类标签

python - 当我想稍后填充数据时,django模型抛出IntegrityError : (1048, "Column ' xxx'不能为空”)

python - 只为单元测试启用 Python 代码?

python - 我可以用 lxml 创建这个 XML 文件吗?

android - Android 中的 XML SAXParserException

java - java - 如何将节点附加到Java中的现有XML文件