我从互联网上加载了一个 xml 文件,并用 lxml 进行了解析。但是我无法通过'element'.text
获取内容。 result 和 source 都很短,我就写吧。
XML:
<?xml version="1.0" encoding="utf-8"?>
<products>
<product>
<company><![CDATA[google]]></company>
<link><![CDATA[http://www.google.com]]></link>
<subject><![CDATA[sushi]]></subject>
</product>
</products>
代码:
import urllib2
from lxml import etree
from StringIO import StringIO
rss = urllib2.urlopen("http://dizzy-v.co.kr/test/test.xml").read()
tree = etree.parse(StringIO(rss), etree.HTMLParser())
root = tree.getroot()
for product in root.iter('product'):
for element in product.iter():
print element.text
结果:
None
None
None
最佳答案
删除 etree.HTMLParser
给你文本:
>>> import urllib2
>>> from lxml import etree
>>>
>>> rss = urllib2.urlopen("http://dizzy-v.co.kr/test/test.xml").read()
>>> root = etree.fromstring(rss) # <----
>>> for product in root.iter('product'):
... for element in product.iter():
... print element.text
...
google
http://www.google.com
sushi
关于python - lxml,Python。我无法获取元素 : element. 文本的内容为 None,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23346734/