我尝试从中提取值:
<tr>
<td>a</td>
<td>a</td>
<td>b</td>
<td></td>
<td>b</td>
</tr>
//td/text() 返回:
a
a
b
b
如何获得以下输出?
a
a
b
b
最佳答案
如果您使用lxml.html
- 循环找到的td
元素并获取text_content()
:
from lxml.html import fromstring
data = """
<tr>
<td>a</td>
<td>a</td>
<td>b</td>
<td></td>
<td>b</td>
</tr>"""
tree = fromstring(data)
for td in tree.xpath(".//td"):
print(td.text_content())
打印:
a
a
b
b
关于python - Xpath 为空节点值保留一个位置,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35188361/