这是表格格式的 HTML:
<tr><td style="width: 150px;">Development Name:</td><td><b>Bellewoods</b></td></tr>
<tr><td style="width: 150px;">Property Type:</td><td><b>Executive Condominium</b></td></tr>
<tr><td style="width: 150px;">Developer:</td><td><b>Qingjian Realty (Woodlands) Pte Ltd</b></td></tr>
<tr><td style="width: 150px;">Tenure:</td><td><b>99-year Leasehold</b></td></tr>
<tr><td style="width: 150px;"># of Floors:</td><td><b>30</b></td></tr>
<tr><td style="width: 150px;"># of Units:</td><td><b>561</b></td></tr>
我想在 csv 二进制文件中提取这些列:
Development Name,
Property Type,
Developer,
Tenure,
Floors,
Units
我正在使用这个 XPath,但它不起作用:
'//tr//td[@style="width: 150px;" and text()="Development Name:"]//td//b'
最佳答案
检查第一个 td
的文本并得到 following td
sibling :
//tr/td[. = "Development Name:"]/following-sibling::td/b/text()
关于python - 从给定内容开始的 HTML 表格单元格内容的 XPath,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30143756/