我想忽略 <td>
中的嵌套标签在下面的代码中。
我只想要 <td>
中的整数(数字)不是 <strong>
中包含的文本标签。
我已经编写了 selenium 代码,但它在 <td>.
中返回了整个文本
有没有什么方法可以忽略嵌套并获取 <td>
中的数字
Python 代码:
wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, '#middle > table > tbody > tr:nth-child(2) > td:nth-child(1) > table > tbody > tr:nth-child(1) > td')))
data = driver.find_elements_by_css_selector("#middle > table > tbody > tr:nth-child(2) > td:nth-child(1) > table > tbody > tr:nth-child(1) > td")
print(data[0].text)
OUTPUT:: Parcel Number 71200000
但我只想要71200000
HTML:
<table width="100%">
<tbody>
<tr style="">
<td><strong>Parcel Number</strong> 71200000</td>
</tr>
<tr style="">
<td><strong>Tax Area</strong> 19A - TAX DISTRICT 19A</td>
</tr>
<tr style="">
<td><strong>Situs Address</strong> </td>
</tr>
<tr style="">
<td><strong>Legal Summary</strong> W.H.M. SECTION A BLK 1 LOT 1 CONT. 7.14 AC</td>
</tr>
</tbody>
</table>
最佳答案
以下代码可能对您有所帮助。
wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, '#middle > table > tbody > tr:nth-child(2) > td:nth-child(1) > table > tbody > tr:nth-child(1) > td')))
data = driver.find_elements_by_css_selector("#middle > table > tbody > tr:nth-child(2) > td:nth-child(1) > table > tbody > tr:nth-child(1) > td")
print(data[0].text)
data_child = data[0].find_element_by_tag_name("strong")
data_parent = data[0].text.replace(data_child.text,'')
print(data_parent)
关于python - 如何提取忽略嵌套标签的文本,其中我需要 <td> 但不需要嵌套 <strong> 中的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51076418/