python - 如何提取忽略嵌套标签的文本,其中我需要 <td> 但不需要嵌套 <strong> 中的文本

标签 python html selenium web-scraping css-selectors

我想忽略 <td> 中的嵌套标签在下面的代码中。 我只想要 <td> 中的整数(数字)不是 <strong> 中包含的文本标签。 我已经编写了 selenium 代码,但它在 <td>. 中返回了整个文本 有没有什么方法可以忽略嵌套并获取 <td> 中的数字

Python 代码:

 wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, '#middle > table > tbody > tr:nth-child(2) > td:nth-child(1) > table > tbody > tr:nth-child(1) > td')))
 data = driver.find_elements_by_css_selector("#middle > table > tbody > tr:nth-child(2) > td:nth-child(1) > table > tbody > tr:nth-child(1) > td")
    print(data[0].text)

OUTPUT:: Parcel Number 71200000

但我只想要71200000

HTML:

<table width="100%">
    <tbody>
        <tr style="">
            <td><strong>Parcel Number</strong> 71200000</td>
        </tr>
        <tr style="">
            <td><strong>Tax Area</strong> 19A - TAX DISTRICT 19A</td>
        </tr>
        <tr style="">
            <td><strong>Situs Address</strong> </td>
        </tr>
        <tr style="">
            <td><strong>Legal Summary</strong> W.H.M. SECTION A BLK 1 LOT 1 CONT. 7.14 AC</td>
        </tr>
    </tbody>
</table>

最佳答案

以下代码可能对您有所帮助。

wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, '#middle > table > tbody > tr:nth-child(2) > td:nth-child(1) > table > tbody > tr:nth-child(1) > td')))
    data = driver.find_elements_by_css_selector("#middle > table > tbody > tr:nth-child(2) > td:nth-child(1) > table > tbody > tr:nth-child(1) > td")
    print(data[0].text)
    data_child = data[0].find_element_by_tag_name("strong")
    data_parent = data[0].text.replace(data_child.text,'')
    print(data_parent)

关于python - 如何提取忽略嵌套标签的文本,其中我需要 <td> 但不需要嵌套 <strong> 中的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51076418/

相关文章:

html - 在 HTML5 中语义显示 BC/BCE 时间

python - 如何写好长的 Pandas 聚合?

python - 为共享服务器上的 http 请求定义 PYTHONPATH

php - 使用 jQuery 获取页面上的复选框并将值放入字符串中以发送 ajax 调用

javascript - 根据用户输入在网页上显示内容

python-3.x - Selenium webdriver python 元素屏幕截图无法正常工作

java - 无法通过 selenium webdriver 中的 XPath 选择特定列的文本框

python - 使用 HTMLParser 从页面中提取绝对链接

python - if __name__ == __main__ 的范围

javascript - 如何使用 selenium 在 Youtube 中向下滚动?