python - 如何抓取这个字段?

标签 python selenium web-scraping xpath

我的代码转到网页并抓取所有作者,但我还需要 session 名称。

我当前的代码将仅打印“SESSION”,而不是 session 的值

from selenium.webdriver.common.by import By
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
driver = webdriver.Chrome()
wait=WebDriverWait(driver, 70)

driver.get('https://meetinglibrary.asco.org/results?filters=JTVCJTdCJTIyZmllbGQlMjIlM0ElMjJmY3RNZWV0aW5nTmFtZSUyMiUyQyUyMnZhbHVlJTIyJTNBJTIyQVNDTyUyMEFubnVhbCUyME1lZXRpbmclMjIlMkMlMjJxdWVyeVZhbHVlJTIyJTNBJTIyQVNDTyUyMEFubnVhbCUyME1lZXRpbmclMjIlMkMlMjJjaGlsZHJlbiUyMiUzQSU1QiU1RCUyQyUyMmluZGV4JTIyJTNBMCUyQyUyMm5lc3RlZFBhdGglMjIlM0ElMjIwJTIyJTdEJTJDJTdCJTIyZmllbGQlMjIlM0ElMjJZZWFyJTIyJTJDJTIydmFsdWUlMjIlM0ElMjIyMDIxJTIyJTJDJTIycXVlcnlWYWx1ZSUyMiUzQSUyMjIwMjElMjIlMkMlMjJjaGlsZHJlbiUyMiUzQSU1QiU1RCUyQyUyMmluZGV4JTIyJTNBMSUyQyUyMm5lc3RlZFBhdGglMjIlM0ElMjIxJTIyJTdEJTVE')


productList=wait.until(EC.presence_of_all_elements_located((By.XPATH,"//div[@class='record']")))
for product in productList:
        author=product.find_element_by_xpath(".//div[@class='record__ellipsis']").text
        session=product.find_element_by_xpath("//div[@class='record__meta__title']").text
        print(session)

最佳答案

要获取 session 名称,请使用xpath:

//div[@class='record__meta ng-star-inserted'][1]/div[2]

要获取 session header ,我会使用:

//div[@class='record__category ng-star-inserted']

和标题:

//div[@class='record__title ng-star-inserted']/span

关于python - 如何抓取这个字段?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67322530/

相关文章:

python - 使用 BeautifulSoup 提取包含字符串的表

javascript - Python - 从 Instagram 视频中抓取观看次数,加载为 JSON 格式

python - Python 中的之字折线指标

Python - 检查今天是否创建了文件

java - Selenium WebDriver 错误? ChromeDriver 设置值时不关注字段?

linux - curl, sed//有人知道从网络和进程中提取信息的更好方法吗?

python - nltk 的 UnicodeDecodeError

python - 接受来自 docopt 的任意选项

java - ChromeDriver 无法启动

python-3.x - Selenium 通过 xpath 查找元素并单击