python - 在python中使用selenium获取所有href链接

标签 python selenium selenium-webdriver web-scraping

我正在用 Python 练习 Selenium，我想使用 Selenium 获取网页上的所有链接。

例如，我想要 href= 中的所有链接所有 <a> 的属性(property)http://psychoticelites.com/上的标签

我已经编写了一个脚本并且它正在运行。但是，它给了我对象地址。我试过使用 id标记来获取值，但是，它不起作用。

我当前的脚本:

from selenium import webdriver
from selenium.webdriver.common.keys import Keys


driver = webdriver.Firefox()
driver.get("http://psychoticelites.com/")

assert "Psychotic" in driver.title

continue_link = driver.find_element_by_tag_name('a')
elem = driver.find_elements_by_xpath("//*[@href]")
#x = str(continue_link)
#print(continue_link)
print(elem)

最佳答案

嗯，你必须简单地遍历列表:

elems = driver.find_elements_by_xpath("//a[@href]")
for elem in elems:
    print(elem.get_attribute("href"))

find_elements_by_* 返回一个元素列表(注意“elements”的拼写)。遍历列表，获取每个元素并从中获取所需的属性值(在本例中为 href)。

关于python - 在python中使用selenium获取所有href链接，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34759787/

上一篇：python - 列表理解期间的异常。中间结果是否保存在任何地方？

下一篇：python - 如何使用 Pandas 从 Excel 中读取某些列 - Python

相关文章：

php - Mink selenium2 驱动程序无法按预期工作

java.lang.IllegalStateException : The path to the driver executable must be set by the webdriver. chrome.driver 系统属性

java - 如何检查字段是否为空以及如何读取输入的文本？

selenium-webdriver - 如何在 Selenium webdriver 的父 WebElement 中查找子元素

python - 如何直接引用嵌套的 JSON 数据？

python - selenium 2- python- 即使 selenium 是最新的也无法导入 webdriver

java - 如何解决 htmlUnit WrapsDriver 错误

python - 2-dim 字典，键为字符串

python - 使用 Python 连接 ElephantSQL

python - 如何启动协程并继续执行同步任务？