python - 如何通过 Python 中的 Selenium 从相对于多个分隔符动态变化的字符串中检索子字符串

标签 python selenium selenium-webdriver web-scraping split

我想知道是否可以删除部分已刮掉的字符串,例如:

Wujek Drew / Uncle Drew

进入

德鲁大叔

当然,由于是网页抓取,每次的标题都会不同,那么我该怎么做才能得到上面的结果呢?

<小时/>

更新

我忘记添加一些需要删除的内容。 Wujek Drew/Uncle Drew (2018) 我需要删除字符串末尾的数据。

最佳答案

要删除由 / 字符分隔的已抓取字符串的第一部分,您可以使用以下解决方案:

value = driver.find_element_by_xpath("element_xpath").get_attribute("innerHTML").split("/")[1] 
<小时/>

根据您的评论更新,如果您想从字符串 Wujek Drew/Uncle Drew (2018) 中提取子字符串 Uncle Drew ,您可以使用以下解决方案:

import re

value = driver.find_element_by_xpath("element_xpath").get_attribute("innerHTML")
#value='Wujek Drew / Uncle Drew (2018)'
print(re.split('[/()]',value)[1])

关于python - 如何通过 Python 中的 Selenium 从相对于多个分隔符动态变化的字符串中检索子字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52121094/

相关文章:

java - 使用 Java+Selenium WebDriver 验证页面上的错误消息的强大解决方案

java - 如何在 Selenium 中没有物理键盘的情况下按键盘键

python - 添加与不带循环的 groupby 操作相关的元素编号列

c# - 在系统测试中使用 Selenium 时,使用 Thread.Sleep 的替代方法是什么?

Python正则表达式在任何地方匹配多个单词

node.js - 在 Protractor 中为 e2e 测试设置 https 代理

Java + Selenium : ElementNotVisibleException

python - 如何使用 Selenium 和 Python 2.7 单击表单中的按钮?

python - 将日期时间序列化为整数时间戳

python - 使用 python subprocess.popen ..无法阻止 exe 停止工作提示