我有一系列的url
www.domain.com/calendar.php?month=may.2019
www.domain.com/calendar.php?month=april.2019
www.domain.com/calendar.php?month=march.2019
www.domain.com/calendar.php?month=feb.2019
...
...
...
www.domain.com/calendar.php?month=feb.2007
我想逐年提取。
我在找什么
2019
2019
...
...
2007
并将它们保存到另一列
这是我所拥有的:
data["urls"].str.extract('(?<=month=).*$')
最佳答案
修正你的代码
df["urls"].str.extract('(?<=month=).*\.(\d{4})$')
如果您相信所有人都具有相同的模式,那么这些应该有效。
拆分
df["urls"].str.rsplit('.', 1).str[-1]
切片
df["urls"].str[-4:]
关于python - 模式后提取字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56528221/