python - 在Python中从html代码href解析页面

标签 python beautifulsoup

我有一个 html,其中包含以下代码:

<a href="?page=5" title="Go to last page">
            <span class="visually-hidden">Last page</span>
            <span aria-hidden="true">Last »</span>
          </a>

有人可以帮我使用 Beautiful Soup 获取最后页码(在本例中为 5)吗? 谢谢

最佳答案

您可以使用str.splithref=属性:

last_page = soup.find('a')['href'].split('=')[-1]
print(last_page)

打印:

5

或者(使用 <a> 选择 title="Go to last page" 标签:

last_page = soup.find('a', title='Go to last page')['href'].split('=')[-1]
print(last_page)

关于python - 在Python中从html代码href解析页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64572500/

相关文章:

python - 在代码更改时自动重新加载 Dask 工作器容器

python - 将 BeautifulSoup 导入 Monkeyrunner

python - 如何使用 Beautiful Soup 查找所有评论

python - 无法获取英文搜索结果

python - 将 numpy 导入为 np 与从 numpy 导入

python - 使用 lxml 设置元素内容会删除尾随空格

java - 为什么 Maven 中的动态版本范围没有最初预期的那么有用?

python - Pandas 滚动适用于允许nan

python - 使用python从网站爬取多个页面

python - 使用 BeautifulSoup 从页面源中提取数据值