python - 在Python中从html代码href解析页面

我有一个 html，其中包含以下代码:

<a href="?page=5" title="Go to last page">
            <span class="visually-hidden">Last page</span>
            <span aria-hidden="true">Last »</span>
          </a>

有人可以帮我使用 Beautiful Soup 获取最后页码(在本例中为 5)吗？谢谢

最佳答案

您可以使用str.split上href=属性:

last_page = soup.find('a')['href'].split('=')[-1]
print(last_page)

打印:

或者(使用 <a> 选择 title="Go to last page" 标签:

last_page = soup.find('a', title='Go to last page')['href'].split('=')[-1]
print(last_page)

关于python - 在Python中从html代码href解析页面，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/64572500/

上一篇：c - 定义三角形类型的程序

下一篇：git - 使用 Sphinx 时是否应该提交environment.pickle？

相关文章：

python - 在代码更改时自动重新加载 Dask 工作器容器

python - 将 BeautifulSoup 导入 Monkeyrunner

python - 如何使用 Beautiful Soup 查找所有评论

python - 无法获取英文搜索结果

python - 将 numpy 导入为 np 与从 numpy 导入

python - 使用 lxml 设置元素内容会删除尾随空格

java - 为什么 Maven 中的动态版本范围没有最初预期的那么有用？

python - Pandas 滚动适用于允许nan

python - 使用python从网站爬取多个页面

python - 使用 BeautifulSoup 从页面源中提取数据值