python - 使用 Python 解析复杂的 HTML

标签 python html-parsing

我已经知道使用 BeautifulSoup、htmllib 等在 Python 中进行基于标记的 HTML 解析。

但是,我想要一个强大的引擎,它可以执行复杂的任务,例如读取 html 表格、列表等,并将它们呈现为代码中易于使用的对象。 python有这么强大的库吗?

最佳答案

BeautifulSoup 是一个不错的库,它提供了一种解析 HTML 的好方法,并提供了一些方便的方法来非常轻松地解析数据。

您尝试做的事情可以使用一些简单的正则表达式轻松完成。您可以编写正则表达式来搜索特定模式的数据并提取您需要的数据。

关于python - 使用 Python 解析复杂的 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3167679/

相关文章:

python - 为什么我在标签小部件中的文本周围出现难看的大括号? -Tkinter

python - 导入错误 : DLL load failed: when importing statsmodels

python - Django:DecimalField 值显示

python - 使用 Flask 0.10.1 时获取 'TypeError: ObjectId(' ') 不是 JSON 序列化'

python - 解析 HTML : lxml error in Python

php - 使用PHP Simple HTML DOM解析器的奇怪错误

python - 二维 numpy 数组中行的经验分布

html - 使用rvest,如何从submit_form()返回的对象中提取html内容

mysql - 在最终呈现的 PHP 页面中将数据库表中的行空间解析为 HTML

php - 使用 PHP 简单 HTML DOM 解析器的奇怪错误