我已经知道使用 BeautifulSoup、htmllib 等在 Python 中进行基于标记的 HTML 解析。
但是,我想要一个强大的引擎,它可以执行复杂的任务,例如读取 html 表格、列表等,并将它们呈现为代码中易于使用的对象。 python有这么强大的库吗?
最佳答案
BeautifulSoup 是一个不错的库,它提供了一种解析 HTML 的好方法,并提供了一些方便的方法来非常轻松地解析数据。
您尝试做的事情可以使用一些简单的正则表达式轻松完成。您可以编写正则表达式来搜索特定模式的数据并提取您需要的数据。
关于python - 使用 Python 解析复杂的 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3167679/