asp.net - 使用 Python 抓取 *.aspx 内容

标签 asp.net python web-scraping

我在 ASPX 中抓取动态生成的表时遇到困难。试图从这样的网站上获取天然气价格 GasPrices 。我可以提取 Gas 价格表中的所有信息(地址、提交时间等),但实际 Gas 价格除外。

有什么办法可以降低汽油价格吗?即以某种方式获得它的文本表示。我对 ASP/ASPX 不太熟悉 - 但现在生成的内容并没有显示在最终的 HTML 中。我正在使用 Python 进行抓取,但除非有特定的库,否则这是无关紧要的......

提前致谢。

最佳答案

页面 (aspx) 的来源在这里不是问题。

看起来他们正在积极尝试阻止抓取尝试。这些数字不是字体,而是几个彼此相邻的 div 元素,其中 background images那是数字。 他们真的不想被抓取。

(当然,如果您真的有决心,您可能可以将 div 的类名映射到...它们不是很好“加密”)

请注意链接页面底部的版权声明

关于asp.net - 使用 Python 抓取 *.aspx 内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2741425/

相关文章:

python-3.x - Python twint 库在 Colab 环境中无法运行

c# - ASP.NET MVC 路由以数字开头的 URL

c# - MySqlDataReader - 阅读器关闭时尝试读取无效

c# - 如何将查询结果附加到数据表c#

python - 如何使用cgo在golang中导入cython生成的文件

python - 嵌入式CPython,使用命名管道进行线程交互

Python Vscode 扩展 - 无法更改远程 jupyter notebook 内核

regex - Google 表格 importXML 不适用于 youtube 网址

html - ASP.Net 表格宽度未正确显示

python - 如何改进正则表达式来提取电话号码?