python - 有什么方法可以检测 python 中输入错误的 url 吗?

标签 python error-handling web

我的 python 程序涉及转到用户提供的 url,然后在页面上执行操作。理想情况下,输入错误的 url 将被识别并弹出错误。但是,如果它们具有正确的语法并且没有指向任何地方,则会加载 ISP 错误页面或广告站点。

例如:

“http://washingtonn.edu”--> http://search5.comcast.com/?cat=dnsr&con=dsqcy&url=washingtonn.edu

"http://www.amazdon.com/"--> http://www.amazdon.com/

有没有办法在不知道所有可能的页面的情况下检测到这些?第二个可能很难,因为它是一个真实的网站,但我很乐意 catch 第一个。

谢谢!

最佳答案

除非我误解了你的问题,否则你的要求是不可能的、没有意义的,或者远非微不足道。

如果您考虑一下,除了 404 错误,您检测到页面不存在,如果页面确实存在,则无法知道该页面是“好”还是“坏”,因为这是主观。或许可以应用一些通用规则,但您无法涵盖所有​​可能性。

唯一的方法是像谷歌对建议所做的那样,但这将意味着一个巨大的数据库,其中包含一个网站的流行列表,并且每次都测试接近度,但这远非微不足道而且可能没有必要。

要在 python 中处理 404 法规,您可以使用 lie httplib .

祝你好运!

关于python - 有什么方法可以检测 python 中输入错误的 url 吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6434667/

相关文章:

python - Riak - 尝试使用 Python 客户端库连接到 Riak 集群时连接被拒绝

python - pandas read_csv 解析外国日期

javascript - 是否可以运行JavaScript(NodeJS)命令/函数,并在出现错误时让程序继续运行?

c# - Blazor 客户端发送电子邮件

ssl - .app 域是否不需要单独的 SSL 证书

python - 从多个其他列中减去一列

c# - 获取导致异常的表单名称、方法名称和更多详细信息

objective-c - NSError、Swift 和可空性

javascript - HTTP请求/回复服务器端是怎么写的?

python - pandas 使用正则表达式从文本中获取值