我的 python 程序涉及转到用户提供的 url,然后在页面上执行操作。理想情况下,输入错误的 url 将被识别并弹出错误。但是,如果它们具有正确的语法并且没有指向任何地方,则会加载 ISP 错误页面或广告站点。
例如:
“http://washingtonn.edu”--> http://search5.comcast.com/?cat=dnsr&con=dsqcy&url=washingtonn.edu
"http://www.amazdon.com/"--> http://www.amazdon.com/
有没有办法在不知道所有可能的页面的情况下检测到这些?第二个可能很难,因为它是一个真实的网站,但我很乐意 catch 第一个。
谢谢!
最佳答案
除非我误解了你的问题,否则你的要求是不可能的、没有意义的,或者远非微不足道。
如果您考虑一下,除了 404 错误,您检测到页面不存在,如果页面确实存在,则无法知道该页面是“好”还是“坏”,因为这是主观。或许可以应用一些通用规则,但您无法涵盖所有可能性。
唯一的方法是像谷歌对建议所做的那样,但这将意味着一个巨大的数据库,其中包含一个网站的流行列表,并且每次都测试接近度,但这远非微不足道而且可能没有必要。
要在 python 中处理 404 法规,您可以使用 lie httplib .
祝你好运!
关于python - 有什么方法可以检测 python 中输入错误的 url 吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6434667/