python - 为什么我的python脚本有两种类型的结果?

标签 python xml python-2.7 mechanize

我有这样的脚本

 import mechanize
 url = "http://www.globalhide.com/browse.php?u=u=http://www.whoisxmlapi.com/whoisserver/WhoisService?domainName=google.com"
 br = mechanize.Browser()
 br.set_handle_robots(False)
 br.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1')]
 response = br.open(url)
 content = response.read()
 f = open('q.html', 'w')
 f.write(content)
 f.close()

我需要像 this 这样的结果
当我从 python shell 运行它时,结果正确。但是当我将其保存在 something.py 文件中并像这样运行时 python something.py q.html的内容enter image description here
我的代码有什么问题?

最佳答案

我不认为你的代码有什么问题。更改请求的 url 会返回良好的数据。

该块由 globalhide.com 自己实现。您在问题中添加的链接与您附加的页面相同(或多或少)。我不能确切地告诉你这个热链接阻止是如何实现的,但它可能是通过引用标题来实现的。调查referrer spoofing可以在这里帮助你。

编辑

在引荐人欺骗的情况下有点跳枪。我会同意 Aaron 的 cookie 建议。

关于python - 为什么我的python脚本有两种类型的结果?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16318206/

相关文章:

Python 标准库,signal::AttributeError:模块 'signal' 没有属性 'SIGALRM'

java - Java 中的 DTD 解析

ios - 从 XML 文件 iOS 中消除重复的配置文件

python - 哪种方法可以更简洁地获取 Python @property 作为具有特定条件的列表?

python - (子)模块中的 Python 脚本是否可以从其目录层次结构中的上游导入?

python - Python 字典和嵌套列表的问题

python - Tensorflow:如何从预测张量中检索信息?

php - 从 php 发布到 Flask

c# - 根据C#中的日期从Xml中过滤数据

python-2.7 - 如何使用斯坦福NER(命名实体识别器)的python接口(interface)?