python - 我如何去一个随机的网站? - Python

标签 python url random web browser

如何生成一个随机但有效的网站链接,而不考虑语言。实际上,它生成的网站语言越多样化越好。

我一直通过在他们的网页上使用其他人的脚本来做到这一点,我怎么能不依赖这些随机的网站转发脚本而自己制作呢?。我一直这样做:

import webbrowser
from random import choice
random_page_generator = ['http://www.randomwebsite.com/cgi-bin/random.pl',
                         'http://www.uroulette.com/visit']
webbrowser.open(choice(random_page_generator), new=2)

最佳答案

I've been doing it by using other people's script on their webpage, how can i not rely on these random site forwarding script and make my own?

有两种方法:

  • 创建您自己的 spider收集了大量网站,然后从该集合中进行选择。
  • 访问一些预先存在的网站集合,然后从该集合中进行选择。例如,DMOZ/ODP 让您可以 download their entire database ;* Google 曾经有一个自定义的随机站点 URL;** 等等。

没有其他解决方法(除了随机生成和测试任意字符的有效字符串,这是一个可笑的坏主意)。

为自己构建网络蜘蛛可能是一个有趣的项目。链接驱动的抓取库,如 Scrapy可以为您做很多繁重的工作,让您写下您关心的部分。


* 请注意,与 Google 或 Yahoo 之类的数据库相比,ODP 是一个非常小的数据库,因为它主要是重要网站的人工编辑集合,而不是任何人放在网络上的所有内容的自动生成集合。

** Google 的随机站点功能是由受欢迎程度和您自己的搜索历史驱动的。然而,通过给它一个空的搜索历史,你可以删除等式的那一部分。不管怎样,我认为它不存在了。

关于python - 我如何去一个随机的网站? - Python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20619746/

相关文章:

python - 创建的 Excel 文件无法打开

python - 如何更改matplotlib annotate中的箭头样式?

string - 字符串匹配的随机算法

python - 为什么我的代码继续使用 else 语句?

python - PyFMI 模型交换和联合仿真结果不同?

python - PySpark - 带有 lambda 函数的映射

css - 将 jpeg 转换为 url for css

php - php URL 可以有数字参数吗?

javascript - 如何找到URL子路径?

random - 如何在 Rust 中生成一个范围内的随机数?