python - 使用 python twisted 编写网络爬虫

标签 python selenium web-crawler twisted

我正在使用 Twisted 编写一个由 Selenium 驱动的网络爬虫。这个想法是我为一个扭曲的客户端和一个将代理 HTTP 请求代理到服务器的扭曲服务器生成扭曲的线程。看起来像这样的东西:

    +--------+       +--------+
    |        +------>+        |
 -->| Client |       | Server |---> WWW
    |        +<------+        |
    +--------+       +--------+

不过,所有这些都在同一个进程中运行。问题是 twisted 是否允许这种应用程序或仅被认为将 ClientServer 作为不同的进程运行(因为这是我到处都看到的典型情况)。

最佳答案

您不能在线程中使用 Twisted。但是,您可以制作一个 Twisted 线程,它可以愉快地制作多个客户端和服务器。

您可能需要更详细地描述您的问题以获得更好的答案。

关于python - 使用 python twisted 编写网络爬虫,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29613616/

相关文章:

python - 通过字典键进行动态操作

python - 笨拙的理解清理

css - 如何使用 Selenium IDE 单击 Gmail 中的特定电子邮件?

python - 带有 python 绑定(bind)的 Selenium 可以启动 Firefox,但不能启动 Explorer 和 Chrome 浏览器

java - Jsoup 爬虫和 HTTP 错误获取 URL

python - 将数据表拆分为许多小数据表 Python

python - 使用不正确的 python 版本从 .deb 文件安装程序

python - 如何使用 XPath 提取同一标签下的所有文本?

python - 如何使用 python Selenium 单击单选按钮

html - 元关键字是否区分大小写?