python - 在 Python 中找出代理类型(http,socks 4/5)?

标签 python http types proxy

我正在尝试制作一个从 Charon 获取代理列表的程序,它看起来像

202.43.178.31:3128
202.109.80.106:8080
193.165.79.13:3128
222.177.13.25:3128
125.40.181.247:8080
222.134.33.146:8080

并使其成为可以与代理链一起工作的

http 141.219.252.132 68664
http 118.174.0.155 8080
http 91.194.246.169 8080
http 91.194.246.81 8080
http 201.245.110.138 8888

我这样做了,但我需要一些方法来确定代理类型。 现在我的程序将“http”放在所有内容的前面,最多检查代理是否有效以及是否没有将其注释掉。 在 Python 中查找代理类型(并使其尽可能可移植,就像不使用任何特定于 linux 的工具一样)有什么建议吗?

最佳答案

一种方法是连接到外部服务器并检索 HTTP header 并从中获取信息。您还可以找到一些网站,当您连接到它时会检查代理类型并抓取页面以获取答案。

如果没有连接到某种服务器,我认为这是不可能的,因为 header 不会传回客户端,只会传回服务器。

另一种不太合适的方法可能是尝试连接每种类型的代理并查看哪种有效。

我希望这可以帮助您朝着正确的方向前进。

关于python - 在 Python 中找出代理类型(http,socks 4/5)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7180882/

相关文章:

python - TfidfVectorizer 数据类型不匹配

python - PUT 参数在 python/google 应用引擎中不起作用

python - 在 sqlalchemy 中关闭警告

python - 使用分隔符将文件中的多行存储到变量

asp.net-mvc - 在 404 响应上设置 Http 缓存 header 是否有意义?

C# 获取给定 T 的类型 Generic<T>

java - 用户创建的新类(class)?

haskell - 了解具有类约束的 2 级类型别名

python - Pandas 分组 - 值占分组总数的百分比不起作用

java - 持久 HTTP 连接 Java