IP代理软件,http代理,API提取-黑洞HTTP

黑洞HTTP

您的位置: 首页 > 新闻资讯 > HTTP代理 > 正文

Python简易实现IP代理池及其维护

发布时间:2019年03月21日 来源:http://http.hunbovps.com/News/getList/catid/8/id/170.html

Python简易实现IP代理池及其维护

用处

通过自己购买或爬取到的ip,在程序中使用这些ip进行代理,达到绕过反爬虫机制的效果以及其他用途。


思路

从各大免费的ip网站抓取ip,存入数据库,使用时按序取出使用。注:存入及使用前先验证ip是否可用


我们在这里使用 西刺 这里网站里的免费ip,数据库使用mongodb


使用到的库

request 


re 


json


结构

IpPool


__init__.py


panel


config.py


main.py


Code

init.py

我们在这个文件中写一个爬虫的基类,方便我们拓展不同的网站

Python简易实现IP代理池及其维护

Python简易实现IP代理池及其维护

config.py

在这里我们放一些参数,方便我们配置程序


Python简易实现IP代理池及其维护


mian.py

Python简易实现IP代理池及其维护上面就是这个ip爬取的主要框架,接下来开始接入西刺这个网站,在panel文件夹中新建文件 XICI.py

Python简易实现IP代理池及其维护Python简易实现IP代理池及其维护

再回到 main.py 使用process()函数开始爬虫


main.py

Python简易实现IP代理池及其维护

ip池的使用


我们可以在使用时先从数据库中将所有 ip 取出,安装队列的形式或者列表随机抽取的形式进行维护,当ip不可用时,从数据库中删除该ip,当出现ip被封时放回队列或者列表,这里不做过多的介绍


相关文章内容简介

1 Python简易实现IP代理池及其维护

Python简易实现IP代理池及其维护用处通过自己购买或爬取到的ip,在程序中使用这些ip进行代理,达到绕过反爬虫机制的效果以及其他用途。思路从各大免费的ip网站抓取ip,存入数据库,使用时按序取出使用。注:存入及使用前先验证ip是否可用我们在这里使用 西刺 这里网站里的免费ip,数据库使用mongodb使用到的库request re json结构IpPool__init__.pypanelconfig.pymain.pyCodeinit.py我们在这个文件中写一个爬虫的基类,方便我们拓展不同的网站config.py在这里我们放一些参数,方便我们配置程序mian.py上面就是这个ip爬取的主要框架,接下来开始接入西刺这个网站,在panel文件夹中新建文件 XICI.py再回到 main.py 使用process()函数开始爬虫main.pyip池的使用我们可以在使用时先 [阅读全文]

热门标签

最新标签