黑洞HTTP

黑洞HTTP

您的位置: 首页 > 新闻资讯 > HTTP代理 > 正文

Python简易实现IP代理池及其维护

发布时间:2019年03月21日 来源:http://http.hunbovps.com/News/getList/catid/8/id/170.html

Python简易实现IP代理池及其维护

用处

通过自己购买或爬取到的ip,在程序中使用这些ip进行代理,达到绕过反爬虫机制的效果以及其他用途。


思路

从各大免费的ip网站抓取ip,存入数据库,使用时按序取出使用。注:存入及使用前先验证ip是否可用


我们在这里使用 西刺 这里网站里的免费ip,数据库使用mongodb


使用到的库

request 


re 


json


结构

IpPool


__init__.py


panel


config.py


main.py


Code

init.py

我们在这个文件中写一个爬虫的基类,方便我们拓展不同的网站

Python简易实现IP代理池及其维护

Python简易实现IP代理池及其维护

config.py

在这里我们放一些参数,方便我们配置程序


Python简易实现IP代理池及其维护


mian.py

Python简易实现IP代理池及其维护上面就是这个ip爬取的主要框架,接下来开始接入西刺这个网站,在panel文件夹中新建文件 XICI.py

Python简易实现IP代理池及其维护Python简易实现IP代理池及其维护

再回到 main.py 使用process()函数开始爬虫


main.py

Python简易实现IP代理池及其维护

ip池的使用


我们可以在使用时先从数据库中将所有 ip 取出,安装队列的形式或者列表随机抽取的形式进行维护,当ip不可用时,从数据库中删除该ip,当出现ip被封时放回队列或者列表,这里不做过多的介绍


相关文章内容简介

1 Python简易实现IP代理池及其维护

Python简易实现IP代理池及其维护用处通过自己购买或爬取到的ip,在程序中使用这些ip进行代理,达到绕过反爬虫机制的效果以及其他用途。思路从各大免费的ip网站抓取ip,存入数据库,使用时按序取出使用。注:存入及使用前先验证ip是否可用我们在这里使用 西刺 这里网站里的免费ip,数据库使用mongodb使用到的库request re json结构IpPool__init__.pypanelconfig.pymain.pyCodeinit.py我们在这个文件中写一个爬虫的基类,方便我们拓展不同的网站config.py在这里我们放一些参数,方便我们配置程序mian.py上面就是这个ip爬取的主要框架,接下来开始接入西刺这个网站,在panel文件夹中新建文件 XICI.py再回到 main.py 使用process()函数开始爬虫main.pyip池的使用我们可以在使用时先 [阅读全文]

热门标签

最新标签

推荐阅读

  1. 25

    2019-11

    为什么使用代理IP需要用户名和密码?

    最近有一些用户使用短效优质代理IP时候,遇到了407错误,或者通过浏览器设置代理IP上网的时候,弹出“用户名和密码”对话框。很多用户不明白为什么使用代理IP,还需要用户名和密码才能使

  2. 09

    2019-09

    免费代理IP安全吗,怎么用免费代理上网?

    很多网民朋友疑惑,市面中的免费代理IP到底安不安全?使用后会对自己造成威胁吗?其实大家有这些顾虑是正常的,小编在这里也不推荐使用免费代理IP。

  3. 11

    2019-11

    代理ip可以防止游戏账号和IP被封吗?

    如何防止游戏账号和IP被封?有七种封号及防封解决方案:

  4. 15

    2019-05

    IP代理是一款可以更换IP软件

    现在网络越来越发展,网民的数量越来越多。而IP是一个网民所使用上网工具的区分标志,有时候,网民需要更换IP。对于怎么换电脑IP,有些网民懂得在浏览器上进行手动更换IP。但是手动更换I

  5. 22

    2019-11

    为什么会有免费代理ip?

    免费代理存在市面上已经有非常长的一段时间了,刚开始的时候,免费 代理ip 是由一些黑客弄出来的,稳定性不好,安全也不好,风险特别大,但是随着代理IP这个市场越来越大,现在已经有非

  6. 19

    2019-06

    为什么分布式爬虫不用免费代理ip服务器?

    互联网中,IP的作用至关重要。IP地址是指互联网协议地址,简单的说就是互联网分配给网络设备的门牌号,为了网络中的计算机能够互相访问,并且知道对方是谁。很多时候当我们想要保护自