IP代理软件,http代理,API提取-黑洞HTTP

黑洞HTTP

您的位置: 首页 > 新闻资讯 > HTTP代理 > 正文

Python简易实现IP代理池及其维护

发布时间:2019年03月21日 来源:http://http.hunbovps.com/News/getList/catid/8/id/170.html

Python简易实现IP代理池及其维护

用处

通过自己购买或爬取到的ip,在程序中使用这些ip进行代理,达到绕过反爬虫机制的效果以及其他用途。


思路

从各大免费的ip网站抓取ip,存入数据库,使用时按序取出使用。注:存入及使用前先验证ip是否可用


我们在这里使用 西刺 这里网站里的免费ip,数据库使用mongodb


使用到的库

request 


re 


json


结构

IpPool


__init__.py


panel


config.py


main.py


Code

init.py

我们在这个文件中写一个爬虫的基类,方便我们拓展不同的网站

Python简易实现IP代理池及其维护

Python简易实现IP代理池及其维护

config.py

在这里我们放一些参数,方便我们配置程序


Python简易实现IP代理池及其维护


mian.py

Python简易实现IP代理池及其维护上面就是这个ip爬取的主要框架,接下来开始接入西刺这个网站,在panel文件夹中新建文件 XICI.py

Python简易实现IP代理池及其维护Python简易实现IP代理池及其维护

再回到 main.py 使用process()函数开始爬虫


main.py

Python简易实现IP代理池及其维护

ip池的使用


我们可以在使用时先从数据库中将所有 ip 取出,安装队列的形式或者列表随机抽取的形式进行维护,当ip不可用时,从数据库中删除该ip,当出现ip被封时放回队列或者列表,这里不做过多的介绍


相关文章内容简介

1 Python简易实现IP代理池及其维护

Python简易实现IP代理池及其维护用处通过自己购买或爬取到的ip,在程序中使用这些ip进行代理,达到绕过反爬虫机制的效果以及其他用途。思路从各大免费的ip网站抓取ip,存入数据库,使用时按序取出使用。注:存入及使用前先验证ip是否可用我们在这里使用 西刺 这里网站里的免费ip,数据库使用mongodb使用到的库request re json结构IpPool__init__.pypanelconfig.pymain.pyCodeinit.py我们在这个文件中写一个爬虫的基类,方便我们拓展不同的网站config.py在这里我们放一些参数,方便我们配置程序mian.py上面就是这个ip爬取的主要框架,接下来开始接入西刺这个网站,在panel文件夹中新建文件 XICI.py再回到 main.py 使用process()函数开始爬虫main.pyip池的使用我们可以在使用时先 [阅读全文]

热门标签

最新标签

推荐阅读

  1. 05

    2019-06

    什么是代理IP的账号和密码呢?

    在我们使用代理IP的时候经常会遇到代理IP账号密码,那么什么是代理IP的账号和密码呢?在这里简单为大家讲一下。

  2. 15

    2019-07

    如何定制代理IP?

    很多人总是听说IP代理或者HTTP代理,那到底什么是真正的代理呢其实通俗的讲,IP代理和我们现实中的各种代理商是一样的,它就是我们在访问目标网络时的一个中转站。而这个中转站就是被称

  3. 17

    2019-08

    http代理服务器的主要用途

    HTTP代理服务器是安装在某些网络计算机服务器上的软件(如squid,wingate和ccproxy)。我们通常只称它为代理。代理的主要目的是在两台计算机(客户端和服务器)之间中继流量。通常它会进行一

  4. 24

    2019-06

    socks5代理IP工具SocksCap的使用教程

     在上一篇文章《socks5代理IP工具Proxifier的使用教程》我们了解了怎么通过Proxifier工具来使用socks5代理IP,今天主要介绍另外一款功能非常强大的工具——SocksCap。

  5. 14

    2019-11

    为什么会有代理ip?

    互联网时代,对于ip地址的限制慢慢的加强起来,特别是现在很多公司都在网上开展业务,但由于网络的一些限制,代理IP这个工具就走入了人们的生活,使用代理IP可以解决各种IP限制为问题。

  6. 20

    2019-11

    代理ip爬虫使用什么语言?

    有很多刚刚做爬虫工作者得新手经常会问道这样一个问题,做爬虫需要什么语言,个人觉得任何语言,只要具备访问网络的标