IP代理软件,http代理,API提取-黑洞HTTP

黑洞HTTP

您的位置: 首页 > 新闻资讯 > HTTP代理 > 正文

Python如何设置User-Agent和代理IP

发布时间:2019年06月03日 来源:http://http.hunbovps.com/News/getList/catid/8/id/669.html

  Python如何设置User-Agent和代理IP?爬虫为了对抗反爬虫策略,设置User-Agent和代理IP是必须的一项工作,常见的一些User-Agent这里就不再赘述了,之前写过一篇《


Python如何设置User-Agent和代理IP


  收集一些常见浏览器的User Agent》,可以参考一下,那么Python如何设置User-Agent和代理IP呢?


  一、设置User-Agent


  1、创建Request对象时指定headers


  url = 'http://ip.zdaye.com/'


  head = {}


  head['User-Agent'] = 'Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D) AppleWebKit/535.19 (KHTML,  like Gecko) Chrome/18.0.1025.166  Safari/535.19'


  req = request.Request(url, headers=head)


  #传入创建好的Request对象


  response = request.urlopen(req)


  html = response.read().decode('utf-8')


  print(html)


  2、创建Request对象后使用add_header


  req.add_header('User-Agent', 'Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.166  Safari/535.19')


  # 参数为 (key, value)


  二、设置代理IP


  使用install_opener方法之后,会将程序默认的urlopen方法替换掉。也就是说,如果使用install_opener之后,在该文件中,再次调用urlopen会使用自己创建好的opener。如果不想替换掉,只是想临时使用一下,可以使用opener.open(url),这样就不会对程序默认的urlopen有影响。


  from urllib import request


  if __name__ == "__main__":


  url = 'http://ip.zdaye.com/'


  #这是代理IP


  proxy = {'http':'168.68.8.88:66666'}


  #创建ProxyHandler


  proxy_support = request.ProxyHandler(proxy)


  #创建Opener


  opener = request.build_opener(proxy_support)


  #添加User Angent


  opener.addheaders = [('User-Agent','Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36')]


  #安装OPener


  request.install_opener(opener)


  #使用自己安装好的Opener


  response = request.urlopen(url)


  html = response.read().decode("utf-8")


  print(html)


相关文章内容简介

1 Python如何设置User-Agent和代理IP

  Python如何设置User-Agent和代理IP?爬虫为了对抗反爬虫策略,设置User-Agent和代理IP是必须的一项工作,常见的一些User-Agent这里就不再赘述了,之前写过一篇《  收集一些常见浏览器的User Agent》,可以参考一下,那么Python如何设置User-Agent和代理IP呢?  一、设置User-Agent  1、创建Request对象时指定headers  url = 'http://ip.zdaye.com/'  head = {}  head['User-Agent'] = 'Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D) AppleWebKit/535.19 (KHTML,  like Gecko) Chrome/18.0.102 [阅读全文]

热门标签

最新标签

推荐阅读

  1. 19

    2019-06

    HTTP代理IP你必须知道的几点

    HTTP代理IP在现实生活中应用越来越频繁,越来越多的网络运营、销售、推广需要这种代理方式。而在你使用HTTP代理IP时,你真的明白它的工作原理吗?你是否能根据自己实际需要选择一款最适合

  2. 30

    2019-05

    使用代理IP助力淘宝关键词排名

    淘宝火了很多年了,每年的双十一双十二那叫一个火爆,很多人都在淘宝上赚到了钱,也有很多人没赚到钱,现在还有很多人想加入淘宝,但现在淘宝已经不好做了,因为做的人实在太多了,竞

  3. 26

    2019-08

    代理ip通用的爬虫系统有哪些类型?

    大数据高速发展时代,爬虫行业日益火爆,从业者如过江之鲫,数不胜数,说到爬虫就不得不提另外一个词:代理IP。爬虫虽然大行其道,但相应的反爬虫也步步紧逼,毫不相让,唯有代理IP,

  4. 19

    2019-09

    为何要使用高匿代理ip?

    虽然说电商事业发展的越来越快,但是在整个电商大行业下,还是分有很多类的。近几年兴起的电商和传统的淘宝行业还是不同的。因为淘宝处在一个被动的位置,不需要淘宝大肆宣传也会有客

  5. 11

    2019-11

    如何提高爬虫工作效率,用代理ip!

    代理ip是网络爬虫不可缺少的部分,随着大数据的兴起,每个网站都有自己的庞大的数据信息和每天的更新,个个网站也对自己的网站加强自我保护及信息流失,增加了网站反爬虫机制,在网站

  6. 01

    2019-06

    IP代理服务器软件工作原理你知道吗?

    然而随着互联网的飞速发展,越来越多的用户在上网过程中暴露个人的隐私信息,做电商的担心店铺刷单太多而造成被封,做营销的担心投票数不够而排不到好的名次…这个时候使用天下数据动