爬虫代理如何设置ua和代理ip!一、设置User-Agent
1、创建Request对象时指定headers
url = 'http://ip.zdaye.com/'
head = {}
head['User-Agent'] = 'Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.166 Safari/535.19'
req = request.Request(url, headers=head)
#传入创建好的Request对象
response = request.urlopen(req)
html = response.read().decode('utf-8')
print(html)
2、创建Request对象后使用add_header
req.add_header('User-Agent', 'Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.166 Safari/535.19')
# 参数为 (key, value)
二、设置代理IP
使用install_opener方法之后,会将程序默认的urlopen方法替换掉。也就是说,如果使用install_opener之后,在该文件中,再次调用urlopen会使用自己创建好的opener。如果不想替换掉,只是想临时使用一下,可以使用opener.open(url),这样就不会对程序默认的urlopen有影响。
from urllib import request
if __name__ == "__main__":
url = www.16yun.cn'
#这是代理IP
proxy = {'http':'168.68.8.88:66666'}
#创建ProxyHandler
proxy_support = request.ProxyHandler(proxy)
#创建Opener
opener = request.build_opener(proxy_support)
#添加User Angent
opener.addheaders = [('User-Agent','Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36')]
#安装OPener
request.install_opener(opener)
#使用自己安装好的Opener
response = request.urlopen(url)
html = response.read().decode("utf-8")
print(html)
相关资讯
相关文章内容简介
1 爬虫代理如何设置ua和代理ip
爬虫代理如何设置ua和代理ip!一、设置User-Agent 1、创建Request对象时指定headers url = 'http://ip.zdaye.com/' head = {} head['User-Agent'] = 'Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.166 Safari/535.19' req = request.Request(url, headers=head) #传入创建好的Request对象 response = request.urlopen(req) html = response. [阅读全文]
推荐阅读
11
2019-06
爬虫如何突破IP被封问题
做python爬虫,最常遇到的问题就是IP被封,市面上常见的换IP工具有代理IP,两者有什么区别呢?一般指虚拟专用网络,通过在公用网络上建立专用网络,进行加密通讯。成本低,百度搜索关键词
18
2019-06
合适的代理IP解决访问网站等一系列问题
在我们学习各种编程语言的时候,出现各种异常是很常见的,拿最简单最基础的爬虫采集数据为例,过程中就会面临,IP被封,爬取受限、违法操作等多种问题,所以在爬取数据之前,一定要
31
2019-10
QQ如何使用代理ip更改ip?
微信现在已经占据了我们的大部分生活,但是QQ是一种比较早的聊天工具,深受人们广泛运用,季后70往后的人都是拥有或者使用过这种聊天工具,伴随着互联网的进步,大数据的发展,很多使
12
2019-08
国内代理ip软件有哪些?哪个代理IP效果好呢?
为什么要使用代理ip软件,因为ip频繁的爬取某个服务器,会对服务器造成巨大负载,因此大部分的网站都设有限制,ip限制是最常用的一种,因此想要频繁访问就需要更换ip,那么国内代理ip软
24
2019-03
HTTP状态码是什么?
HTTP状态码(HTTP Status Code)是表示网页服务器超文本传输协议响应状态的3位数字代码。即当服务器收到某种请求时,例如,当用户通过浏览器访问你的网页页面,服务器会向这个浏览器返回一个代
20
2019-11
SOCKS5代理的特性和测试教程
Socks5是一种代理,也就是先所有的交互数据都先经过另一台主机(网卡),这个过程中用户访问其他网络是都是使用的代理服务提供者的身份,采用socks协议的代理服务器就是SOCKS服务器,是一
热门文章
注意: 严禁一切违规违法的业务,一经发现直接封帐号
Powered by wanchen tech. © | 粤ICP备18047396号-6 广州万宸软件科技有限公司http代理 版权所有