IP代理软件,http代理,API提取-黑洞HTTP

黑洞HTTP

您的位置: 首页 > 新闻资讯 > HTTP代理 > 正文

IP代理Python爬虫 | 获取Cookie并实现模拟网站登录

发布时间:2019年04月19日 来源:互联网

  IP代理Python爬虫 | 获取Cookie并实现模拟网站登录!已经把Cookie存储到文件里,要是后期要用,能通过这一方式去读取Cookie并且浏览网站,代码如下:


IP代理Python爬虫 | 获取Cookie并实现模拟网站登录


  importcookielib


  import urllib2


  #创建MozillaCookieJar实例对象


  cookie= cookielib.MozillaCookieJar()


  #从文件中读取cookie内容到变量


  cookie.load('cookie.txt',ignore_discard=True,ignore_expires=True)


  #创建请求的request


  req= urllib2.Request("http://www.baidu.com")


  #利用urllib2的build_opener方法创建一个opener


  opener= urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))


  response =opener.open(req)


  printresponse.read()


  想象一下,要是cookie.txt 文件里存储的某个人登录百度的cookie,那提取该cookie文件信息,就能用这种方式模拟账号登录百度。


  利用cookie模拟网站登录


  接下来以教育系统为例子,通过cookie完成模拟登录,并将cookie内容存储到TXT文件中


  importurllib


  import urllib2


  importcookielib


  filename= 'cookie.txt'


  #声明一个MozillaCookieJar对象实例来保存cookie,之后写入文件


  cookie= cookielib.MozillaCookieJar(filename)


  opener =urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))


  postdata= urllib.urlencode({


  'stuid':'201200131012',


  'pwd':'23342321'


  })


  #登录教务系统的URL


  loginUrl ='http://jwxt.sdu.edu.cn:7890/pls/wwwbks/bks_login2.login'


  #模拟登录,并把cookie保存到变量


  result =opener.open(loginUrl,postdata)


  #保存cookie到cookie.txt中


  cookie.save(ignore_discard=True,ignore_expires=True)


  #利用cookie请求访问另一个网址,此网址是成绩查询网址


  gradeUrl ='http://jwxt.sdu.edu.cn:7890/pls/wwwbks/bkscjcx.curscopre'


  #请求访问成绩查询网址


  result =opener.open(gradeUrl)


  printresult.read()


相关文章内容简介

1 IP代理Python爬虫 | 获取Cookie并实现模拟网站登录

  IP代理Python爬虫 | 获取Cookie并实现模拟网站登录!已经把Cookie存储到文件里,要是后期要用,能通过这一方式去读取Cookie并且浏览网站,代码如下:  importcookielib  import urllib2  #创建MozillaCookieJar实例对象  cookie= cookielib.MozillaCookieJar()  #从文件中读取cookie内容到变量  cookie.load('cookie.txt',ignore_discard=True,ignore_expires=True)  #创建请求的request  req= urllib2.Request("http://www.baidu.com")  #利用urllib2的build_opener方法创建一个opener  opener= urlli [阅读全文]

热门标签

最新标签

推荐阅读

  1. 21

    2019-08

    http代理服务器哪家好

    每一个经营网站的人员应该都有这样的体会,这几年的白帽SEO越来越难做了,伴随搜索引擎技术的发展,要想通过本分的操作使得网站排名靠前的话,这要花费巨大的精力财力,而且随时还有排

  2. 10

    2019-07

    注册用的代理IP哪个好?

    我们平时使用网络最多的情况就是浏览网页,尽管现在的网站很方便,但是有时我们还是会遇到无法访问的情况,是因为我们的IP被限制了,使用代理IP替换真实IP,然后就可以进行访问了,这个

  3. 28

    2019-04

    爬虫代理如何做优化 ?

    注意很多网站,可以先用代理ip+ua(ua库随机提取)访问,之后会返回来一个cookie,那ip+ua+cookie就是一一对应的,然后用这个ip、ua和cookie去采集网站,这样效果会比较好

  4. 27

    2019-03

    淘宝流量整体下跌,代理IP能挽救吗?

    对于电商创业者,现在线上的流量才是最贵的。对很多电商创业者来说,如何引入流量、转化流量,才是赖以生存并持续发展的基础。很多小型电商每天几乎没有流量,更别说有转化了。

  5. 08

    2019-04

    使用代理IP进行信息采集:要警惕爬虫行为测试

    Python爬虫并不是真实的用户,他的行为模式和真正的用户还是有区别的,所以网站通常会采用测试用户行为模式去分辨目前浏览的用户到底是人还是爬虫机器。那么网站究竟通过什么途径来实现

  6. 05

    2019-09

    HTTP代理IP怎么运用方便?

    由于互联网的各种约束,导致咱们在拜访网站时经常受限,它的体现可能是无法翻开网页、注册不成功、无法登陆账号等。在这种状况下咱们能够经过运用HTTP代理IP来解决,那么,HTTP代理IP怎么