黑洞HTTP代理

黑洞HTTP

您的位置: 首页 > 新闻资讯 > HTTP代理 > 正文

代理IP中的Python常用模块--collections

发布时间:2019年03月18日 来源:互联网

collections是Python中一个非常强大的容器数据模块。


代理IP中的Python常用模块--collections


1.创建升级版的元组--namedtupe


Python的元组(1,2,3)具有不可变性,但是单独的元组在无法满足现有需求时,可以使用升级版的元组,使用namedtupe可以很方便地定义一种数据类型,它具备tuple的不变性,又可以根据属性来引用,使用十分方便。


#!/usr/bin/env python

# -*- coding:utf-8 -*-

__author__ = "问道编程"

__date__ = "2019/03/18 12:37"


from collections import namedtuple


Point = namedtuple('Ponit', ['x', 'y'])  # 实例化一个tupe对象,并规定了对象数量以及属性:x、y

p = Point(1,3)   # 赋值

print(p.x)   # 通过属性访问数据

print(p.y)

 


2.创建升级版的列表--deque


使用list存储数据时,可以非常方便的进行查询和尾部操作(append、pop),但是在头部添加、删除时效率很低(最大时间复杂度为n),所以有了deque,可以实现高效的头、尾的操作,适合用于队列和栈:


from collections import deque


q = deque([1,2,3])

q.append(6)   # [1,2,3,6]  同list一样进行尾部添加、删除操作

q.pop() # [1,2,3]

q.appendleft('x')  # ['x',1,2,3]  头部添加

q.popleft()  # [1,2,3]  头部删除

 


3.创建升级版字典--defaultdict


常用的dict使用键值对存储数据,但当使用key访问匹配的值,而key不存在时会报错,而使用defaultdict可以规定一个默认值,当使用不存在的key查询字典的值时,会返回一个指定的默认值:


from collections import defaultdict


d = defaultdict(lambda: 'N/A')   # 创建defaultdict对象,是字典类型的子集,并规矩默认值是   N/A

d['a'] = 1

print(d['a'])  # 1   正常输出

print(d['b'])  # N/A key不存在时,输出默认值

 


4.创建有顺序的字典--OrderedDict


常用的dict是不记录键值对顺序的,使用OrderedDict可以创建相对有序的字典,该类型可记录字典的输入顺序,但不能自动进行排序:


from collections import OrderedDict


d = OrderedDict()

d['a'] = 1

d['b'] = 2


print(d.keys())  # ['a','b'] 会按照key值的录入顺序进行打印

 


5.创建多个字典的映射--ChainMap


官方解释:一个 ChainMap 类是为了将多个映射快速的链接到一起,这样它们就可以作为一个单元处理。它通常比创建一个新字典和多次调用 update() 要快很多。


通俗的说,是创建一将多个字典链接到一起的映射,底层通过list实现,查询时,从第一个字典映射开始查,如果第一个字典没有,查询第二个,依次类推,但是更新、删除数据时仅对于第一个字典映射操作。


通常在进行拼接命令行时,可以对参数进行优先选择,比如用户输入数据、环境传入、默认值。


参考:https://docs.python.org/zh-cn/3/library/collections.html


 


6.功能强大的列表计数功能--Counter


from collections import Counter


arr = [1,2,3,3,3,6,2,2,2]  # 1出现1次,2出现4次,3出现3次,6出现1次

print(arr.count(3))   # 3  可以使用list的count方法获取指定值的出现次数

cou = Counter(arr)

pirnt(cou)  # Counter({3: 3, 2: 2, 1: 1, 5: 1, 6: 1})  属于字典的子集


for k,v in cou.items():

    print(k,v)       # 对Counter进行遍历,打印结果

print(cou.most_common(2)) # [(3,3),(2,2)]  返回出现次数最高的前两个数字及次数


黑洞http:是企业级http服务提供商,大数据采集服务服务提供商,我们拥有高品质爬虫代理,遍布全国200+城市服务器,从容应对海量IP需求,我们从不吝惜产品质量,为确保您获得最佳体验,我们选择与国内最值得信赖的运营服务商进行深度合作,提供更快,更可靠的服务。


相关文章内容简介

1 代理IP中的Python常用模块--collections

collections是Python中一个非常强大的容器数据模块。1.创建升级版的元组--namedtupePython的元组(1,2,3)具有不可变性,但是单独的元组在无法满足现有需求时,可以使用升级版的元组,使用namedtupe可以很方便地定义一种数据类型,它具备tuple的不变性,又可以根据属性来引用,使用十分方便。#!/usr/bin/env python# -*- coding:utf-8 -*-__author__ = "问道编程"__date__ = "2019/03/18 12:37"from collections import namedtuplePoint = namedtuple('Ponit', ['x', 'y'])  # 实例化一个tupe对象,并规定了对象数量 [阅读全文]

热门标签

最新标签

推荐阅读

  1. 21

    2019-11

    如何验证Python爬取的代理IP是否有效?

    在爬虫工作的过程中,往往由于IP被限制了而无法进行下去,工程师们也是智计百出,购买代理IP,自己搭建IP池,甚至网上抓取免费代理IP。我们知道,网络上有很多提供免费代理IP的网站,我

  2. 29

    2019-06

    如何使用代理ip服务器进行注册?

    当我们访问某网站,查看或者进行某项业务时,往往会被提示先注册登录,基本一个IP地址只能注册一个账号。对于每天有大量注册业务的网友来说,需要大量的 网页代理服务器 才能满足需求

  3. 17

    2019-07

    HTTP代理IP有什么优势?

    使用HTTP代理IP,就相当于带着面具去找同一个人打招呼,打招呼一次换一次面具,所以这个人以为是不同人找他,也就不会被封。

  4. 26

    2019-04

    如何测试爬虫代理?

  5. 22

    2019-05

    哪种https代理IP性价比更高?

    其实在如今的https代理ip市场上存在着这样一个普遍的现象,很多人很需要这样的功能来对自己进行帮助,但是去到各类平台一查价格却都望而却步。其实主要的原因是这种平台的功能的定价都

  6. 07

    2019-05

    代理IP出现问题的时候,该怎么解决?

    在IP检验的当时,我门设计构思了1个实体模型用于明确哪些地方IP应当优先检验。实体模型叙述给出:长久要用IP检验工作频率低,长期性无效IP检验评率低。不平稳IP和刚添加的IP检验頻率高。