黑洞HTTP

黑洞HTTP

您的位置: 首页 > 新闻资讯 > HTTP代理 > 正文

代理IP中的Python常用模块--collections

发布时间:2019年03月18日 来源:互联网

collections是Python中一个非常强大的容器数据模块。


代理IP中的Python常用模块--collections


1.创建升级版的元组--namedtupe


Python的元组(1,2,3)具有不可变性,但是单独的元组在无法满足现有需求时,可以使用升级版的元组,使用namedtupe可以很方便地定义一种数据类型,它具备tuple的不变性,又可以根据属性来引用,使用十分方便。


#!/usr/bin/env python

# -*- coding:utf-8 -*-

__author__ = "问道编程"

__date__ = "2019/03/18 12:37"


from collections import namedtuple


Point = namedtuple('Ponit', ['x', 'y'])  # 实例化一个tupe对象,并规定了对象数量以及属性:x、y

p = Point(1,3)   # 赋值

print(p.x)   # 通过属性访问数据

print(p.y)

 


2.创建升级版的列表--deque


使用list存储数据时,可以非常方便的进行查询和尾部操作(append、pop),但是在头部添加、删除时效率很低(最大时间复杂度为n),所以有了deque,可以实现高效的头、尾的操作,适合用于队列和栈:


from collections import deque


q = deque([1,2,3])

q.append(6)   # [1,2,3,6]  同list一样进行尾部添加、删除操作

q.pop() # [1,2,3]

q.appendleft('x')  # ['x',1,2,3]  头部添加

q.popleft()  # [1,2,3]  头部删除

 


3.创建升级版字典--defaultdict


常用的dict使用键值对存储数据,但当使用key访问匹配的值,而key不存在时会报错,而使用defaultdict可以规定一个默认值,当使用不存在的key查询字典的值时,会返回一个指定的默认值:


from collections import defaultdict


d = defaultdict(lambda: 'N/A')   # 创建defaultdict对象,是字典类型的子集,并规矩默认值是   N/A

d['a'] = 1

print(d['a'])  # 1   正常输出

print(d['b'])  # N/A key不存在时,输出默认值

 


4.创建有顺序的字典--OrderedDict


常用的dict是不记录键值对顺序的,使用OrderedDict可以创建相对有序的字典,该类型可记录字典的输入顺序,但不能自动进行排序:


from collections import OrderedDict


d = OrderedDict()

d['a'] = 1

d['b'] = 2


print(d.keys())  # ['a','b'] 会按照key值的录入顺序进行打印

 


5.创建多个字典的映射--ChainMap


官方解释:一个 ChainMap 类是为了将多个映射快速的链接到一起,这样它们就可以作为一个单元处理。它通常比创建一个新字典和多次调用 update() 要快很多。


通俗的说,是创建一将多个字典链接到一起的映射,底层通过list实现,查询时,从第一个字典映射开始查,如果第一个字典没有,查询第二个,依次类推,但是更新、删除数据时仅对于第一个字典映射操作。


通常在进行拼接命令行时,可以对参数进行优先选择,比如用户输入数据、环境传入、默认值。


参考:https://docs.python.org/zh-cn/3/library/collections.html


 


6.功能强大的列表计数功能--Counter


from collections import Counter


arr = [1,2,3,3,3,6,2,2,2]  # 1出现1次,2出现4次,3出现3次,6出现1次

print(arr.count(3))   # 3  可以使用list的count方法获取指定值的出现次数

cou = Counter(arr)

pirnt(cou)  # Counter({3: 3, 2: 2, 1: 1, 5: 1, 6: 1})  属于字典的子集


for k,v in cou.items():

    print(k,v)       # 对Counter进行遍历,打印结果

print(cou.most_common(2)) # [(3,3),(2,2)]  返回出现次数最高的前两个数字及次数


黑洞http:是企业级http服务提供商,大数据采集服务服务提供商,我们拥有高品质爬虫代理,遍布全国200+城市服务器,从容应对海量IP需求,我们从不吝惜产品质量,为确保您获得最佳体验,我们选择与国内最值得信赖的运营服务商进行深度合作,提供更快,更可靠的服务。


相关文章内容简介

1 代理IP中的Python常用模块--collections

collections是Python中一个非常强大的容器数据模块。1.创建升级版的元组--namedtupePython的元组(1,2,3)具有不可变性,但是单独的元组在无法满足现有需求时,可以使用升级版的元组,使用namedtupe可以很方便地定义一种数据类型,它具备tuple的不变性,又可以根据属性来引用,使用十分方便。#!/usr/bin/env python# -*- coding:utf-8 -*-__author__ = "问道编程"__date__ = "2019/03/18 12:37"from collections import namedtuplePoint = namedtuple('Ponit', ['x', 'y'])  # 实例化一个tupe对象,并规定了对象数量 [阅读全文]

热门标签

最新标签

推荐阅读

  1. 22

    2019-04

    代理IP如何获取与分析旅游行业大数据

    旅游行业可以说和大数据还有互联网行业关系很密切,随着现在物质生活和思想观念的提高转变,越来越多的人开始将自己的空余时间转移到旅游上来。可以说,你在旅游中的每一个阶段都会涉

  2. 07

    2019-08

    爬虫工作如何选择代理IP类型?

    之前为大家介绍过代理IP的类型分别是透明代理IP、匿名代理IP、高匿名代理IP、混淆代理IP。那么,爬虫工作如何选择代理IP类型?

  3. 26

    2019-04

    代理IP如何进行数据采集?

    我们在做爬虫的过程中经常会遇到这样的情况,最初爬虫正常运行,正常抓取数据,一切看起来都是那么正常,然而一杯茶的功夫可能就会出现错误,比如403 Forbidden。

  4. 18

    2019-09

    手游工作室代理ip封号问题知识科普

    在玩游戏赚钱的过程中,手游工作室总能遇到一些问题,这些问题有的很奇葩也有常见的,最无奈的是在网络上居然没有答案,如果我们不处理好这些小问题,如同眼中钉肉中刺一般让人难受,

  5. 18

    2019-07

    爬虫不用免费代理IP的因素有哪些?

    我一直觉得,python爬虫是许多开发者难以回避的点,python爬虫可以帮我们抓取并分析一些数据,例如它能定时抓取一个问题的关注量、浏览量、回答数,稍微对语言进行编辑开发,它还会定时收

  6. 11

    2019-11

    各大搜索引擎爬虫程序名是什么?

    通常搜索引擎抓取网页的方式就是通过搜索引擎的特定程序工具,去访问、索引互联网上的各个网站内容。