简介

2.4新增

源代码:Lib/collections.py and Lib/_abcoll.py

提供了替换dict, list, set和tuple的数据类型。

主要类型如下:

namedtuple(): 命名元组,创建有名字域的元组子类的工厂函数。python 2.6新增。deque:双端队列,类似于列表,两端进栈和出栈都比较快速。python 2.4新增。Counter:字典的子类,用于统计哈希对象。python 2.7新增。OrderedDict:有序字典,字典的子类,记录了添加顺序。python 2.7新增。defaultdict:dict的子类,调用一个工厂函数支持不存在的值。python 2.5新增。

还提供了抽象基类,用来测试类是否提供了特殊接口,不管是哈希或者映射。

Counter

计数器(Counter)是一个容器,用来跟踪值出现了多少次。和其他语言中的bag或multiset类似。

计数器支持三种形式的初始化。构造函数可以调用序列,包含key和计数的字典,或使用关键字参数。

执行结果:

注意key的出现顺序是根据计数的从大到小。

可以创建空的计数器,再update:

执行结果:

访问计数

执行结果:

注意这里不存在的元素也会统计为0。

elements方法可以列出所有元素:

执行结果:

注意后面并没有输出计数为0的元素。

most_common()可以提取出最常用的元素。

执行结果:

Counter还支持算术和集合运算,它们都只会保留数值为正整数的key。

执行结果:

上面的例子让人觉得collections只能处理单个字符。其实不是这样的,请看标准库中的实例。

执行结果:

$ python3 collections_counter_normal.py

Counter({'blue': 3, 'red': 2, 'green': 1})

Counter({'blue': 3, 'red': 2, 'green': 1})

[('the', 27), ('is', 13), ('be', 12), ('if', 12), ('will', 12), ('user', 10), ('home', 9), ('default', 9), ('to', 9), ('users', 8)]

第1段代码和第2段的代码效果式样的,后面一段代码通过Counter实现了简单的单词的统计功能。比如面试题:使用python打印出/etc/ssh/sshd_config出现次数最高的10个单词及其出现次数。

下面看看Counter的相关定义:

class collections.Counter([iterable-or-mapping]) 。注意Counter是无序的字典。在key不存在的时候返回0. c['sausage'] = 0。设置值为0不会删除元素,要使用del c['sausage']。

除了标准的字典方法,额外增加了:

elements() :返回一个包含所有元素的迭代器,忽略小于1的计数。

most_common([n]):返回最常用的元素及其计数的列表。默认返回所有元素。

subtract([iterable-or-mapping]) :相减。

namedtuple

命名元组和普通元组的的内存效率差不多。它不会针对每个实例生成字典。

执行结果:

从上例可以看出命名元组Person类和excel的表头类似,给下面的每个列取个名字,真正excel行数据则存储在Person类的实例中。好处在于可以jane.name这样的形式访问,比记元组的index要直观。

注意列名在实现内部其实是个标识符,所以不能和关键字冲突,只能用字母或者下划线开头。下例会报错:

执行结果:

设置rename=True,列名会在冲突时自动重命名,不过这种重命名并不美观。

执行结果:

定义

collections.namedtuple(typename, field_names, verbose=False) 返回一个命名元组类。如果verbose为True,会打印类定义信息

命名元组在处理数据库的时候比较有用:

ChainMap 映射链

用于查找多个字典。

ChainMap管理一系列字典,按顺序根据key查找值。

访问值:

API和字典类似。

collections_chainmap_read.py

执行结果:

调整顺序

collections_chainmap_reorder.py

执行结果:

更新值

更新原字典:

collections_chainmap_update_behind.py

执行结果

直接更新ChainMap:

collections_chainmap_update_directly.py

执行结果

ChainMap可以方便地在前面插入字典,这样可以避免修改原来的字典。

collections_chainmap_new_child.py

执行结果

还可以通过传入字典的方式

collections_chainmap_new_child_explicit.py

执行结果

另外一种等价的方式:

更多资讯,尽在阿里云科技快讯~

来科技快讯看新闻鸭~

快点关注我认识我爱上我啊~~~

相关文章