python庫介紹-collections:高性能容器數據類型
簡介
2.4新增
源代碼:Lib/collections.py and Lib/_abcoll.py
提供了替換dict, list, set和tuple的數據類型。
主要類型如下:
namedtuple(): 命名元組,創建有名字域的元組子類的工廠函數。python 2.6新增。deque:雙端隊列,類似於列表,兩端進棧和出棧都比較快速。python 2.4新增。Counter:字典的子類,用於統計哈希對象。python 2.7新增。OrderedDict:有序字典,字典的子類,記錄了添加順序。python 2.7新增。defaultdict:dict的子類,調用一個工廠函數支持不存在的值。python 2.5新增。
還提供了抽象基類,用來測試類是否提供了特殊接口,不管是哈希或者映射。
Counter
計數器(Counter)是一個容器,用來跟蹤值出現了多少次。和其他語言中的bag或multiset類似。
計數器支持三種形式的初始化。構造函數可以調用序列,包含key和計數的字典,或使用關鍵字參數。
執行結果:
注意key的出現順序是根據計數的從大到小。
可以創建空的計數器,再update:
執行結果:
訪問計數
執行結果:
注意這裏不存在的元素也會統計爲0。
elements方法可以列出所有元素:
執行結果:
注意後面並沒有輸出計數爲0的元素。
most_common()可以提取出最常用的元素。
執行結果:
Counter還支持算術和集合運算,它們都只會保留數值爲正整數的key。
執行結果:
上面的例子讓人覺得collections只能處理單個字符。其實不是這樣的,請看標準庫中的實例。
執行結果:
$ python3 collections_counter_normal.py
Counter({'blue': 3, 'red': 2, 'green': 1})
Counter({'blue': 3, 'red': 2, 'green': 1})
[('the', 27), ('is', 13), ('be', 12), ('if', 12), ('will', 12), ('user', 10), ('home', 9), ('default', 9), ('to', 9), ('users', 8)]
第1段代碼和第2段的代碼效果式樣的,後面一段代碼通過Counter實現了簡單的單詞的統計功能。比如面試題:使用python打印出/etc/ssh/sshd_config出現次數最高的10個單詞及其出現次數。
下面看看Counter的相關定義:
class collections.Counter([iterable-or-mapping]) 。注意Counter是無序的字典。在key不存在的時候返回0. c['sausage'] = 0。設置值爲0不會刪除元素,要使用del c['sausage']。
除了標準的字典方法,額外增加了:
elements() :返回一個包含所有元素的迭代器,忽略小於1的計數。
most_common([n]):返回最常用的元素及其計數的列表。默認返回所有元素。
subtract([iterable-or-mapping]) :相減。
namedtuple
命名元組和普通元組的的內存效率差不多。它不會針對每個實例生成字典。
執行結果:
從上例可以看出命名元組Person類和excel的表頭類似,給下面的每個列取個名字,真正excel行數據則存儲在Person類的實例中。好處在於可以jane.name這樣的形式訪問,比記元組的index要直觀。
注意列名在實現內部其實是個標識符,所以不能和關鍵字衝突,只能用字母或者下劃線開頭。下例會報錯:
執行結果:
設置rename=True,列名會在衝突時自動重命名,不過這種重命名並不美觀。
執行結果:
定義
collections.namedtuple(typename, field_names, verbose=False) 返回一個命名元組類。如果verbose爲True,會打印類定義信息
命名元組在處理數據庫的時候比較有用:
ChainMap 映射鏈
用於查找多個字典。
ChainMap管理一系列字典,按順序根據key查找值。
訪問值:
API和字典類似。
collections_chainmap_read.py
執行結果:
調整順序
collections_chainmap_reorder.py
執行結果:
更新值
更新原字典:
collections_chainmap_update_behind.py
執行結果
直接更新ChainMap:
collections_chainmap_update_directly.py
執行結果
ChainMap可以方便地在前面插入字典,這樣可以避免修改原來的字典。
collections_chainmap_new_child.py
執行結果
還可以通過傳入字典的方式
collections_chainmap_new_child_explicit.py
執行結果
另外一種等價的方式:
更多資訊,盡在阿里雲科技快訊~
來科技快訊看新聞鴨~
快點關注我認識我愛上我啊~~~