defaultdict 主要用来需要对 value 做初始化的情形。对于字典来说,key 必须是 hashable,immutable,unique 的数据,而 value 可以是任意的数据类型。如果 value 是 list,dict 等数据类型,在使用之前必须初始化为空,有些情况需要把 value 初始化为特殊值,比如 0 或者 ‘‘。
1
2
3
4
5
|
person_by_age = defaultdict( list ) for person in persons: d[person.age].append(person.name) |
defaultdict 和 dict 的使用方法一样,只有在初始化的时候必须传入一个 callable 的对象 x,当访问某个还不存在的 key 时,会把 value 自动设置成 x()。比如上例中,当第一次访问某个年龄的人 d[person.age] 就会变成 list(), 也就是 []。
当然也可以使用自己定义的 callable 对象,比如:
1
2
3
|
d = defaultdict(lambda: 0) d["hello"] += 1 # 1 d["a"] # 0 |
defaultdict 要比 dict.set_default 效率更高,使用起来也更直观和方便。
标准字典包括一个方法setdefault()来获取一个值,如果值不存在则建立一个默认值。defaultdict初始化容器是会让调用者提前指定默认值。
1
2
3
4
5
6
7
|
import collections def default_factory(): return 'default value' d = collections.defaultdict(default_factory, foo = 'bar' ) print 'd:' , d print 'foo =>' , d[ 'foo' ] print 'var =>' , d[ 'bar' ] |
只要所有键都有相同的默认值,就可以使用这个方法。
上面的结果是:
1
2
3
|
d: defaultdict(<function default_factory at 0x0201FAB0>, {'foo': 'bar'}) foo => bar var => default value |