python-- toolz.itertoolz

2019.9.25:

　　 toolz 是十分便利的工具

学习内容：itertoolz

一、Itertoolz：

1、accumulate（binop, seq, initial）:

　　反复将二进制函数应用于序列，累积结果，返回迭代器

　　如果有initial，新序列第一个值就是initial，不然就是seq的第一个值

>>> from operator import add, mul
>>> list(accumulate(add, [1, 2, 3, 4, 5]))
[1, 3, 6, 10, 15]
>>> list(accumulate(mul, [1, 2, 3, 4, 5]))
[1, 2, 6, 24, 120]

插一句：operator有以下方法提供：

__all__ = ['abs', 'add', 'and_', 'attrgetter', 'concat', 'contains', 'countOf',
           'delitem', 'eq', 'floordiv', 'ge', 'getitem', 'gt', 'iadd', 'iand',
           'iconcat', 'ifloordiv', 'ilshift', 'imatmul', 'imod', 'imul',
           'index', 'indexOf', 'inv', 'invert', 'ior', 'ipow', 'irshift',
           'is_', 'is_not', 'isub', 'itemgetter', 'itruediv', 'ixor', 'le',
           'length_hint', 'lshift', 'lt', 'matmul', 'methodcaller', 'mod',
           'mul', 'ne', 'neg', 'not_', 'or_', 'pos', 'pow', 'rshift',
           'setitem', 'sub', 'truediv', 'truth', 'xor']

2、groupby(key, seq):

　　序列：

>>> names = ['Alice', 'Bob', 'Charlie', 'Dan', 'Edith', 'Frank']
>>> groupby(len, names)  # doctest: +SKIP
{3: ['Bob', 'Dan'], 5: ['Alice', 'Edith', 'Frank'], 7: ['Charlie']}

　　序列嵌套字典：通过key对 List[dict] 分组，注意结果⚠️

>>> groupby('gender', [{'name': 'Alice', 'gender': 'F'},
...                    {'name': 'Bob', 'gender': 'M'},
...                    {'name': 'Charlie', 'gender': 'M'}]) # doctest:+SKIP
{'F': [{'gender': 'F', 'name': 'Alice'}],
 'M': [{'gender': 'M', 'name': 'Bob'},
       {'gender': 'M', 'name': 'Charlie'}]}

3、merge_sorted(*seqs, key=None)：

　　合并序列，并排序。返回惰性迭代器。

4、interleave(seqs):

　　交替合并序列，返回惰性迭代器（不解包不执行）

5、unique（seq，key=None）：

　　类似集合的特性，保持元素唯一性，同时很灵活的可以通过key做唯一性的约定

6、isiterable(x) :

　　返回布尔值，x是否可迭代的。

7、isdistinct（seq）：

　　返回布尔值，seq中元素是否不重复。

8、take（n， seq）：

　　返回序列的前n个元素。

9、drop（n， seq）：

　　返回序列的除前n个元素的其他元素，返回迭代器。

10、take_nth（n， seq）：

　　隔n-1个元素取出一个，并加入到迭代器.

from toolz import take_nth

seq = [1,2,3,4,5,6,7,8,9,0]
take_nth(seq, 3)
list(take_nth(3, seq))

>>>[1, 4, 7, 0]

11、first（seq）或 second（seq）或 nth（n， seq）或last（seq）：

　　返回seq的第一或二或n或最后一个元素。

12、get（ind， seq， default=' nodefault__'）：

　　返回迭代器。

　　序列：等同 seq[x] for x in ind

　　字典：获取指定key的value

13、concat(seqs):

　　列表嵌套列表：拆开子列表，不做去重和排序，返回迭代器。可被set（）强转达到去重的目的

>>> list(concat([[], [1], [2, 3]]))
[1, 2, 3]

14、cons（el，seq）：

　　将el插到seq序列的开头。

15、interpose（el，seq）：

　　seq每个元素中间都插一个el。

>>> list(interpose("a", [1, 2, 3]))
[1, 'a', 2, 'a', 3]

16、frequencies（seq）：

17、reduceby（key，binop，seq，init =' nodefault__'）：

　　后续补充

18、iterate（func， x）：

　　反复将函数func应用于原始输入。

　　例如：产生x，然后是func（x），然后是func（func（x）），然后是func（func（func（x））），依此类推。

　　通过next（）产生下一个结果

19、sliding_window（n，seq）：

　　产生重叠为n位的子序列：

>>> list(sliding_window(2, [1, 2, 3, 4]))
[(1, 2), (2, 3), (3, 4)]

20、partition（n，seq，pad =' nopad__'）：

　　按照n，将序列拆分成元组，不重叠。如果的长度seq不能被整除n，则最后的元组将被丢弃（如果pad未指定），或通过填充填充至长度n。pad是填充值。

21、partition_all（n， seq）：

　　和partition区别是，突出的元素不会被丢弃或填充，只是独立成一个元组

22、diff（*seq， **kwargs， default=' nodefault__'， key=None）：

　　将序列之间不同的元素，最多两个，组成一个元组。如果有奇数个元素不同，最后那个元素可能丢弃（除非default存在填充）。key将一个函数应用于每个项目。

23、topk（k，seq，key=None）：

　　找出序列的k个最大元素。key设定挑选规则

24、peek（seq）：

　　返回两个值，一个是seq的第一个元素，另一个是该原始seq。

25、recipes.countby(key, seq):

　　针对key制定的规则对seq进行计数：

26、recipes.partitionby(func, seq)：

　　根据func对seq进行分区。每次func的输出更改时，都会启动一个新列表，并将后续项目收集到该列表中。

posted @ 2019-09-25 23:01 Marvin_Tang 阅读(589) 评论(0) 编辑收藏举报

刷新页面返回顶部

Marvin_Tang