摘要:
很多时候我们获取的数据存在大量重复,重复数据在进一步处理时会降低处理效率,且可能导致错误,因此内容去重是数据处理一个重要步骤。 通过list的set()和sort()函数对于数据进行顺序去重,读取文件夹中的所有文件,生成文件列表,读取文件内容列表,进行去重和按原索引顺序排序。 首先我们需要将所有需要 阅读全文
摘要:
列表list是python中基本的数据结构,列表中的每个元素都分配一个数字作为索引进行管理,在形式上列表与c语言的数组有一定的相似之处,但是列表的灵活性与易用性是远远超过数组的。 list的索引从0开始,其中的元素不需要具有相同的类型,因此可以把各种类型的数据存在一个列表中,列表的声明也很简单,使用 阅读全文