摘要: 为实现文本去重(将前面采集的数据进行两两对比删除重复),写了以下代码。 #-*- coding: utf-8 -*-import pandas as pd inputfile = 'e:/data/H_KJ300F-JAC2101W.txt' #评论文件outputfile = 'e:/data/H 阅读全文
posted @ 2017-04-22 20:59 <编程小白> 阅读(1386) 评论(0) 推荐(0) 编辑