统计的一个小题目python实现
最近面试碰到的一个题目,业余时间用python实现的。
拿到数据,先用sort 命令排序,也可再进一步去重复
sort -k 1,2 data.txt |uniq > data.new
1 # -*- coding:utf-8 -*- 2 3 #第一个字段是用户uid,第二个字段是商品tid,统计每个商品的用户购买数量 4 import sys 5 6 pre_tid="" 7 pre_uid="" 8 sum=0 9 for line in sys.stdin: 10 fields = line.strip().split('\t') #注意这里要加上strip()去除"\n" 11 uid = fields[0] 12 tid = fields[1] 13 if tid!=pre_tid: 14 if sum!=0: #读取第一行时,不要打印 15 print pre_tid+"\t"+str(sum) #类别改变就把上一个类别输出 16 pre_uid="" 17 pre_tid = tid 18 sum=1 #初始化计数器 19 else: 20 if(uid==pre_uid): #如果有两条完全重复的数据不计入 21 continue 22 else: 23 sum=sum+1 24 pre_uid=uid 25 26 print pre_tid+"\t"+str(sum)#打印最后一个类别