Fork me on GitHub

test

1.过滤原则:

1)去除所有u中不包含happyjuzi.com的日志

2)去除所有u中包含&uid=的日志

3)去除所有日志中不包含iptet的日志

2.su来源判定原则:

1.su==null

1)包含d_source=mobile 分享

2)包含from 三方

3)其他的都是直接来源

2.su!=null

1su包含baidu.comgoogle.comweibo.comweibo.cn为搜索

2u包含d_source=mobile 分享

3u包含from 三方

4su包含happyjuzi.com 直接

5others

3.定义原则:

1sessionidipt加上10万以内的随机数

2count字段为当et=0的时候,count才会加一

4.需要注意的问题:

1)跨小时访问sessionid出现错误(文件路径读取不按顺序)

2ep出现小数情况,已处理(只取整数)

3ipt单位不一直(出现13位,单位毫秒),已处理(全部10位,单位秒)

4)搜索关键词无法获取

posted @ 2016-09-28 10:26  ZepheryWen  阅读(137)  评论(0编辑  收藏  举报