会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
星云外
博客园
首页
新随笔
联系
订阅
管理
公告
2010年4月3日
工作日志4.3——处理实验数据
摘要: nutch爬取了分类文档集,回头看了sg日志,重复值很高,用distinct清洗了日志数据,抽取了几个查询内容比较丰富的用户信息,加上了时间戳准备先做历史click的聚合,再帮着界面的给呈现以下。。。。其他的没什么好说的,就写刚刚完成的这部分吧实验数据范例:上游理解有歧义,首先改列名USE temp;GOEXEC sp_rename 'dbo.expri5.ClickRank', 'ClickPa...
阅读全文
posted @ 2010-04-03 21:01 星云外
阅读(281)
评论(0)
推荐(0)
编辑