基于storm和hadoop的广告系统研究【7】

基于用户跟踪的数据进行挖掘,则初级挖掘数据表基础表如下:

页面记录表

序号 字段名 类型 注释
1 id int  
2 url string 页面地址
3 StoreTime time 收集时间

页面关键词解析表

序号 字段名 类型 注释
1 id int  
2 pageid int 页面记录表id
3 keyword string 关键词

网页拓扑结构表

序号 字段名 类型 注释
1 id int  
2 pageid int 页面记录表id
3 refpageid int 来源页面id

用户访问时段记录表

序号 字段名 类型 注释
1 id int  
2 userid guid 用户id
3 onlinetime time 上线时间点

网页被访问时段记录表

序号 字段名 类型 注释
1 id int  
2 pageid int 页面记录表id
3 requesttime time 被请求时间点


posted on 2014-02-11 18:54  AI001  阅读(109)  评论(0编辑  收藏  举报

导航