随笔分类 -  大论文

摘要:通过强过滤之后的用户数目283178个,微博数目431726条:1,原始数据 1 240085 1 240085 5.3803650272 28475 2 28475 4.4544637333 4279 3 4... 阅读全文
posted @ 2014-07-13 21:27 bobo的学习笔记 阅读(1391) 评论(0) 推荐(0) 编辑
摘要:1,提取出每个节目下的用户列表2,将用户id列表与用户的profile进行对应实现脚本如下: 1 #/bin/sh 2 3 program_dir=/home/minelab/liweibo/raw_data 4 user_file=/home/minelab/liweibo/spring... 阅读全文
posted @ 2014-07-08 21:13 bobo的学习笔记 阅读(252) 评论(0) 推荐(0) 编辑
摘要:1,统计数据的基本情况,包括微博总数,用户总数,最活跃和最不活跃的用户id#!/bin/shsource_dir=/home/minelab/data/DATAsource_file_name=userinfo_00_au_1_outsource_file=$source_dir/$source_f... 阅读全文
posted @ 2014-06-11 21:09 bobo的学习笔记 阅读(768) 评论(0) 推荐(0) 编辑
摘要:一、基于遥控器数据用户评分矩阵的计算:五类属性收藏(考虑次数,收藏节目和收藏频道的不同)预订(考虑次数)分享(考虑次数)观看(考虑次数,时长)搜索(考虑次数)对于某个节目的评分=搜索×搜索权重×搜索次数+。。。(其他类似)。。。+收藏×收藏次数×收藏权重(如果收藏了频道a,a和b同时播出节目c,那么... 阅读全文
posted @ 2014-05-20 22:53 bobo的学习笔记 阅读(213) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示