上一页 1 2 3 4 5 6 7 ··· 16 下一页
摘要: 聚类: 是否可以将事物归为一个簇,完全取决于我们在考量它们之间相似性时所选择的特征参数。 聚类,就是将一个给定文档中的相似项目分成不同簇的过程,我们可以将这些簇看做一组簇内相似而簇间有别的项目的集合。 1、一个算法,将书组织在一起的方法 2、相似性和不相似性的概念 3、停止的条件 簇的中... 阅读全文
posted @ 2014-08-04 15:54 jseven 阅读(135) 评论(0) 推荐(0) 编辑
摘要: 摘要 : 伟人是让人控制产品,而不是用产品去控制人。伟人是用产品服务用户,用善激励用户,而不是用产品胁迫用户,用恶驱动用户。伟人有实力去实现他的真情怀,而不是被情怀拖累,或者把情怀当成遮羞布。如何才叫“伟人”?伟人是让人控制产品,而不是用产品去控制人。伟人是用产品服务用户,用善激励用户,而不是用产品... 阅读全文
posted @ 2014-08-04 14:36 jseven 阅读(155) 评论(0) 推荐(0) 编辑
摘要: 1、固定大小的用户邻域package mahout;import java.io.File;import java.io.IOException;import org.apache.mahout.cf.taste.common.TasteException;import org.apache.mah... 阅读全文
posted @ 2014-08-04 14:04 jseven 阅读(454) 评论(0) 推荐(0) 编辑
摘要: 数据集下载地址:http://grouplens.org/datasets/movielens/ 之前用的是100K的,现在需要下载MovieLens 10M,使用里面的ratings.dat前提:因为文件不符合mahout要求的文件输入格式,需要进行转换,但是example里提供了一个解析这个文件... 阅读全文
posted @ 2014-08-04 13:17 jseven 阅读(1070) 评论(0) 推荐(0) 编辑
摘要: 基于用户的推荐和基于物品的推荐两种算法,均依赖于两个事物(用户或物品)之间的相似性度量(等同性定义),相似性度量的方法:PearsonCorrealation皮尔逊相关系数,对数似然值Loglikelihood,斯皮尔曼相关系数SpearmanCorrelation,谷本系数TanimotoCoef... 阅读全文
posted @ 2014-08-04 13:03 jseven 阅读(347) 评论(0) 推荐(0) 编辑
摘要: 直接上代码吧:package mahout;import java.io.File;import org.apache.mahout.cf.taste.common.TasteException;import org.apache.mahout.cf.taste.eval.DataModelBuil... 阅读全文
posted @ 2014-08-04 12:48 jseven 阅读(711) 评论(0) 推荐(0) 编辑
摘要: 用户和物品是关联的,但是没有这种关联的强度描述,如用户浏览文章。无偏好值的内存实现: 重要是datamodel和modelbuilder的实现。package mahout;import java.io.File;import org.apache.mahout.cf.taste.common.T... 阅读全文
posted @ 2014-08-04 11:45 jseven 阅读(621) 评论(0) 推荐(0) 编辑
摘要: 1、内存级别的datamodel 就是直接采用程序进行构建的那种。 示例: package mahout;import org.apache.mahout.cf.taste.impl.common.FastByIDMap;import org.apache.mahout.cf.taste.im... 阅读全文
posted @ 2014-08-04 10:53 jseven 阅读(1611) 评论(0) 推荐(0) 编辑
摘要: Preference对象:单个用户Id,物品ID和偏好值,实现GenericPreferencePreferenceArray数组,单个用户所有偏好值数组,实现GenericPreferenceArray代码示例:package mahout;import org.apache.mahout.cf.... 阅读全文
posted @ 2014-08-04 10:23 jseven 阅读(454) 评论(0) 推荐(0) 编辑
摘要: 使用GroupLens数据集ua.base这是一个tab分割的文件,用户Id,物品Id,评分(偏好值),以及附加信息。可用吗?之前使用的是CSV格式,现在是tsv格式,可用,使用FileDataModel对mahout推荐2中的评估程序使用这个数据集测试:package mahout;import ... 阅读全文
posted @ 2014-08-04 10:01 jseven 阅读(802) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 16 下一页