上一页 1 2 3 4 5 6 7 8 ··· 16 下一页
摘要: 通过估计偏好值来生成推荐结果并非绝对必要。给出一个从优到劣的推荐列表对于许多场景都够用了,而不必包含估计的偏好值。查准率:在top结果中相关结果的比例查全率:所有相关结果,包含在top结果中的比例对上个例子进行测试:package mahout;import java.io.File;import ... 阅读全文
posted @ 2014-08-04 09:49 jseven 阅读(1012) 评论(0) 推荐(0) 编辑
摘要: 设计好了一个推荐程序,如何来完成评估呢?一般是使用一个真实数据的样例作为测试数据来仿真,来看估计值和实际值的差别,0.0意味着完美的估计,就是没有差别。一是使用平均差值(直观,易于理解),一是使用均方根。针对mahout推荐1的推荐程序进行评估:package mahout;import java.... 阅读全文
posted @ 2014-08-04 09:24 jseven 阅读(550) 评论(0) 推荐(0) 编辑
摘要: 1、准备数据:intro.csv:1,101,5.01,102,3.01,103,2.52,101,2.02,102,2.52,103,5.02,104,2.03,101,2.53,104,4.03,105,4.53,107,5.04,101,5.04,103,3.04,104,4.54,106,4... 阅读全文
posted @ 2014-08-04 08:55 jseven 阅读(266) 评论(0) 推荐(0) 编辑
摘要: 摘要 : 人类不知道的远远比知道的更有意义。历史永远不是线性发展,每一次跳跃前行中都有「黑天鹅」的身影。这就是「黑天鹅事件」要告诉我们的真相。上一篇文章里引用了「黑天鹅事件」这么个高贵冷艳的词汇,惹得众多读者发来讯息,让我讲讲黑天鹅的事。今天给大家简单说一点我对黑天鹅事件和大数据的认识。如果你像很多... 阅读全文
posted @ 2014-08-01 12:53 jseven 阅读(464) 评论(0) 推荐(0) 编辑
摘要: 摘要 : 百度将用互联网的方式来做开放的大数据引擎。它不可能采取与软件方案公司一样的“一竿子买卖”方式进行合作。而是将大数据引擎做成一个开放平台,形成标准的接口,让每个行业不同企业可以根据自身需求各取所需。而它的首要目的是获取数据,然后是考虑变现。百度在大数据领域迈出一大步。在昨天的百度技术开放日上... 阅读全文
posted @ 2014-07-29 11:45 jseven 阅读(355) 评论(0) 推荐(0) 编辑
摘要: 摘要 : 随着信息革命的深入,大数据时代的预测更加容易,人类的生活正在被大数据预测深刻改变。附言:广告行业应归于人体行为。世 界杯期间各家科技巨头利用大数据预测比赛结果,再现“章鱼保罗”雄风。世界杯结束了但大数据预测还会继续。从夜观天象到气象预报,从童话里的水晶球到今日 的科技预言家,从地震云的传说... 阅读全文
posted @ 2014-07-29 11:36 jseven 阅读(483) 评论(0) 推荐(0) 编辑
摘要: 有个寺庙,因藏有一串佛祖戴过的念珠而闻名。念珠的供奉之地只有庙里的老住持和7个弟子知道。7个弟子都很有悟性,老住持觉得将来把衣钵传给他们中的任何一个,都可以光大佛法。不想那串念珠突然不见了。老住持问7个弟子:“你们谁拿了念珠,只要放回原处,我不追究,佛祖也不会怪罪。”弟子们都摇头。7天过去了,念珠依... 阅读全文
posted @ 2014-07-29 11:10 jseven 阅读(187) 评论(0) 推荐(0) 编辑
摘要: 摘要 : 为什么Zara毛利率比LV高?当百度“大数据引擎”等互联网巨头向社会开放大数据基础设施,敢用、会用,就能创造更多商业奇迹和民生福利。大数据,是不是“大忽悠”?当Zara这家零售企业将大数据运用于创新经营时,它创造了比奢侈品巨头LV税前毛利率更高的奇迹!要知道,Zara平均服饰价格只有LV的... 阅读全文
posted @ 2014-07-29 11:09 jseven 阅读(914) 评论(0) 推荐(0) 编辑
摘要: 1、下载 http://www.apache.org/dist/flume/stable/下载最新的tar.gz包即可2、解压tar -zxvf ....3、配置环境变量FLUME_HOME和PATH记得执行source /etc/profile4、添加一个简单的测试案例a、在conf目录下新建一个... 阅读全文
posted @ 2014-07-28 11:50 jseven 阅读(327) 评论(0) 推荐(0) 编辑
摘要: 1、mysql-- 创建数据库create database logs;-- 使用use logs;-- 创建表create table weblogs(md5varchar(32),urlvarchar(64),request_datedate,request_timetime,ipvarchar... 阅读全文
posted @ 2014-07-28 11:47 jseven 阅读(750) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 16 下一页