飞鸟各投林

导航

上一页 1 ··· 6 7 8 9 10 11 12 13 14 15 下一页

2016年4月19日 #

用Maven构建Mahout项目实现协同过滤ItemCF--集群版

摘要: 本文来自于:http://blog.fens.me/hadoop-mahout-mapreduce-itemcf/ 前言 Mahout是Hadoop家族一员,从血缘就继承了Hadoop程序的特点,支持HDFS访问和MapReduce分步式算法。随着Mahout 的发展,从0.7版本开始,Mahout 阅读全文

posted @ 2016-04-19 18:32 飞鸟各投林 阅读(1066) 评论(0) 推荐(0) 编辑

用Maven构建Mahout项目实现协同过滤userCF--单机版

摘要: 本文来自:http://blog.fens.me/hadoop-mahout-maven-eclipse/ 前言 基于Hadoop的项目,不管是MapReduce开发,还是Mahout的开发都是在一个复杂的编程环境中开发。Java的环境问题,是困扰着每个程序员的噩梦。Java程序员,不仅要会写Jav 阅读全文

posted @ 2016-04-19 18:20 飞鸟各投林 阅读(1700) 评论(0) 推荐(1) 编辑

从源代码剖析Mahout推荐引擎

摘要: 本文来自于:http://blog.fens.me/mahout-recommend-engine/ 前言 Mahout框架中cf.taste包实现了推荐算法引擎,它提供了一套完整的推荐算法工具集,同时规范了数据结构,并标准化了程序开发过程。应用推荐算法时,代码也就7-8行,简单地有点像R了。为了使 阅读全文

posted @ 2016-04-19 17:19 飞鸟各投林 阅读(773) 评论(0) 推荐(0) 编辑

推荐系统第2周--itemCF和userCF

摘要: 推荐系统分类 基于应用领域分类:电子商务推荐,社交好友推荐,搜索引擎推荐,信息内容推荐基于设计思想:基于协同过滤的推荐,基于内容的推荐,基于知识的推荐,混合推荐基于使用何种数据:基于用户行为数据的推荐,基于用户标签的推荐,基于社交网络数据,基于上下文信息(时间上下文,地点上下文等等) 协同过滤的基本 阅读全文

posted @ 2016-04-19 12:10 飞鸟各投林 阅读(1282) 评论(0) 推荐(0) 编辑

Mahout介绍-炼数

摘要: Mahout的中文含义:象夫 Mahout起源 2008年成为Lucene的子顷目,Lucene作为搜索引擎顷目, 存在很多文本数据分析和挖掘的需求(例如文本重复判断,文本自动分类等等), 导致Lucene顷目中部分开发者转向机器学习领域研究算法,最终这些机器学习算法形成最初的Mahout吸收开源协 阅读全文

posted @ 2016-04-19 10:17 飞鸟各投林 阅读(222) 评论(0) 推荐(0) 编辑

推荐系统第1周--- 推荐系统概述

摘要: 推荐系统的核心思想是集体智慧 集体智慧在Web 2.0时代被发挥到了极致集体智慧的典型场景一:维基百科集体智慧的典型场景二:Google Page Rank集体智慧的典型场景三:亚马逊的推荐系统 电子商务是推荐系统的先行者 电子商务网站是个性化推荐系统重要地应用的领域一,亚马逊就是个性化推荐系统的积 阅读全文

posted @ 2016-04-19 10:11 飞鸟各投林 阅读(314) 评论(0) 推荐(0) 编辑

2016年4月15日 #

腾讯事业群介绍

摘要: 社交网络事业群(SNG) QQ:QQ 是腾讯公司推出的一款基于互联网的即时通信平台,其主要用户平台为电脑端及手机端,支持在线聊天、语音通话、视频、在线(离线)传送文件等全方位通信社交 功能。QQ用户可在电脑、手机以及无线终端之间随意、无缝切换。2015年报显示,QQ月活跃账户数达8.53亿户,同比增 阅读全文

posted @ 2016-04-15 15:01 飞鸟各投林 阅读(3910) 评论(0) 推荐(0) 编辑

百度业务重构,李彦宏是想学谷歌吗?

摘要: 4月13日下午,百度董事长兼CEO李彦宏通过内部邮件宣布,百度业务架构重组。自即日起,百度将成立“百度搜索公司”,并表示个人将把更多精力集中在互联网金融、无人车、人工智能等创新业务上。 新成立的百度搜索公司将整合搜索业务群组(SSG)和移动服务事业群组(MSG),下辖搜索业务群组、移动服务事业群组、 阅读全文

posted @ 2016-04-15 12:30 飞鸟各投林 阅读(197) 评论(0) 推荐(0) 编辑

2016.4.15 -关于分离和总结

摘要: 2016.4.15 科比退役了,祝老大走好,作为铁杆科密的我没有选择在社交媒体上去煽情和感伤,我只知道,我喜欢科比,是因为他的精神,现在的我需要传承老大的“凌晨四点的洛杉矶”,在内心和行动上默默坚持,默默努力,前行。用自己的实际行动证明一切,而不是说说。 研究生阶段唯一的好友,张同学今天突然告诉我他 阅读全文

posted @ 2016-04-15 12:13 飞鸟各投林 阅读(183) 评论(0) 推荐(0) 编辑

2016年4月13日 #

Spark生态系统剖析--王家林老师

摘要: 阅读全文

posted @ 2016-04-13 19:16 飞鸟各投林 阅读(184) 评论(0) 推荐(0) 编辑

Tachyon架构剖析--王家林老师

摘要: BDAS 阅读全文

posted @ 2016-04-13 19:01 飞鸟各投林 阅读(257) 评论(0) 推荐(0) 编辑

Spark on Yarn-王家林老师

摘要: 阅读全文

posted @ 2016-04-13 18:38 飞鸟各投林 阅读(147) 评论(0) 推荐(0) 编辑

Spark SQL原理和实现--王家林老师

摘要: 阅读全文

posted @ 2016-04-13 18:19 飞鸟各投林 阅读(190) 评论(0) 推荐(0) 编辑

2016年4月12日 #

关于”快照“创业的计划

摘要: 今天从东九回来的路上,突然想到一个新的创业计划,就是“快照”计划 因为最近在搞spark,storm,老是搭建集群,虚拟机的配置真是一个大问题, 虚拟机的快照还原功能,是一个big ideal ,我尽然忘记了 由此我想到一个主意,关于照片的快照复原功能,再联想之前的关于图片社交的APP,乐图和创业公 阅读全文

posted @ 2016-04-12 18:15 飞鸟各投林 阅读(184) 评论(0) 推荐(0) 编辑

清华教授谈人工智能:BAT还算不上伟大公司

摘要: 清华大学教授邓志东最近明显“忙了起来”。他向新浪科技展示了最近的时间表:第二天有一场报告,报告结束后赶飞机去芜湖,周末深夜再回北京…… “人工智能终于到了风口”,一见面,邓志东就这样说。 从1992年来到清华开始博士后研究,再到2016年春天,邓志东见证了人工智能基础研究从高峰到低谷再到复兴的全过程 阅读全文

posted @ 2016-04-12 13:57 飞鸟各投林 阅读(311) 评论(0) 推荐(0) 编辑

2016年4月11日 #

2016.4.11-关于失败的一点思考

摘要: 睡觉之前突然想到马云说过的一句话:我们要习惯于拒绝,习惯失败,如果我们还没成功,那是因为我们的失败还不够 2016.4,11 以此自勉 阅读全文

posted @ 2016-04-11 23:46 飞鸟各投林 阅读(138) 评论(0) 推荐(0) 编辑

Hadoop的IO操作

摘要: Hadoop的API官网:http://hadoop.apache.org/common/docs/current/api/index.html 相关的包 org.apache.hadoop.io org.apache.hadoop.io.compress org.apache.hadoop.io. 阅读全文

posted @ 2016-04-11 23:31 飞鸟各投林 阅读(522) 评论(0) 推荐(0) 编辑

Hadoop MapReduce InputFormat基础

摘要: 有时候你可能想要用不同的方法从input data中读取数据。那么你就需要创建一个自己的InputFormat类。 InputFormat是一个只有两个函数的接口。 1 public interface InputFormat<K, V> { 2 InputSplit[] getSplits(Job 阅读全文

posted @ 2016-04-11 23:27 飞鸟各投林 阅读(288) 评论(0) 推荐(0) 编辑

数据分析师常见的10道面试题解答

摘要: 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用h 阅读全文

posted @ 2016-04-11 23:21 飞鸟各投林 阅读(3766) 评论(0) 推荐(0) 编辑

推荐系统中常用算法 以及优点缺点对比

摘要: 推荐系统中常用算法 以及优点缺点对比 在 推荐系统简介中,我们给出了推荐系统的一般框架。很明显,推荐方法是整个推荐系统中最核心、最关键的部分,很大程度上决定了推荐系统性能的优劣。目前,主要的推荐方法包括:基于内容推荐、协同过滤推荐、基于关联规则推荐、基于效用推荐、基于知识推荐和组合推荐。 一、基于内 阅读全文

posted @ 2016-04-11 23:19 飞鸟各投林 阅读(688) 评论(0) 推荐(0) 编辑

上一页 1 ··· 6 7 8 9 10 11 12 13 14 15 下一页