上一页 1 2 3 4 5 6 ··· 11 下一页

2014年7月15日

摘要: 简介什么是 Google Protocol Buffer? 假如您在网上搜索,应该会得到类似这样的文字介绍:Google Protocol Buffer( 简称 Protobuf) 是 Google 公司内部的混合语言数据标准,目前已经正在使用的有超过 48,162 种报文格式定义和超过 12,18... 阅读全文
posted @ 2014-07-15 14:45 虚若怀谷 阅读(179) 评论(0) 推荐(0) 编辑

2014年7月2日

摘要: 相似度计算是数据挖掘,推荐引擎中的最基本问题,例如在推荐系统(Recommender Systems,简称RSs)中计算带推荐物品(Item)相似度,或是用户(User)之间的相似度以期获得兴趣口味(Taste)相似的用户时,均需要使用到相似度计算技术。经常使用的相似度计算方式较多,且各有特点, 以... 阅读全文
posted @ 2014-07-02 14:19 虚若怀谷 阅读(1430) 评论(0) 推荐(0) 编辑

2014年6月29日

摘要: 欢迎转载,转载请注明出处,徽沪一郎。概要之所以对spark shell的内部实现产生兴趣全部缘于好奇代码的编译加载过程,scala是需要编译才能执行的语言,但提供的scala repl可以实现代码的实时交互式执行,这是为什么呢?既然scala已经提供了repl,为什么spark还要自己单独搞一套sp... 阅读全文
posted @ 2014-06-29 17:33 虚若怀谷 阅读(302) 评论(0) 推荐(0) 编辑
摘要: 欢迎转载,转载请注明出处,徽沪一郎。概要本文就standalone部署方式下的容错性问题做比较细致的分析,主要回答standalone部署方式下的包含哪些主要节点,当某一类节点出现问题时,系统是如何处理的。Standalone部署的节点组成介绍Spark的资料中对于RDD这个概念涉及的比较多,但对于... 阅读全文
posted @ 2014-06-29 17:30 虚若怀谷 阅读(164) 评论(0) 推荐(0) 编辑
摘要: 欢迎转载,转载请注明出处,徽沪一郎。概要图的并行化处理一直是一个非常热门的话题,这里头的重点有两个,一是如何将图的算法并行化,二是找到一个合适的并行化处理框架。Spark作为一个非常优秀的并行处理框架,将一些并行化的算法移到其上面就成了一个很自然的事情。Graphx是一些图的常用算法在Spark上的... 阅读全文
posted @ 2014-06-29 17:27 虚若怀谷 阅读(352) 评论(0) 推荐(0) 编辑
摘要: 欢迎转载,转载请注明出处,徽沪一郎概要在新近发布的spark 1.0中新加了sql的模块,更为引人注意的是对hive中的hiveql也提供了良好的支持,作为一个源码分析控,了解一下spark是如何完成对hql的支持是一件非常有趣的事情。Hive简介Hive的由来以下部分摘自Hadoop defini... 阅读全文
posted @ 2014-06-29 17:25 虚若怀谷 阅读(366) 评论(0) 推荐(0) 编辑
摘要: 欢迎转载,转载请注明出处,徽沪一郎。楔子Hive是基于Hadoop的开源数据仓库工具,提供了类似于SQL的HiveQL语言,使得上层的数据分析人员不用知道太多MapReduce的知识就能对存储于Hdfs中的海量数据进行分析。由于这一特性而收到广泛的欢迎。Hive的整体框架中有一个重要的模块是执行模块... 阅读全文
posted @ 2014-06-29 17:24 虚若怀谷 阅读(252) 评论(0) 推荐(0) 编辑
摘要: 欢迎转载,转载请注明出处,徽沪一郎。概要在即将发布的spark 1.0中有一个新增的功能,即对sql的支持,也就是说可以用sql来对数据进行查询,这对于DBA来说无疑是一大福音,因为以前的知识继续生效,而无须去学什么scala或其它script.一般来说任意一个sql子系统都需要有parser,op... 阅读全文
posted @ 2014-06-29 17:23 虚若怀谷 阅读(331) 评论(0) 推荐(0) 编辑
摘要: y欢迎转载,转载请注明出处,徽沪一郎。概要“spark已经比较头痛了,还要将其运行在yarn上,yarn是什么,我一点概念都没有哎,再怎么办啊。不要跟我讲什么原理了,能不能直接告诉我怎么将spark在yarn上面跑起来,I'm a dummy, just told me how to do it.”... 阅读全文
posted @ 2014-06-29 17:22 虚若怀谷 阅读(276) 评论(0) 推荐(0) 编辑
摘要: 欢迎转载,转载请注明出处,徽沪一郎。概要本来源码编译没有什么可说的,对于java项目来说,只要会点maven或ant的简单命令,依葫芦画瓢,一下子就ok了。但到了Spark上面,事情似乎不这么简单,按照spark officical document上的来做,总会出现这样或那样的编译错误,让人懊恼不... 阅读全文
posted @ 2014-06-29 17:21 虚若怀谷 阅读(180) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 11 下一页

导航