会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
fesh1124
在你想要放弃的那一刻,想想为什么当初坚持走到了这里...
导航
博客园
首页
新随笔
联系
订阅
管理
公告
上一页
1
2
3
4
5
下一页
2014年7月25日
Apache Spark-1.0.1集群搭建
摘要: Spark是一个高效的分布式计算系统,相比Hadoop,它在性能上比Hadoop要高100倍。Spark是发源于美国加州大学伯克利分校AMPLab的集群计算平台,它克服了MapReduce在迭代式计算和交互式计算方面的不足,通过引入RDD(Resilient Distributed Datasets)数据表示模型,能够很好地解决MapReduce不易解决的问题。相比于MapReduce,Spark能够充分利用内存资源提高计算效率。
阅读全文
posted @ 2014-07-25 00:43 feshy
阅读(980)
评论(0)
推荐(1)
编辑
2014年7月24日
导航目录
摘要: 一、基础学习Java正则表达式 Maven-3.2.2安装配置|转载:PuTTY的自动登录设置Ubuntu中vi常用命令|Ubuntu-12.04-server 配置修改静态 IP地址|二、大数据(Hadoop,Spark...)1)编译安装Ubuntu12.04-x64编译Hadoop2.2.0和...
阅读全文
posted @ 2014-07-24 11:09 feshy
阅读(360)
评论(0)
推荐(0)
编辑
Maven-3.2.2安装配置
摘要: (1)安装JDK,这里是1.7.0_51(2)Maven-3.2.2下载地址:http://mirrors.cnnic.cn/apache/maven/maven-3/3.2.2/binaries/apache-maven-3.2.2-bin.tar.gz(3)解压tar -zxvf apache-...
阅读全文
posted @ 2014-07-24 10:14 feshy
阅读(2508)
评论(0)
推荐(0)
编辑
Spark-1.0.1 的make-distribution.sh编译、SBT编译、Maven编译 三种编译方法
摘要: Spark编译
阅读全文
posted @ 2014-07-24 01:11 feshy
阅读(3461)
评论(0)
推荐(0)
编辑
2014年7月23日
Mahout源码分析之 -- QR矩阵分解
摘要: 一、算法原理请参考我在大学时写的《QR方法求矩阵全部特征值》,其包含原理、实例及C语言实现:http://www.docin.com/p-114587383.html二、源码分析这里有一篇文章《使用MapRedece进行QR分解的步骤》可以看看/** For an m x n matrix A wi...
阅读全文
posted @ 2014-07-23 12:20 feshy
阅读(369)
评论(0)
推荐(0)
编辑
2014年7月14日
Java正则表达式
摘要: 1、匹配括号及括号内的内容,如“(**)”Pattern Pattern1 = Pattern.compile("\\(.+\\)") 2、匹配 汉字+数字,如“电视01”Pattern Pattern1 = Pattern.compile("[\u4e00-\u9fa5]+[0-9]+$");正...
阅读全文
posted @ 2014-07-14 14:37 feshy
阅读(191)
评论(0)
推荐(0)
编辑
2014年7月8日
IntelliJ IDEA13.1.3+Scala2.11.1环境搭建
摘要: Intellij IDEA的使用性非常好,是一个非常优秀的IDE,也是很好的scala开发工具。这里对构建Intellij IDEA的Scala开发环境进行介绍,包含在Windows环境和Ubuntu环境下的安装配置。
阅读全文
posted @ 2014-07-08 10:31 feshy
阅读(3685)
评论(0)
推荐(0)
编辑
2014年6月23日
分布式HBase-0.98.4环境搭建
摘要: fesh个人实践,欢迎经验交流!Blog地址:http://www.cnblogs.com/fesh/p/3804072.html 本文有点简单,详细版本请参见《分布式Hbase-0.98.4在Hadoop-2.2.0集群上的部署》 Hbase是一个分布式,版本化(versioned),构建...
阅读全文
posted @ 2014-06-23 16:29 feshy
阅读(868)
评论(0)
推荐(0)
编辑
2014年6月18日
WEB学习资料网址
该文被密码保护。
阅读全文
posted @ 2014-06-18 12:24 feshy
阅读(84)
评论(0)
推荐(0)
编辑
2014年6月8日
Mahout源码分析之 -- 文档向量化TF-IDF
摘要: fesh个人实践,欢迎经验交流!Blog地址:http://www.cnblogs.com/fesh/p/3775429.html Mahout之SparseVectorsFromSequenceFiles源码分析一、原理TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一...
阅读全文
posted @ 2014-06-08 00:34 feshy
阅读(2049)
评论(0)
推荐(0)
编辑
上一页
1
2
3
4
5
下一页