fesh1124
在你想要放弃的那一刻,想想为什么当初坚持走到了这里...

导航

 

2014年7月25日

摘要: Spark是一个高效的分布式计算系统,相比Hadoop,它在性能上比Hadoop要高100倍。Spark是发源于美国加州大学伯克利分校AMPLab的集群计算平台,它克服了MapReduce在迭代式计算和交互式计算方面的不足,通过引入RDD(Resilient Distributed Datasets)数据表示模型,能够很好地解决MapReduce不易解决的问题。相比于MapReduce,Spark能够充分利用内存资源提高计算效率。 阅读全文
posted @ 2014-07-25 00:43 feshy 阅读(977) 评论(0) 推荐(1) 编辑
 

2014年7月24日

摘要: 一、基础学习Java正则表达式 Maven-3.2.2安装配置|转载:PuTTY的自动登录设置Ubuntu中vi常用命令|Ubuntu-12.04-server 配置修改静态 IP地址|二、大数据(Hadoop,Spark...)1)编译安装Ubuntu12.04-x64编译Hadoop2.2.0和... 阅读全文
posted @ 2014-07-24 11:09 feshy 阅读(358) 评论(0) 推荐(0) 编辑
 
摘要: (1)安装JDK,这里是1.7.0_51(2)Maven-3.2.2下载地址:http://mirrors.cnnic.cn/apache/maven/maven-3/3.2.2/binaries/apache-maven-3.2.2-bin.tar.gz(3)解压tar -zxvf apache-... 阅读全文
posted @ 2014-07-24 10:14 feshy 阅读(2483) 评论(0) 推荐(0) 编辑
 
摘要: Spark编译 阅读全文
posted @ 2014-07-24 01:11 feshy 阅读(3460) 评论(0) 推荐(0) 编辑
 

2014年7月23日

摘要: 一、算法原理请参考我在大学时写的《QR方法求矩阵全部特征值》,其包含原理、实例及C语言实现:http://www.docin.com/p-114587383.html二、源码分析这里有一篇文章《使用MapRedece进行QR分解的步骤》可以看看/** For an m x n matrix A wi... 阅读全文
posted @ 2014-07-23 12:20 feshy 阅读(369) 评论(0) 推荐(0) 编辑
 

2014年7月14日

摘要: 1、匹配括号及括号内的内容,如“(**)”Pattern Pattern1 = Pattern.compile("\\(.+\\)") 2、匹配 汉字+数字,如“电视01”Pattern Pattern1 = Pattern.compile("[\u4e00-\u9fa5]+[0-9]+$");正... 阅读全文
posted @ 2014-07-14 14:37 feshy 阅读(188) 评论(0) 推荐(0) 编辑
 

2014年7月8日

摘要: Intellij IDEA的使用性非常好,是一个非常优秀的IDE,也是很好的scala开发工具。这里对构建Intellij IDEA的Scala开发环境进行介绍,包含在Windows环境和Ubuntu环境下的安装配置。 阅读全文
posted @ 2014-07-08 10:31 feshy 阅读(3621) 评论(0) 推荐(0) 编辑
 

2014年6月23日

摘要: fesh个人实践,欢迎经验交流!Blog地址:http://www.cnblogs.com/fesh/p/3804072.html 本文有点简单,详细版本请参见《分布式Hbase-0.98.4在Hadoop-2.2.0集群上的部署》 Hbase是一个分布式,版本化(versioned),构建... 阅读全文
posted @ 2014-06-23 16:29 feshy 阅读(865) 评论(0) 推荐(0) 编辑
 

2014年6月18日

该文被密码保护。 阅读全文
posted @ 2014-06-18 12:24 feshy 阅读(84) 评论(0) 推荐(0) 编辑
 

2014年6月8日

摘要: fesh个人实践,欢迎经验交流!Blog地址:http://www.cnblogs.com/fesh/p/3775429.html Mahout之SparseVectorsFromSequenceFiles源码分析一、原理TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一... 阅读全文
posted @ 2014-06-08 00:34 feshy 阅读(2044) 评论(0) 推荐(0) 编辑