代码改变世界

研发十大站点

2013-12-24 10:26 by Polarisary, 309 阅读, 0 推荐, 收藏, 编辑
摘要:1、StackoverflowStackoverflow.com可能是编程界中最流行的网站了,该网站有成千上万个好问题和答案。学习API或者编程语言,通常依赖于代码示例,stackoverflow就可以提供大量的代码片段。Stackoverflow的另一个优点在于它的社交性。你可以在一些特定的标签下查看问题,比如“Java”、“regex”,你就会看到哪些是高频问题。这对于学习,以及Java博主书写热门话题都是一种非常好的资源。网站地址:http://stackoverflow.com/2、DZone这是一个非常有趣的网站,有相当多的开发者在这个网站上分享他们博客文章。就像一场冒险一样,在这里 阅读全文

markdown

2013-11-22 10:05 by Polarisary, 155 阅读, 0 推荐, 收藏, 编辑
摘要:###这里写markdown文档```public class Test{ public static void main(String args[]){ System.out.print("test"); }}``` 阅读全文

线程安全且高效的单例

2013-10-29 16:15 by Polarisary, 225 阅读, 0 推荐, 收藏, 编辑
摘要:public class Singleton{ private static Singleton instance;//静态的实例 private Singleton(){}//私有的构造函数 public static Singleton getInstance(){ if(instance == null){ synchronized(Singleton.class){//锁住整个对象 if(instance==null){//再次判断是否为空,防止没锁对象时判断完后其他线程实例化 instance = new Singleton();... 阅读全文

hadoop作业调优参数整理及原理【转】

2013-09-25 14:23 by Polarisary, 313 阅读, 0 推荐, 收藏, 编辑
摘要:1 Map side tuning参数1.1 MapTask运行内部原理当map task开始运算,并产生中间数据时,其产生的中间结果并非直接就简单的写入磁盘。这中间的过程比较复杂,并且利用到了内存buffer来进行已经产生的部分结果的缓存,并在内存buffer中进行一些预排序来优化整个map的性能。如上图所示,每一个map都会对应存在一个内存buffer(MapOutputBuffer,即上图的buffer in memory),map会将已经产生的部分结果先写入到该buffer中,这个buffer默认是100MB大小,但是这个大小是可以根据job提交时的参数设定来调整的,该参数即为:io. 阅读全文

Logistic回归

2013-09-15 20:45 by Polarisary, 438 阅读, 0 推荐, 收藏, 编辑
摘要:一.环境配置需要安装python的数据计算的库numpy和Matplotlib画出图形sudo apt-get install python-numpysudo apt-get install python-matplotlib为了方便还安装了ipythonsudo apt-get install ipython二.编辑test.py 1 from numpy import * 2 3 def loadDataSet(): 4 dataMat = []; labelMat = [] 5 fr = open('testSet.txt') 6 for line in fr... 阅读全文

一篇励志文章【转】

2013-08-21 22:25 by Polarisary, 415 阅读, 0 推荐, 收藏, 编辑
摘要:网上看到的一篇关于哈佛的非常励志的文章,看完后感觉自己的努力跟人家比真的是差的太多了,以后要更加努力才行了。分享给有同样感触的人共勉照片显示:凌晨4点的哈佛大学图书馆里,灯火通明,座无虚席……图片配文这样写道:哈佛是一种象征。人到底有怎样的发挥潜力?人的意志,人的才情, 人的理 想,为什么在哈佛能兑现?哈佛的学生餐厅,很难听到说话的声音,每个学生端着比萨可乐坐下后,往往边吃边看书或是边做笔记。我就没见过哪个学生光吃不读 的,更没见过哪个学生边吃边闲聊的。感觉哈佛,餐厅不过是一个可以吃东西的图书馆,是哈佛正宗100个图书馆之外的另类图书馆。哈佛的医院,同样的宁静, 同样的不管有多少在候诊的人也无 阅读全文

mahout协同过滤算法

2013-08-14 23:27 by Polarisary, 1171 阅读, 0 推荐, 收藏, 编辑
摘要:一直使用mahout的RowSimilarity来计算物品间的相似度,今晚仔细看了其实现,终于搞明白了他的计算逻辑。上篇中介绍了整个itemBaseCF的mapreducer过程,主要有三个大的步骤吧,我把他称为prepare阶段,计算相似阶段和利用相似性计算推荐阶段。prepare阶段主要完成的是矩阵转换变换以及统计一些相似及推荐时用到的一些属性。第二阶段是计算相似性:有几个数据较为重要,如下所示。norms.bin:是用来存放所有用户对一个商品的平方和,数据存储为itemA:doublenumNonZeroEntries.bin:存放itemID对应的不为零的用户评分个数maxValues 阅读全文

Apache Mahout基于商品的协同过滤算法流程分析

2013-05-31 14:22 by Polarisary, 1139 阅读, 0 推荐, 收藏, 编辑
摘要:最近使用mahout的itemBase协同过滤算法,研究了下他的源码,记录如下,以备后忘……其算法实现大致分四个主要的部分:1.将输入数据转化成矩阵2.计算相似性3.还是转化数据格式,为计算预测、推荐做准备4.预测评分并做推荐下面分别详细介绍:PreparePreferenceMatrixJob1.1itemIDIndexinput:启动计算时指定的--input路径output:***/preparePreferenceMatrix/itemIDIndexmapper:ItemIdIndexMapper,将输入中的userID,itemID,pref分隔后,将Long型itemID转化成in 阅读全文

HBase ZooKeeper安装

2013-05-13 21:31 by Polarisary, 772 阅读, 0 推荐, 收藏, 编辑
摘要:中文文档:http://abloz.com/hbase/book.html1.下载hbase安装包http://www.apache.org/dyn/closer.cgi/hbase/2.将安装包放在/home/hbase目录解压3.修改其conf目录下的hbase-site.xml<?xmlversion="1.0"?><?xml-stylesheettype="text/xsl"href="configuration.xsl"?><configuration><property>&l 阅读全文

Java引用与地址盲点

2013-04-17 23:46 by Polarisary, 347 阅读, 0 推荐, 收藏, 编辑
摘要:一直以为Java中引用和地址是一个概念,容易混淆,下面的小程序让我加深了对引用的理解。public class Test{ public static void main(String[] args){ Test t = new Test(); t.amethod(); } public void amethod(){ int i=99; ValHold v = new ValHold(); v.i=30; another(v,i); System.out.println(v.... 阅读全文