摘要:
SVM推导里看过的不错的两个帖子,还有就是《机器学习实战》中的SVM那一章的SMO的简单实现的python代码,学习SVM的可以看一看,比《统计学习》书里的部分,细节要详细些。也可以看看周志华老师的《机器学习》,svm那一章从margin到对偶求解,kkt条件,以及SMO,核函数,... 阅读全文
2016年4月19日
摘要:
转载自:http://blog.sina.com.cn/s/blog_6622f5c30101datu.html 特征提取步骤: 1. 卡方检验1.1 统计样本集中文档总数(N)。 1.2 统计每个词的正文档出现频率(A)、负文档出现频率(B)、正文档不出现频率)、负文档不出现... 阅读全文
2016年3月29日
摘要:
时隔好久,前几章博客是去年看的时候写的,后来只看书没有继续写,再后来忙着项目,连书都很少看了。然后是忙完项目后的空白期的疯狂看书,看了很多数据结构算法,设计模式,代码整洁,项目可重构方面的书。年后重新把《机器学习实战》后面的章节读完,现在开始整理笔记。 支持向量机,个人理解就是有一... 阅读全文
2016年3月25日
摘要:
本文非原创,转载自http://meroa.com/baidu-staff-summary/ 来北京一年半,在这家公司也工作一年半了,一些原因导致后半年状态从浮躁,到顺其自然,再到年后的重燃激情,不断充电。偶然微博看到有人分享的这篇文章,非常贴合现在的心境,对我来说受益匪浅,所以推... 阅读全文
摘要:
《代码整洁之道》读到11章开始步入我不熟悉的架构等部分,因为还没有过实际应用,暂时停止。开始学习另一本《Effective Java》。 1. 首先是构造器,当对象是固定的,不要频繁创建,比如redis配置,log4j的配置或者项目中的constant类内对象的配置,调用对应的静态... 阅读全文
2015年11月20日
摘要:
19.系统应该由许多短小的类组成,每个小类封装一个权责,只有一个修改原因。(SRP原则) 20.待续,看到十一章“系统”感觉后面开始吃力,自己还没用过,何谈整洁之道,暂时停止,以后跟进。 阅读全文
2015年11月19日
摘要:
项目收尾阶段,自由时间相对充裕些,所以买了《代码整洁之道》等五本编程规范的书籍,边学习,边整理以前做过的代码,希望以后能不用反复整理,就能写出出色的项目代码。 以下是学习到的一些规范整理: 1.变量,函数等的命名要可读(英文拼写,驼峰式);一定不要用简单的字母,或者a1,a2这种,... 阅读全文
2015年9月12日
摘要:
最近学习《Mahout实战》,但是书中的代码是实用mahout0.5版本,很多地方在mahout0.9版本中已经改头换面了,经调试,阅读mahout0.9api, 运行结果如图: 修改代码如下: package cn.kelaile.hadooptest; import org.ap... 阅读全文
2015年9月8日
摘要:
个人觉得 第二种方法更好。 基于Maven构建的项目的方法: 一: 将项目所支持的所有类库打在一个包中,而不是只将项目编译打包到一个jar中。这样便可以直接拷贝一个jar去执行了。 Xml代码 maven-assembly-plu... 阅读全文
2015年9月6日
摘要:
需要注意的是,mac版的单机版,每次启动前,记得要把"hdfs"文件夹删掉,每次会自动重建新的"hdfs"(包含"name"和"data"),如果不删就会和新文件冲突。 $HADOOP_HOME/bin/hadoop namenode -format $HADOOP_HOME/sbin/sta... 阅读全文