摘要: Spring是什么呢?首先它是一个开源的项目,而且目前非常活跃;它是一个基于IOC和AOP的构架多层j2ee系统的框架。两个概念:IOC/DI 和AOPIOC:Inversion of Control,控制反转,不创建对象,但是描述创建它们的方式。在代码中不直接与对象和服务连接,但在配置文件中描述哪一个组件需要哪一项服务。容器负责将这些联系在一起。举个例子,你写了一个类A,要在类B中引用类A的对象,通常的做法是在类B中通过代码直接实例化;而IOC则可以由Spring框架来实例化类A的对象,实例化的过程由框架本身控制。DI:Dependency Injiection,依赖注入,IOC的机制导致很 阅读全文
posted @ 2013-06-06 12:05 Harrison_ 阅读(3154) 评论(0) 推荐(0) 编辑
摘要: Precision: 精确率、查准率 --- 检索到的相关文档 比 所有被检索到的文档 A / (A + B)Recall: 召回率、查全率 --- 检索到的相关文档 比 库中所有的相关文档 A / (A + C) 相关 不相关检索到 A B未检索到 C D对于一个检索系统来讲,召回率和精确率不可能两全其美:召回率高时,精确率低;精确率高时,召回率低。“召回率”和“精确率”虽然没有必然的联系,然而在大规模数据集合中,这两个指标却是相互制约的。 阅读全文
posted @ 2013-02-22 19:44 Harrison_ 阅读(1394) 评论(0) 推荐(0) 编辑
摘要: 随机森林在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。学习算法:1. 用N来表示训练例子的个数,M表示变量的数目。2. 我们会被告知一个数m,被用来决定当在一个节点上做决定时,会使用到多少个变量。m应小于M。3. 从N个训练案例中以可重复取样的方式,取样N次,形成一组训练集(即bootstrap取样(待了解))并使用这棵树来对剩余预测其类别,并评估其误差。4. 对于每一个节点,随机选择m个基于此点上的变量。根据这m个变量,计算其最佳的分割方式。5. 每棵树都会完整成长而不会剪枝(Pruning)(未完待续) 阅读全文
posted @ 2012-12-31 00:04 Harrison_ 阅读(519) 评论(0) 推荐(0) 编辑
摘要: SVM与Adaboost存在一些相似之处,下面我们看下关于Adaboost的基本介绍Adaboost,是Adaptive Boosting是缩写。是经过调整的Boosting算法,适应性调整,能够对弱学习得到的弱分类器的错误进行适应性调整。Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。以上是Adaboost的核心思想。算法本身是通过改变数据分布来实现的。算法思路:1. 根据每一次训练集之中,每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。2. 将修改过权值的新 阅读全文
posted @ 2012-12-20 23:22 Harrison_ 阅读(2416) 评论(0) 推荐(1) 编辑
摘要: 算法:一:Random Forest二:SVM三:Adaboost第一层面. 会用,input, output第二层面. 基本原理第三层面. 优缺点,与其它算法比较第四层面. 为什么能够work第五层面. 创造一个类似的算法Next:算法框架SVM - Support Vector Machine - 支持向量机From Wikipedia: In Machine Learning, support vector machine (SVM) are supervised learning models with associated learning algorithms that analy 阅读全文
posted @ 2012-12-11 15:22 Harrison_ 阅读(850) 评论(0) 推荐(0) 编辑
摘要: 在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量做一个总结。 本文目录: 1. 欧氏距离 2. 曼哈顿距离 3. 切比雪夫距离 4. 闵可夫斯基距离 5. 标准化欧氏距离 6. 马氏距离 7. 夹角余弦 8. 汉明距离 9. 杰卡德距离 & 杰卡德相似系数 10. 相关系数 & 相关距离 11. 信息熵 阅读全文
posted @ 2012-12-03 12:08 Harrison_ 阅读(459) 评论(0) 推荐(0) 编辑
摘要: 开篇:我本科毕设课题是做Video Tracking,主要是研究TLD和MIL,MIL还没开始,TLD断断续续从开始研究到现在有将近一个月的时间,主要以看论文为主。之前包括现在对TLD的研究的人们已经很多了并且在持续进行,但作为本人的一个学习积累总结,方便以后查找review,所以打算作为一个系列利用空余时间持续写下来。TLD Brief Introduction:TLD:Tracking-Learning-Detection,这个算法是由Zdenek Kalal在2011年的PhD论文中提出,而后在国际计算机视觉会议上呈现出来并荣获多个奖项鼓励。谷歌"TLD"第一个就是作 阅读全文
posted @ 2012-11-29 15:14 Harrison_ 阅读(2881) 评论(0) 推荐(0) 编辑
摘要: 冒泡排序方法是最简单的排序方法。这种方法的基本思想是,将待排序的元素看作是竖着排列的“气泡”,较小的元素比较轻,从而要往上浮。在冒泡排序算法中我们要对这个“气泡”序列处理若干遍。所谓一遍处理,就是自底向上检查一遍这个序列,并时刻注意两个相邻的元素的顺序是否正确。如果发现两个相邻元素的顺序不对,即“轻”的元素在下面,就交换它们的位置。 阅读全文
posted @ 2012-05-01 16:14 Harrison_ 阅读(2009) 评论(0) 推荐(1) 编辑
摘要: 分布式计算!Final Project选了个基于RMI的小型wiki!RMI是第三周的实验,现在有些忘了,故现在先整理一下之前的实验,为之后的做下准备。感谢法师!感谢好心的TA! RMI (Remote Method Invocation)远程方法调用,关于RMI的介绍百度百科上已经写得非常详细了,具体参见 http://baike.baidu.com/view/99017.htm#2 阅读全文
posted @ 2012-04-19 21:53 Harrison_ 阅读(348) 评论(0) 推荐(0) 编辑
摘要: Tomorrow a different world will begin! Different people will shape! 阅读全文
posted @ 2012-04-19 20:14 Harrison_ 阅读(118) 评论(0) 推荐(0) 编辑