随笔分类 -  算法学习

摘要:过拟合现象 主要思路 主要框架 为了计量过拟合的概率,David H. Bailey等人使用了一种类似交叉验证的方法来对一个经过参数优化的策略回报矩阵重采样。第一步 我们在其参数空间上随机采样,得到N组不同的参数以及它们所对应的收益率序列,将其拼接成一个大矩阵M,其形状为TxN,T即是策略的回测时长 阅读全文
posted @ 2017-09-19 13:46 kongmeng 阅读(3082) 评论(0) 推荐(0)
摘要:Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。 阅读全文
posted @ 2017-08-27 23:30 kongmeng 阅读(670) 评论(0) 推荐(0)
摘要:0 安装环境 1 安装openCV 下载地址 http://opencv.org/ , 选择 https://sourceforge.net/projects/opencvlibrary/files/opencv-win/2.4.13/opencv-2.4.13.exe/download 解压后,得 阅读全文
posted @ 2016-09-11 10:23 kongmeng 阅读(3176) 评论(0) 推荐(0)
摘要:1 神经网络基本原理 图1. 人工神经元模型 X = [ x0 , x1 , x2 , ....... , xn ] 2. 常用激活函数 (1) 线性函数 ( Liner Function ) (2) 斜面函数 ( Ramp Function ) (3) 阈值函数 ( Threshold Funct 阅读全文
posted @ 2016-06-14 17:05 kongmeng 阅读(1081) 评论(0) 推荐(0)
摘要:参考资料:《机器学习实战》 Peter Harrington 阅读全文
posted @ 2016-03-24 11:54 kongmeng 阅读(1387) 评论(0) 推荐(0)
摘要:1 下载在http://archive.apache.org/dist/mahout 下载相应版本的mahout 版本,获取官网查看http://mahout.apache.org 相关的信息下载后解压,tar -zxvf mahout-distribution-0.9.tar.gz配置环境变量ex... 阅读全文
posted @ 2016-01-06 15:17 kongmeng 阅读(456) 评论(2) 推荐(0)
摘要:0 K-means算法简介K-means是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。算法过程如下:1)从N个文档随机选取K个文档作为质... 阅读全文
posted @ 2015-07-28 10:57 kongmeng 阅读(4979) 评论(0) 推荐(0)
摘要:艾兹格·W·迪科斯彻 (Edsger Wybe Dijkstra,1930年5月11日~2002年8月6日)荷兰人。 计算机科学家,毕业就职于荷兰Leiden大学,早年钻研物理及数学,而后转为计算学。曾在1972年获得过素有计算机科学界的诺贝尔奖之称的图灵奖,之 后,他还获得过1974年 AFIPS... 阅读全文
posted @ 2015-07-24 08:46 kongmeng 阅读(383) 评论(0) 推荐(0)
摘要:一 同分布检验1.1 判断数据是否来自于某种分布#产生100个标准正态分布随机数x = t*(1+sqrt(2/n)*za)){ ret <- 1 }else{ ret <- 0 } return (ret)}二 独立性检验2.1 列联表数据的独立性检验设两个随机变量X,Y是离散... 阅读全文
posted @ 2015-07-08 11:25 kongmeng 阅读(10836) 评论(3) 推荐(0)
摘要:根据各行业特性,人们提出了多种聚类算法,简单分为:基于层次、划分、密度、图论、网格和模型的几大类。其中,基于密度的聚类算法以DBSCAN最具有代表性。场景 一假设有如下图的一组数据, 生成数据的R代码如下x1 <- seq(0,pi,length.out=100)y1 <- sin(x1) + 0.... 阅读全文
posted @ 2015-07-04 21:11 kongmeng 阅读(23592) 评论(0) 推荐(1)
摘要:最近因工作需要,学习了台湾大学林智仁(Lin Chih-Jen)教授等人开发的SVM算法开源算法包。 为了以后方便查阅,特把环境配置及参数设置等方面的信息记录下来。 林教授年轻时照片 SVM属于十大挖掘算法之一,主要用于分类和回归。本文主要介绍怎么使用LIBSVM的回归进行数值预测。 LIBSVM内 阅读全文
posted @ 2015-06-20 22:23 kongmeng 阅读(12200) 评论(2) 推荐(1)
摘要:朴素贝叶斯 查看例子: 用p1(x, y)表示(x, y)属于类别1的概率,P2(x, y)表示(x, y)属于类别2的概率; 如果p(c1|x, y) > P(c2|x, y), 那么类别为1 如果p(c1|x, y) < P2(c2|x, y), 那么类别为2 根据贝叶斯公式: p(c|x, y 阅读全文
posted @ 2015-05-03 11:40 kongmeng 阅读(1786) 评论(0) 推荐(0)
摘要:在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量作一个总结。本文目录:1. 欧氏距离2. 曼... 阅读全文
posted @ 2015-04-20 15:22 kongmeng 阅读(206) 评论(0) 推荐(0)
摘要:Adaboost 算法 AdaBoost 是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器,即弱分类器,然后把这些弱分类器集合起来,构造一个更强的最终分类器。(很多博客里说的三个臭皮匠赛过诸葛亮) 算法本身是改变数据分布实现的,它根据每次训练集之中的每个样本的分类是否正确,以及上次的总体... 阅读全文
posted @ 2015-04-02 16:51 kongmeng 阅读(568) 评论(0) 推荐(0)
摘要:降维技术使得数据变得更易使用,并且它们往往能够去除数据中的噪声,使得机器学习任务往往更加精确。降维往往作为预处理步骤,在数据应用到其它算法之前清洗数据。有很多技术可以用于数据降维,在这些技术中,独立成分分析(Independent Component Analysis, ICA)、因子分析(Fact... 阅读全文
posted @ 2015-03-31 17:20 kongmeng 阅读(876) 评论(0) 推荐(1)
摘要:我收集和整理的目前互联网上所能找到的知名开源推荐系统(open source project for recommendation system),并附上了个人的一些简单点评(未必全面准确),这方面的中文资料很少见,希望对国内的朋友了解掌握推荐系统有帮助。推荐系统的评价指标解释。陈运文SVDFeat... 阅读全文
posted @ 2015-03-10 09:41 kongmeng 阅读(869) 评论(0) 推荐(0)
摘要:优化算法入门系列文章目录(更新中): 1. 模拟退火算法 2. 遗传算法 遗传算法 ( GA , Genetic Algorithm ) ,也称进化算法 。 遗传算法是受达尔文的进化论的启发,借鉴生物进化过程而提出的一种启发式搜索算法。因此在介绍遗传算法前有必要简单的介绍生物进化知识。一.进化... 阅读全文
posted @ 2015-03-09 10:03 kongmeng 阅读(629) 评论(0) 推荐(0)
摘要:优化算法入门系列文章目录(更新中): 1. 模拟退火算法 2. 遗传算法 一. 爬山算法 ( Hill Climbing ) 介绍模拟退火前,先介绍爬山算法。爬山算法是一种简单的贪心搜索算法,该算法每次从当前解的临近解空间中选择一个最优解作为当前解,直到达到一个局部最优解。 爬山算法实现很简单,其主 阅读全文
posted @ 2015-03-09 10:01 kongmeng 阅读(10842) 评论(1) 推荐(4)
摘要:在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。本文将带你深入了解协同过滤的秘密。下面直接进入正题1 什么是协同过滤协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤 (Collaborative Filtering, 简称 CF),首先想一个简单的问题,如果你... 阅读全文
posted @ 2015-03-09 09:28 kongmeng 阅读(340) 评论(0) 推荐(0)
摘要:1 策略设计模式 1 package thinkJava; 2 3 /* 4 * 策略设计模式 5 * 像本例一样,能够根据所传递的参数对象的不同而具有不同的行为的方法。 6 * Processor对象就是一个策略,有3中不同的策略应用到了String类型的对象上。 7 */ 8 impo... 阅读全文
posted @ 2014-11-12 11:43 kongmeng 阅读(168) 评论(0) 推荐(0)