2013年12月17日

FP-growth

摘要: FP的全称是Frequent Pattern,在算法中使用了一种称为频繁模式树(Frequent Pattern Tree)的数据结构。FP-tree是一种特殊的前缀树,由频繁项头表和项前缀树构成。FP-Growth算法基于以上的结构加快整个挖掘过程。预备知识FP-Tree:将事务数据表中的各个事务... 阅读全文

posted @ 2013-12-17 13:41 AI001 阅读(275) 评论(0) 推荐(0) 编辑

奇异值分解

摘要: 奇异值分解奇异值分解(Singular Value Decomposition)是线性代数中一种重要的矩阵分解,是矩阵分析中正规矩阵酉对角化的推广。在信号处理、统计学等领域有重要应用。目录1基本介绍2理论描述3几何意义4范数5应用求伪逆平行奇异值模型矩阵近似值1基本介绍奇异值分解在某些方面与对称矩阵... 阅读全文

posted @ 2013-12-17 13:37 AI001 阅读(391) 评论(0) 推荐(0) 编辑

局部加权线性回归

摘要: 加权直线回归简单来说,这个过程其实是在先拟合出一条曲线,然后再用这个曲线去预测需要预测的点。但是如果这个曲线拟合得不好(或者说样本数据含有大量噪音),那么这个预测结果就会很差。局部加权线性回归对于一个数据集合(x0,y0),(x1,y1),⋯,(xm,ym),我们预测它在x点时对应的y值时,如果采用... 阅读全文

posted @ 2013-12-17 13:33 AI001 阅读(375) 评论(0) 推荐(0) 编辑

weka

摘要: Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费的,非商业化(与之对应的是SPSS公司商业数据挖掘产品--Clementine )的,基于JAVA环境下开源的机器学习(machine learning)以及数据挖掘... 阅读全文

posted @ 2013-12-17 12:43 AI001 阅读(158) 评论(0) 推荐(0) 编辑

隐马尔可夫模型

摘要: 概念隐马尔可夫模型(Hidden Markov Model,HMM)作为一种统计分析模型,创立于20世纪70年代。80年代得到了传播和发展,成为信号处理的一个重要方向,现已成功地用于语音识别,行为识别,文字识别以及故障诊断等领域。它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中... 阅读全文

posted @ 2013-12-17 12:16 AI001 阅读(318) 评论(0) 推荐(0) 编辑

随机森林

摘要: 在机器学习中,随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。 而 "Random Forests" 是他们的商标。 这个术语是1995年由贝尔实验室的Tin Kam Ho所提出的随... 阅读全文

posted @ 2013-12-17 11:39 AI001 阅读(207) 评论(0) 推荐(0) 编辑

贝叶斯分类器

摘要: 贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。贝叶斯定理公式:P(A|B)=P(B|A)*P(A)/P(B)贝叶斯网络是一个带有概率注释的有向无环图,图中的每一个结点均表示一个随机变量,图中两结点间... 阅读全文

posted @ 2013-12-17 11:38 AI001 阅读(341) 评论(0) 推荐(0) 编辑

逻辑回归(logistic regression)和线性回归(linear regression)

摘要: 序号逻辑回归线性回归模型归类离散选择法模型回归分析数值类型二元一元或多元公式P(Y=1│X=x)=exp(x'β)/(1+exp(x'β))逻辑回归Logit模型(Logit model,也译作“评定模型”,“分类评定模型”,又作Logistic regression,“逻辑回归”)是离散选择法模型... 阅读全文

posted @ 2013-12-17 10:52 AI001 阅读(1646) 评论(0) 推荐(0) 编辑

导航