随笔分类 - 机器学习
摘要:[toc] 一、贝叶斯 简单地说,贝叶斯就是贝yes,见到贝克汉姆说了一句yes,研究的是这种概率事件。 开玩笑啦,贝叶斯原理是英国数学家托马斯·贝叶斯提出的,为了解决一个“逆概率”问题。 例如,一个男人发现了他老婆手机里有暧昧短信 ,计算他老婆出轨的概率。 现实生活中,我们很难知道事情的全貌,当不
阅读全文
摘要:[toc] 一、什么是回归(Regression) 一说回归最先想到的是终结者那句:I'll be back regress,re表示back,gress等于go,数值 ,也就是 的意思 在数理统计中,回归是确定多种变量相互依赖的定量关系的方法 通俗理解:越来越接近期望值的过程,回归于事物的本质 二
阅读全文
摘要:[toc] 一、机器学习是什么 机器学习是计算机基于数据构建 并运用模型对数据进行 的学科。 机器学习是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 机器学习是 的核心,从大量现象中提取反复出现的规律与模式,是使计算机具有智能的根本
阅读全文
摘要:[toc] 一、信息论 信息论处理的是客观世界中的不确定性。 通信的基本问题是在一点精确地或近似地复现在另一点所选取的消息。在生活中,信息的载体是消息。 不同的消息带来的信息在直观感觉上不是完全相同的,比如“马云获得奥赛健美冠军”比“施瓦辛格获得奥赛健美冠军”的信息要大得多。 因为前者是小概率事件,
阅读全文
摘要:[toc] 前言 最优化理论研究的问题是判定给定目标函数的最大值(最小值)是否存在,并找到令目标函数取到最大值(最小值)的数值。 人工智能问题最后都会归结为一个优化问题的求解:在复杂环境与多体交互中做出最优决策。 最优化算法可能找到全局最小值,也可能找到局部最小值,理想情况下,最优化算法的目标就是找
阅读全文
摘要:[toc] 一、线性代数 万事万物都可以被抽象成某些特征的组合,线性代数的本质是将具体事物抽象为数学对象,描述其静态和动态的特征。 常见概念 标量(scalar) 一个标量 a 可以是整数、实数或复数 向量(vector) 多个标量 a1,a2,⋯,an 按一定顺序组成一个序列。通常用一维数组表示,
阅读全文
摘要:一、不变的招式 虽然数据分析,数据挖掘,一说预测看起来高大上,但是其实是有套路的,预测的代码大致都长下面这个样子 # 1.选择算法模型 model=new 算法模型() # 2.设置参数 # 3.开始训练(传入训练集特征train_x和训练集结果train_y) model.fit(train_x,
阅读全文
摘要:[toc] 算法分类 连接分析:PageRank 关联分析:Apriori 分类算法:C4.5,朴素贝叶斯,SVM,KNN,Adaboost,CART 聚类算法:K Means,EM 一、PageRank 当一篇论文被引用的次数越多,证明这篇论文的影响力越大。 一个网页的入链越多,入链越优质,网页的
阅读全文