摘要:一、Kmeans原理 Kmeans算法是一种常见的聚类算法,用于将数据集划分成k个不重叠的簇。其主要思想是通过迭代的方式将样本电话分到不同的簇中,使得同一簇内的样本点相似度较高,不同簇之间的相似度较低。 Kmeans算法的详细步骤: 初始化:选择k个初始聚类中心,可以是随机选择或者根据某种启发式方法
阅读全文
随笔分类 - 0803.数据分析之机器学习
学习笔记
摘要:一、概述 随机森林:最为新兴起的、高度灵活的一种机器学习算法,随机森林(Random Forset,简称RF)拥有广泛的应用前景,从市场销售到医疗保健保险,既可以用来做市场销售模拟的建模,统计客户来源,保留和流失,也可用预测疾病的风险和病患者的易感性。 随机森林算法是一种重要的基于bagging的集
阅读全文
摘要:一、关联分析概述 1. 关联分析 2. 频繁项集的评估标准 2.1 支持度 2.2 置信度 2.3 提升度 3. 关联规则发现 二、Apriori算法原理 三、使用Apriori算法来发现频繁项集 1. 生成候选项集 2. 项集迭代函数 四、Apriori关联规则挖掘 1. 挖掘关联规则的流程 2.
阅读全文
摘要:一、聚类分析概述 聚类分析是无监督机器学习算法中最常用的一类,其目的是将数据划分成有意义或有用的组(也被称为簇)。组内的对象相互之间是相似的(相关的),而不同组中的对象是不同的(不相关的)。组内的相似性(同质性)越大,组间差别越大,聚类就越好。 1. 簇的定义 简单来说,簇就是分类结果中的类,但实际
阅读全文
摘要:一、回顾决策树(分类) ID3算法构建树模型:每次选取当前最佳的特征类分割数据,并按照该特征的所有可能取值来切分。也就是说,如果一个特征值有4中取值,那么数据将被切分成4份。一旦按某特征切分后,该特征在之后的算法执行过程中将不会再起作用,所以有观点认为这种切分方式过于迅速。 除了切分过于迅速外,ID
阅读全文
摘要:一、什么是回归 回归的目的是预测数据型的目标值。最直接的办法是依据输入写出一个目标值的计算公式。加入你想要预测某位小姐姐男友汽车的功率大小,可能会这么计算: 小 姐 姐 男 友 汽 车 功 率 = 0.0015*男 友 年 薪 - 0.99* 收 听 公 共 广 播 时 间 这就是所谓的回归方程(r
阅读全文
摘要:一、集成学习概述 1. 集成学习算法定义 集成学习(Ensemble learning)就是将若干个弱分类器通过一定的策略组合之后产生一个强分类器。 弱分类器(weak Classifier)指的就是哪些分类准确率只比随机猜测略好一点的分类器,而强分类器(Strong Classifier)的分类准
阅读全文
摘要:一、什么是SVM 支持向量机(Support Vector Machine,SVM)是用于分类的一种算法,也属于有监督学习的范畴。 当一个分类问题,数据是线性可分(linearly separable)的,也就是用一根棍就可以将两种小球分开的时候,我们只要将棍的位置放在让小球距离棍的距离最大化的位置
阅读全文
摘要:一、逻辑回归概述 分类计数是机器学习和数据挖掘应用中的重要组成部分。在数据科学中,大约70%的问题属于分类问题。解决分类问题也有很多种,比如:k-近邻算法,使用距离计算来实现分类;决策树,通过构建直观易懂的树来实现分类;朴素贝叶斯,使用概率论构建分类器。这里要讲的是Logistic回归,它是一种很常
阅读全文
摘要:一、 朴素贝叶斯概念 贝叶斯分类算法是统计学的一种概率分类方法,朴素贝叶斯分类是贝叶斯分类中最简单的一种。七分类原理就是利用贝叶斯公式根据某特征的先验概率计算出其后验概率,然后选择具有最大后验概率的类作为该特征所属的类。之所以称之为“朴素”,是因为贝叶斯分类只做最原始、最简单的假设:所有的特征之间是
阅读全文
摘要:一、什么是决策树 决策树(Decision Tree)是有监督学习中的一种算法,并且是一种节本的分类与回归的方法。即决策树有两种:分类树和回归树。 那什么事决策树了? 简单点说就是二元判定,从头到尾逐次判定其归属类型。 从上述案例,我们很容易理解:决策树算法的本质就是二元判定的属性结构,我们可以通过
阅读全文
摘要:一、概述 k-近邻算法(k-Nearest Neighbour algorithm),又称为KNN算法,是数据挖掘技术中原理最简单的算法。KNN的工作原理:给定一个已知标签类别的训练数据集,输入没有标签的新数据后,在训练数据集中找到与新数据最邻近的k个实例,如果这k个实例的多数属于某个类别,那么新数
阅读全文
摘要:机器学习初识 人工智能(Artficial Inteliigence, AI): 是指由人工制造出来的系统所变现出来的智能。类似于电影中的终结者、阿尔法狗这类的具有一定和人类智慧同样本质的一类智能的物体; 机器学习(Machine Learning, ML):是人工智能的一个分支,是实现人工智能的一
阅读全文