摘要:
一、这里学习的算法模型包含监督学习和非监督学习两个方式的算法。 其中监督学习的主要算法分为(分类算法,回归算法),无监督学习(聚类算法),这里的几种算法,主要是学习他们用来做预测的效果和具体的使用方式。 二、分类算法 1)K-近邻算法 a、公式 b、说明:K-近邻算法,简而言之,就是谁理我近,我就是 阅读全文
摘要:
一、评估算法的方式分两种,一种是分类算法的评估,一种是回归算法的评估。为什么要分两种呢,因为分类算法中可以通过准确率、精准率、召回率、混淆矩阵、AUC来评估算法的准确度。但是在预测值的时候是没有办法去获得这个准确值(比如分类对了,那就对了,错了就是错了,可以通过对错来统计准确率),那么回归算法的方式 阅读全文
摘要:
一、什么是特征工程?其实也是数据处理的一种方式,和前面的原始数据不一样的是,我们在原始数据的基础上面,通过提取有效特征,来预测目标值。而想要更好的去得出结果,包括前面使用的数据处理中数据特征提取,新增减少等手段都是特征功能的一种,这里为什么要单独提出来讲特征工程,而不是数据处理呢? 二、数据处理的方 阅读全文
摘要:
一、数据处理其实是一个很麻烦的事情。 在一个样本中存在特征数据(比如:人(身高、体重、出生年月、年龄、职业、收入...))当数据的特征太多或者特征权重小或者特征部分满足的时候。 这个时候就要进行数据的处理(比如:预测性别,特征出生年月,的影响就会很低,这里就要减少这一特征的权重,或者删除。再比如:预 阅读全文
摘要:
一、数据对于模型来说是基础,是数据成就了模型,而现在的又是一个数据时代,比如:淘宝等。通过对用户数据的分析挖掘,预测用户的消费习惯等,再比如:人工智能。通过提取摄像头的图片帧数,通过分析图片,得出具体的行为等。这些都离不开再最开始的数据。 二、数据的获取方式有很多种: 1)kaggle(推荐):一个 阅读全文
摘要:
一、机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 简而言之,机器学习就是通过一系列变种的数据公式 阅读全文