python机器学习笔记
人工智能,机器学习,深度学习之间的关系:
机器学习是人工智能中的一种,深度学习又是机器学习算法中的一种
机器学习的分类:有监督学习和无监督学习
有监督学习的流程:
1、训练阶段:有标签的样本数据扔到机器学习算法中学习
2、测试阶段:用无标签数据预测结果
数据集分为:训练集,验证集(用于选取最优模型),测试集
kNN,k-近邻算法
是一种基于样本/实例的算法
步骤:
1、计算测试样本和所有训练样本的距离
2、为测试样本选择k个与其距离最小的训练样本
3、统计出k个训练样本中大多数样本所属的分类
4、这个分类就是待分类数据所属分类
有点:1、算法简单直观,易于实现 2、不需要额外的数据,只依靠数据本身
缺点:1、计算量较大,分类速度慢 2、需要预先指定k值