摘要:
1. 简介 K-Nearest Neighbor算法又叫KNN算法(最近邻算法,k是选取几个距离其最近的样本作为参考),这个算法是机器学习里面一个比较经典的分类和回归算法。 定义:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别 阅读全文
摘要:
1. 数据集 1. sklearn 数据集介绍 其获取数据集有两种方式: load_xxx: 获取小数据集(依赖库自带) fetch_xxx: 从互联网下载一些大的数据集 以莺尾花数据集为例子: from sklearn.datasets import load_iris # 获取鸢尾花数据集 ir 阅读全文