摘要: 使用Python实现k-近邻算法的一般流程为: 1、收集数据:提供文本文件 2、准备数据:使用Python解析文本文件,预处理 3、分析数据:可视化处理 4、训练算法:此步骤不适用与k——近邻算法 5、测试算法:使用海伦提供的部分数据作为测试样本。测试样本与非测试样本的区别在于:测试样本是已经完成分 阅读全文
posted @ 2018-11-28 21:16 Tiger_Jiang 阅读(1186) 评论(0) 推荐(0) 编辑
摘要: iris数据集的中文名是安德森鸢尾花卉数据集,英文全称是Anderson’s Iris data set。iris包含150个样本,对应数据集的每行数据。每行数据包含每个样本的四个特征和样本的类别信息,所以iris数据集是一个150行5列的二维表。通俗地说,iris数据集是用来给花做分类的数据集,每 阅读全文
posted @ 2018-11-28 18:50 Tiger_Jiang 阅读(18796) 评论(0) 推荐(4) 编辑