2019 年 10月 26 日随笔档案 - Jude_h

2019年10月26日

摘要： 1、概述：也称为K最近邻算法，原理为搜索最近的k个已知类别样本，用于未知类别样本的预测。对于分布不均匀的几个样本结果可能会受k取值的影响，通常情况下k值一般取奇数，此方法及可以用于连续型变量预测也可以作用于离散型数据模型预测。 2、衡量相似性指标方式：欧式距离、曼哈顿距离、cos余弦值、杰卡德相似阅读全文

posted @ 2019-10-26 22:39 Jude_h 阅读(933) 评论(0) 推荐(0) 编辑

公告