摘要:
一、为什么需要数据归一化 不同数据之间因为单位不同,导致数值差距十分大,容易导致预测结果被某项数据主导,所以需要进行数据的归一化。 解决方案:将所有数据映射到同一尺度 二、最值归一化 normalization 最值归一化:把所有数据映射到0-1之间 适用于分布有明显边界的情况;受outlier影响 阅读全文
摘要:
一 、超参数和模型参数 超参数:在算法运行前需要决定的参数 模型参数:算法运行过程中学习的参数 - kNN算法没有模型参数- kNN算法中的k是典型的超参数 寻找好的超参数 领域知识 经验数值 实验搜索 二、通过sklearn中的数据集进行测试 输出结果:0.9888888888888889 三、考 阅读全文
摘要:
一 kNN算法简介 kNN(K-Nearest Neighbor)工作原理:存在一个样本数据集合,也称为训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类对应的关系。输入没有标签的数据后,将新数据中的每个特征与样本集中数据对应的特征进行比较,提取出样本集中特征最相似数据 阅读全文