折叠
摘要: 1. 算法原理 核心思想:未标记样本的类别,由距离其最近的k个邻居投票来决定。 已知条件:具有已标记数据集且知道数据集中每个样本所属类别。一个未标记数据样本。 目的:预测未标记数据样本所属类别。 算法原理伪代码: 假设 X_test 为待标记的数据样本,X_train为已标记的数据集 遍历 X_tr 阅读全文
posted @ 2021-08-02 20:47 Coverpast 阅读(264) 评论(0) 推荐(0) 编辑
摘要: 数据分析中的'疑难杂症'小结(三) 1. 关于数据的合并方式 concat自定义合并 concat可以通过指定axis来操作数据的合并是按照横向还是纵向。 #横向合并 result_down = pd.concat(list_down,axis=1) join,concat,merge三者的区别 具 阅读全文
posted @ 2021-08-02 08:16 Coverpast 阅读(55) 评论(0) 推荐(0) 编辑