摘要: 多类分类(Multiclass classification): 表示分类任务中有多个类别, 比如对一堆水果图片分类, 它们可能是橘子、苹果、梨等. 多类分类是假设每个样本都被设置了一个且仅有一个标签: 一个水果可以是苹果或者梨, 但是同时不可能是两者 多标签分类(Multilabel classi 阅读全文
posted @ 2020-01-07 20:30 山竹小果 阅读(3148) 评论(0) 推荐(2) 编辑
摘要: np.split() 均等分割,不均等会报错np.array_split() 不均等分割,不会报错 split(ary, indices_or_sections, axis=0) :把一个数组从左到右按顺序切分 参数: ary:要切分的数组 indices_or_sections:如果是一个整数,就 阅读全文
posted @ 2020-01-07 20:09 山竹小果 阅读(7736) 评论(2) 推荐(2) 编辑
摘要: 数据清洗一是为了解决数据质量问题,二是让数据更加适合做挖掘 一、解决数据质量问题 数据的完整性,比如人的属性中缺少性别、籍贯、年龄等 数据的唯一性,比如不同来源的数据出现重复的情况 数据的权威性,比如同一个指标出现多个来源的数据,且数值不一样 数据的合法性,比如数据与常识不符,市区内开车速度到达了4 阅读全文
posted @ 2020-01-07 19:54 山竹小果 阅读(1053) 评论(0) 推荐(0) 编辑
摘要: priority_queue本质是一个堆。 1. 头文件是#include<queue> 2. 关于priority_queue中元素的比较 模板申明带3个参数:priority_queue<Type, Container, Functional>,其中Type 为数据类型,Container为保存 阅读全文
posted @ 2020-01-07 19:39 山竹小果 阅读(18298) 评论(0) 推荐(6) 编辑