摘要: 一 数据的概括性度量 (1)集中趋势的度量 分类数据:众数 1. 一组数据中出现次数最多的变量值 2. 适合于数据量较多时使用 3. 不受极端值的影响 4. 一组数据可能没有众数或有几个众数 5. 主要用于分类数据,也可用于顺序数据和数值 型数据 顺序数据:中位数和分位数 中位数: 1. 排序后处于 阅读全文
posted @ 2019-04-12 20:47 罗亚雄 阅读(908) 评论(0) 推荐(0) 编辑
摘要: K近邻算法 1 模型建立的基本思路 学习机器学习,永远是从分类模型开始——这是一种有监督的,最容易理解的机器学习模型。分类算法是根据样本的特征预测出样本所在的类别,因此分类算法中的标签的类别通常使用整数来表示。例如,如果只有两种类别:男女,是否,正负,则我们往往使用0表示一类,1表示一类,或者使用 阅读全文
posted @ 2019-04-12 19:42 罗亚雄 阅读(2479) 评论(0) 推荐(1) 编辑
摘要: 阅读全文
posted @ 2019-04-12 17:56 罗亚雄 阅读(488) 评论(0) 推荐(0) 编辑