摘要: HIVE学习(一) 一、基础语法 1. select from where 分区表必须对分区字段进行限制 2. group by group by having 3. ORDER BY 二、常用函数 1. 时间戳转化为日期 2. 如何计算日期间隔 datediff(string enddate, s 阅读全文
posted @ 2019-12-30 11:29 羊驼也要搞大数据 阅读(740) 评论(0) 推荐(0) 编辑
摘要: KNN算法 一、KNN算法介绍 KNN算法全称是K Nearest Neighbors ,KNN原理就是当预测一个值属于什么分类,根据它最近的K个分类是什么进行预测它属于什么类别。 重点有两个: K 的确定和距离的计算 距离的计算:欧式距离 K值的计算: 通过交叉验证(将样本数据按照一定的比例拆分成 阅读全文
posted @ 2019-12-30 09:13 羊驼也要搞大数据 阅读(678) 评论(0) 推荐(0) 编辑