摘要: 参考书籍:《The Elements of Statistical Learning》和 UTC ppt. 阅读全文
posted @ 2019-03-05 06:30 旁人爱标签 阅读(93) 评论(0) 推荐(0) 编辑
摘要: 1.Hive基本操作 2. Select操作详解 a.使用ALL和DISTINCT选项区分对重复记录的处理,默认是ALL。 b.Where条件,支持AND,OR,IN ,NOT IN,不支持EXIST 和 NOT EXIST。 c.Order by全局排序,只有一个Reduce任务。Sort by 阅读全文
posted @ 2019-03-05 04:13 旁人爱标签 阅读(166) 评论(0) 推荐(0) 编辑
摘要: 1. Hive什么 a.Hive是基于Hadoop的一个数据仓库工具(注意不是数据仓库),将结构化的数据文件映射成一张数据库表。 b.Hive是SQL的解析引擎,可以把sql语句转换成MapReduce,但也允许自定义mr程序。 c.Hive不适合用于联机(online)事务处理,也不提供实时查询功 阅读全文
posted @ 2019-03-05 04:11 旁人爱标签 阅读(256) 评论(0) 推荐(0) 编辑
摘要: 该文主要记录了自己用云服务器搭建集群的过程,也分享一些自己遇到的问题和解决方法。里面可能提及一些自己的理解,可能不够准确,希望大家能够指正我,谢谢。 1.什么是HA集群 HA :High Available 问题:对于只有一个namenode的集群,如果namenode的集群出现故障,集群将无法使用 阅读全文
posted @ 2018-06-28 06:22 旁人爱标签 阅读(7812) 评论(0) 推荐(0) 编辑
摘要: 1.练习要求: 2.数据文件(data_staff.txt) 3.实现代码 A.主程序部分:采用字典类型来实现函数的调用(key对应的value是函数名,通过Name()语法可以调用函数执行),利用os模块的remove()和rename()实现文件的修改后的旧文件删除和新文件的重命名。 B.查询函 阅读全文
posted @ 2017-08-07 00:25 旁人爱标签 阅读(3621) 评论(3) 推荐(0) 编辑
摘要: 1.程序目标 输入用户名密码 认证成功后显示欢迎信息 输错三次后锁定 2.思路 利用python中的pickle模块,实现用户登录信息(采用dict)和被锁定用户信息(采用list)的存储。所以我预先存储了一些用户信息和被锁定用户信息在两个.pkl文件里面。 输入用户名后先判断是否在锁定用户的lis 阅读全文
posted @ 2017-07-18 20:29 旁人爱标签 阅读(1085) 评论(0) 推荐(0) 编辑