摘要: 人员表 id,姓名,爱好,住址 1,小明1,lol book movie,beijing:mashibing shanghai:pudong 2,小明2,lol book movie,beijing:mashibing shanghai:pudong 3,小明3,lol book movie,bei 阅读全文
posted @ 2019-08-12 02:05 SteveYu 阅读(431) 评论(0) 推荐(0) 编辑
摘要: Hive基本SQL操作 Hive DDL(数据库定义语言) 1、数据库的基本操作 注意:当进入hive的命令行开始编写SQL语句的时候,如果没有任何相关的数据库操作,那么默认情况下,所有的表存在于default数据库,在hdfs上的展示形式是将此数据库的表保存在hive的默认路径下,如果创建了数据库 阅读全文
posted @ 2019-08-12 01:36 SteveYu 阅读(326) 评论(0) 推荐(0) 编辑
摘要: 03 Hive的安装搭建 Hive可以从源码中编译安装,也可以直接使用官网下载的安装包,在此处我们选择安装包解压安装的方式。 Hive中最最重要的角色就是metastore 因此按照metastore的管理共有四种hive的安装搭建方式:官网参考地址如下: https://cwiki.apache. 阅读全文
posted @ 2019-08-12 01:18 SteveYu 阅读(258) 评论(0) 推荐(0) 编辑
摘要: 02 Hive的架构 1、Hive的架构图 2、Hive的服务(角色) 1、用户访问接口 ​ CLI(Command Line Interface):用户可以使用Hive自带的命令行接口执行Hive QL、设置参数等功能 ​ JDBC/ODBC:用户可以使用JDBC或者ODBC的方式在代码中操作Hi 阅读全文
posted @ 2019-08-12 01:17 SteveYu 阅读(154) 评论(0) 推荐(0) 编辑
摘要: 01 Hive的基本介绍 1、hive产生的原因 · a) 方便对文件及数据的元数据进行管理,提供统一的元数据管理方式 ​ b) 提供更加简单的方式来访问大规模的数据集,使用SQL语言进行数据分析 2、hive是什么? ​ Hive经常被大数据企业用作企业级数据仓库。 ​ Hive在使用过程中是使用 阅读全文
posted @ 2019-08-12 01:16 SteveYu 阅读(428) 评论(0) 推荐(0) 编辑
摘要: 1.MyWordCount类 注意: 1.本机+测试,两个注释都放开 2.本机跑集群,要开异构平台为true 3.集群跑,把两个注释都注起来,然后在集群上面跑 2.WordCountMapper类 作用: 定义一个拆分文本的功能,将Mapper进行拆分成key, value的形式 3.WordCou 阅读全文
posted @ 2019-08-12 00:46 SteveYu 阅读(284) 评论(0) 推荐(0) 编辑