7月19日day11总结

今天学习过程和小结

上午进行测试复习了

1hdfsnamenodedatanode作用

2hdfs副本存放机制

3mapreduce计算处理过程

4,格式化hdfs命令

5hdfs的核心配置文件内容配置

sql语句:

 部门表:

6,统计各个部门的人数

7,查询所有部门。

8,倒排索引代码

9hash函数的特点,有哪些实现方式

10,查看namenode是否正常运行

重点学习了倒排索引的代码。

然后进行了hive的安装和配置,以及sqoop的安装和配置。

 

Hive构建在Hadoop之上的数据仓库 Hive中定义了一种类SQL查询语言:HQL(类似SQL但不完全 相同) 通常用于离线数据处理(采用mapreduce) 底层支持多种不同的执行引擎(mapreducetezspark) 支持多种不同的压缩格式(GZIPLZOSnappyBizp2)、存储格式(TextFileSequenceFileRCFILEORCParquet)以及自定义函数(UDF)

 

 

 

 

hive中主要是进行SQL数据库表的建立以及SQL语句的学习。包括hive查询的联系和表连接的查询。以及sqoop的联系

1使用sqoop导入mysql数据到hdfs

2,使用sqoop导入mysql数据到hive

3,使用sqoop导入mysql数据到hive中,并指定表名

4,使用sqoop导入mysql数据到hive中,并使用where条件

5,使用sqoop导入mysql数据到hive中,并使用查询语句

6,使用sqoophive中的数据导出到mysql

 遇到问题汇总

 

  1. 今天主要学习了hiveSQL语句的操作,有很多SQL查询语句不是很了解要多多练习。

2.sqoop导入导出的步骤也要加强。

学习技能思维导图

 

posted @ 2018-07-19 19:30  康杨  阅读(82)  评论(0编辑  收藏  举报