$王大少

导航

2020年3月31日 #

hive中表的创建和对表数据的操作

摘要: 一、hive中表分为两种 1、内部表(管理表): 删除表的时候删除hdfs上的数据。 2、外部表 删除表的时候不删除hdfs上的数据。 外部表不能使用insert的方式插入数据,所有的数据来源,都是外部别人提供的,所以hive认为自己没有独占这份数据,所以删除hive表的时候,不会删 除表里面的数据 阅读全文

posted @ 2020-03-31 18:02 $王大少 阅读(2169) 评论(0) 推荐(0) 编辑

hive的三种交互方式

摘要: 第一种交互方式:Hive交互shell cd /export/servers/hive-1.1.0-cdh5.14.0 bin/hive 查看所有的数据库 hive (default)> show databases; 创建一个数据库 hive (default)> create database 阅读全文

posted @ 2020-03-31 16:05 $王大少 阅读(522) 评论(0) 推荐(0) 编辑

mysql的远程连接

摘要: 赋权 grant all privileges on *.* to 'root'@'%' identified by '123456' with grant option; 执行上面的命令之后要执行下面的命令刷新 FLUSH PRIVILEGES all 表示对数据的所有操作(insert dele 阅读全文

posted @ 2020-03-31 15:22 $王大少 阅读(120) 评论(0) 推荐(0) 编辑

Hive数据仓库

摘要: 一、数据仓库的概念: 数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。它出于分析性报告和决策支持目的而创建。 数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的 阅读全文

posted @ 2020-03-31 13:21 $王大少 阅读(399) 评论(0) 推荐(0) 编辑

yarn当中的调度器

摘要: yarn当中的调度器分为三种? 1、FIFO Scheduler 队列调度器,基本没人用 2、capacity scheduler 容量调度器,apache版本默认使用的调度器 3、Fair Scheduler 公平调度器,CDH版本的hadoop默认使用的调度器 使用哪种调度器取决于yarn-si 阅读全文

posted @ 2020-03-31 12:01 $王大少 阅读(139) 评论(0) 推荐(0) 编辑