05 2022 档案

摘要:Hive作为大数据领域常用的数据仓库组件,在平时设计和查询时要特别注意效率。影响Hive效率的几乎从不是数据量过大,而是数据倾斜、数据冗余、job或I/O过多、MapReduce分配不合理等等。对Hive的调优既包含对HiveQL语句本身的优化,也包含Hive配置项和MR方面的调整。 列裁剪和分区裁 阅读全文
posted @ 2022-05-05 10:31 坤妹家萌萌哒萌新 阅读(184) 评论(0) 推荐(0) 编辑
摘要:库操作 创建数据库 -- 创建一个数据库,在HDFS上的默认路径为/user/hive/warehouse/*.db create database mydatabase; -- 可以使用if exists判断数据库是否已存在(存在则不创建) create database if not exist 阅读全文
posted @ 2022-05-05 10:23 坤妹家萌萌哒萌新 阅读(376) 评论(0) 推荐(1) 编辑
摘要:一、安装docker 二、安装docker-compose 两种最新的docker安装方式 1.从github上下载docker-compose二进制文件安装1.1下载最新版的docker-compose文件 sudo curl -L https://github.com/docker/compos 阅读全文
posted @ 2022-05-04 18:48 坤妹家萌萌哒萌新 阅读(1391) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示