摘要: 一、基本概念 1、介绍 对HDFS、Hbase数据的高性能、低延迟的交互式SQL查询功能 2、优缺点 优点:基于内存运算,无需写入磁盘,无需转化为MR,支持Data Locality调度(数据和计算在一台机器进行) 缺点:完全依赖于hive,只能读取文本文件 3、组成 4、原理 二、Impala安装 阅读全文
posted @ 2021-12-02 21:43 哥们要飞 阅读(651) 评论(0) 推荐(0) 编辑
摘要: 五、业务数仓搭建 1、业务数据生成 建库建表gmall 需求:生成日期2019年2月10日数据、订单1000个、用户200个、商品sku300个、删除原始数据。 CALL init_data('2019-02-10',1000,200,300,TRUE); 2、业务数据导入数仓 编写Sqoop定时导 阅读全文
posted @ 2021-12-02 21:33 哥们要飞 阅读(247) 评论(0) 推荐(0) 编辑
摘要: 给你一个整数数组 nums ,找到其中最长严格递增子序列的长度。 子序列是由数组派生而来的序列,删除(或不删除)数组中的元素而不改变其余元素的顺序。例如,[3,6,2,7] 是数组 [0,3,1,6,2,2,7] 的子序列。 来源:力扣(LeetCode)链接:https://leetcode-cn 阅读全文
posted @ 2021-12-02 20:06 哥们要飞 阅读(25) 评论(0) 推荐(0) 编辑