一、IDC :Internet Data Center,即互联网数据中心,简称IDC机房。 就是用来存放服务器的地方,是实体服务器的集群。这是随着互联网发展而兴起的服务器托管、租用、运维以及网络接入服务的业务。通过IDC服务,企业或政府单位无需再建立自己的专用机房、铺设昂贵的通信线路,也无需聘请网络 Read More
posted @ 2021-12-15 15:27 HANIEEE Views(1693) Comments(0) Diggs(0) Edit
event time: 数据在源头的发生时间,跟flink无关,数据产生时就已经确定过了 processing time : 数据在flink中开始被处理的时间,跟flink有关 ingestion time : 数据到达flink集群中的时间 Read More
posted @ 2021-12-10 14:19 HANIEEE Views(110) Comments(0) Diggs(0) Edit
ProcessingTime是以operator处理的时间为准,它使用的是机器的系统时间来作为data stream的时间 IngestionTime是以数据进入flink streaming data flow的时间为准 EventTime是以数据自带的时间戳字段为准,应用程序需要指定如何从rec Read More
posted @ 2021-12-10 11:33 HANIEEE Views(37) Comments(0) Diggs(0) Edit
in的改写 考虑以下 SQL 查询语句: SELECT a.key, a.value FROM aWHERE a.key in (SELECT b.key FROM B); 可以改为: SELECT a.key, a.valueFROM a LEFT OUTER JOIN b ON (a.key = Read More
posted @ 2021-12-09 17:42 HANIEEE Views(238) Comments(0) Diggs(0) Edit
如果不指定MapJoin或者不符合MapJoin的条件,那么Hive解析器会将Join操作转换成Common Join,即:在Reduce阶段完成join。容易发生数据倾斜。可以用MapJoin把小表全部加载到内存在map端进行join,避免reducer处理 开启MapJoin参数设置 设置自动选 Read More
posted @ 2021-11-21 11:39 HANIEEE Views(256) Comments(0) Diggs(0) Edit
#!/usr/bin/env python3from HiveTask import HiveTaskimport osimport syssys.path.append(os.getenv('HIVE_TASK')) ht = HiveTask() data_day_str = sys.argv[ Read More
posted @ 2021-11-21 11:31 HANIEEE Views(183) Comments(0) Diggs(0) Edit
hive.exec.parallel可以控制一个sql中多个可并行执行的job的运行方式.当hive.exec.parallel为true的时候,同一个sql中可以并行执行的job会并发的执行. 而参数hive.exec.parallel.thread.number就是控制对于同一个sql来说同时可 Read More
posted @ 2021-11-21 11:27 HANIEEE Views(354) Comments(1) Diggs(0) Edit
posted @ 2021-11-14 16:13 HANIEEE Views(74) Comments(0) Diggs(0) Edit
1、B+树是一种树数据结构,是一种平衡搜索树,是一种多叉树,通常用于数据库和操作系统的文件系统中。 2、B+ 树的特点是能够保持数据稳定有序,其插入与修改拥有较稳定的对数时间复杂度。 3、B+树元素自底向上插入,这与二叉树恰好相反。 Read More
posted @ 2021-11-14 14:15 HANIEEE Views(326) Comments(0) Diggs(0) Edit
存储引擎:不同的数据文件在磁盘的组织形式 InnoDB存储引擎 B+树索引 为什么MySQL使用B+树作为InnoDB存储引擎的索引结构? 答:1.Hash表索引: 优点:适合等值查询 缺点:所有数据均在内存,不适合范围查询。 2.二叉树和红黑树都是存单个数据值,不是值的集合。容易造成深度太深,IO Read More
posted @ 2021-11-14 13:55 HANIEEE Views(29) Comments(0) Diggs(0) Edit