07 2024 档案

Clickhouse 学习(最新)
摘要:Clickhouse-23.2.1.2537 学习 一、Clickhouse概述 clickhouse 官网网址:https://clickhouse.com/ ![image-20230526091704292](C:\Users\shujia\Desktop\课件\Clickhouse-23.2 阅读全文

posted @ 2024-07-03 22:54 wa小石榴不甜wa 阅读(69) 评论(1) 推荐(0) 编辑

数据中台
摘要:数据中台 1. 专有名词解释 业务过程: 指在业务中发生的最小单元的行为或事务,不可再拆分事件,比如创建订单,浏览网页等等。业务过程产生的行为明细, 比如支付了一笔订单,浏览了某个网页,最终都会汇集到事实表中,而大部分情况下,事实表都会聚焦于某个特定的业务 过程。 原子指标: 原子指标是对指标统计口 阅读全文

posted @ 2024-07-03 22:45 wa小石榴不甜wa 阅读(31) 评论(0) 推荐(0) 编辑

数据仓库的学习
摘要:数据仓库的学习 1. 分层设计 数仓分层阿里整体分为了5层,分别是ODS,DWD,DIM,DWS,ADS ODS(Operational Data Store) 面向主题的”数据运营层,也叫ODS层,是最接近数据源中数据的一层,数据源中的数据,经过抽取、洗净、传输,也就说传说中的 ETL 之后,装入 阅读全文

posted @ 2024-07-03 22:42 wa小石榴不甜wa 阅读(60) 评论(0) 推荐(0) 编辑

DataX3的学习
摘要:阿里云开源离线同步工具DataX3.0 一. DataX3.0概览 DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。 设计理念 为了解决异构数据源同步问题, 阅读全文

posted @ 2024-07-03 22:28 wa小石榴不甜wa 阅读(40) 评论(0) 推荐(0) 编辑

数据采集工具Flume
摘要:分布式数据采集系统Flume学习 一、Flume架构 1.1 Hadoop业务开发流程 1.2 Flume概述 flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。 支持在日志系统中定制各类数据发送方,用于收集数据; 同时,Flume提供对数据进行简单处理,并写到各种数据接受方( 阅读全文

posted @ 2024-07-03 22:25 wa小石榴不甜wa 阅读(74) 评论(0) 推荐(0) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示