05 2024 档案

摘要:一、 离线数仓 应用:大屏、驾驶舱、商品分析、销售订单分析、BI平台、供应链仓储运单分析、门店经营分析、用户画像。 电商业务表 1. 建模理论 ER模型 :实体关系 3NF 数据冗余低 保障数据一致性 面向对象设计 主外键 不适合统计分析 ODS层 维度模型 :星型模型 建表&SQL 数据统计:汇总 阅读全文
posted @ 2024-05-23 14:30 小花生hadoop 阅读(20) 评论(0) 推荐(0) 编辑
摘要:一、 基础查询 sublime 格式化 ctrl+k ctrl+f -- 创建学生表 DROP TABLE IF EXISTS student_info; create table if not exists student_info( stu_id string COMMENT '学生id', s 阅读全文
posted @ 2024-05-13 11:58 小花生hadoop 阅读(59) 评论(0) 推荐(0) 编辑
摘要:1. IO模型 2. 网络编程 IO调用分2个阶段:数据准备、数据copy. BIO:同步阻塞,一个连接一个线程,第一阶段等待,直到有数据了,该线程copy并返回,等到的过程一直浪费资源,优化:用连接池多线程,不用新建、销毁线程,直接拿池子里现成的。 NIO: 同步非阻塞,多个连接注册到多路复用器S 阅读全文
posted @ 2024-05-10 14:04 小花生hadoop 阅读(16) 评论(0) 推荐(0) 编辑
摘要:1. 2024/5/10:太平洋房屋 1面 1.kafka怎么保证分区间有序 ①.Key-based Partitioning,指定相同key的消息会被路由到同一个分区 ②.自定义分区器 2.paimon合并机制 3.指标体系的理解 4.运维换磁盘怎么保证集群任务不挂 distcp https:// 阅读全文
posted @ 2024-05-10 14:04 小花生hadoop 阅读(13) 评论(0) 推荐(0) 编辑
摘要:1.Git #生成密钥 ssh-keygen -t ed25519 -C "邮箱" 2.Linux命令 2.1 vim # 一般模式 i/I/a/A/o/O yy 复制光标当前一行 y3y 复制3行 p 粘贴 u 撤销上一步 dd 删除当前行 d3d 删除3行 x 剪切一个字母,相当于del yw 阅读全文
posted @ 2024-05-08 16:56 小花生hadoop 阅读(4) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示