面试经验
1. 2024/5/10:太平洋房屋
1面
1.kafka怎么保证分区间有序
①.Key-based Partitioning,指定相同key的消息会被路由到同一个分区
②.自定义分区器
2.paimon合并机制
3.指标体系的理解
4.运维换磁盘怎么保证集群任务不挂
distcp
https://www.cnblogs.com/yinzhengjie/p/9872365.html
5.数据湖技术的比较
6.离线和实时的任务怎么部署的
7.doris使用问题 引擎 物化视图等等
8.QPS
1天数据量 10亿条 20kb/条 18T/day 6wQPS
https://blog.csdn.net/u011487470/article/details/124836528
https://www.cnblogs.com/huazailiaojishu/p/16599778.html
2面 负责人
1.sql笔试
自我介绍 个人规划
主要是扣数仓细节 技术架构 数仓建模 表数据量 指标体系 维表 出场景题 数据量大的时候怎么求实时pv 还要结合历史数据 放hbase中
2面 总监
仔细扣简历 对着简历问
公司业务 个人负责什么内容 两份工作有什么不一同 为什么跳槽
技术比较 doris vs ck 版本 什么时候发布的 用的时候遇到了什么问题
hbase热点问题
doris与hbase的区别
spark离线写入数据湖
Flink做实时数仓
接口多少个
数据量
多流join有一条流一直不来怎么办
flink cpe
指标体系