09 2021 档案
摘要:此面试题来自牛客网友分享的字节跳动应届一面,面试时长一小时。 网友情况:985 本硕。 以下为面试过程中提问,岗位为大数据开发: 自我介绍+项目介绍 为什么用 kafka、sparkstreaming、hbase?有什么替代方案吗? 聊聊你觉得大数据的整个体系? 你看过 hdfs 源码?nn 的高可
阅读全文
摘要:数仓建设真正的难点不在于数仓设计,而在于后续业务发展起来,业务线变的庞大之后的数据治理,而数据治理的范围非常广,包含数据本⾝的管理、数据安全、数据质量、数据成本等。在这么多治理内容中,大家想下最重要的治理是什么?当然是数据质量治理,因为数据质量是数据分析结论有效性和准确性的基础,也是这一切的前提。所
阅读全文
摘要:作为一个数据人,是不是经常被各种名词围绕,是不是对其中很多概念认知模糊。有些词虽然只有一字之差,但是它们意思完全不同,今天我们就来了解下数仓建设及数据分析时常见的一些概念含义及它们之间的关系。 本文结构如下图所示: 一、数仓中常见概念解析 1. 实体 实体是指依附的主体,就是我们分析的一个对象,比如
阅读全文
摘要:作为一个数据人,是不是经常被各种名词围绕,是不是对其中很多概念认知模糊。有些词虽然只有一字之差,但是它们意思完全不同,今天我们就来了解下数仓建设及数据分析时常见的一些概念含义及它们之间的关系。 本文结构如下图所示: 一、数仓中常见概念解析 1. 实体 实体是指依附的主体,就是我们分析的一个对象,比如
阅读全文