关注我,每天一篇大数据开发面试文章,挺进大厂!2021年全套大数据面试题开始更新!
摘要: 这几天浏览论坛看到一个帖子。如醍醐灌顶,解开了很多之前想不明白的问题。 知识体系到思维体系 我之前写过一个《早点建立自己的知识体系》,现在看来原来我只在第一层,更上一层的应该是思维体系的建立。 首先明白一个问题,你工作到底是在追求什么?前几天在公司的调查问卷上,我写了我工作的目的,获取尊重和认同感, 阅读全文
posted @ 2021-12-08 18:13 王知无 阅读(165) 评论(0) 推荐(0) 编辑
摘要: 背景 我先说下这篇文章的背景。 放假前的晚上,我们技术小组在和产品头脑风暴的时候,提出了一个终极问题: 中国优秀的软件架构师是不是出现了严重断层? 背景是这样的:我们在做一款面向B端商家的供应链产品,这个产品行业内有非常强力和成熟的软件公司,他们有受众广阔、市场占有率高、客户满意度高、软件架构很优秀 阅读全文
posted @ 2021-12-08 17:52 王知无 阅读(258) 评论(0) 推荐(0) 编辑
摘要: 这是小编的一个读者喜提offer后在群里做的分享,文中隐藏了读者的个人隐私信息,小编这里把他的面经分享出来供大家学习。 群友们看到后都纷纷表示【我酸了,现在我就是个柠檬精系列】。 关于如何学习/准备面试的总结 首先说一说本人的情况 本人普通本科,非计算机专业(之前一直对这个耿耿于怀,后来想通了觉得6 阅读全文
posted @ 2021-01-31 12:37 王知无 阅读(248) 评论(0) 推荐(0) 编辑
摘要: 小说《三体》第一部结尾,叶文洁透过红岸基地天空看到了最后一次日落。她亲手发出的讯息让人类太阳永远沉沦。多年以后,一颗小小的水滴瞬间摧毁庞大的人类星际舰队,人类的骄傲与自尊灰飞烟灭。叶文洁在登上红案基地前,说出了那句振聋发聩的话: 这是一切的开始,这也是人类的落日。 下面这几十行字只是一时兴起的个人思 阅读全文
posted @ 2021-01-30 11:11 王知无 阅读(279) 评论(0) 推荐(0) 编辑
摘要: 一条消息只有被ISR中所有Follower都从Leader复制过去才会被认为已提交。这样就避免了部分数据被写进了Leader,还没来得及被任何Follower复制就宕机了,而造成数据丢失。而对于Producer而言,它可以选择是否等待消息commit,这可以通过request.required.ac 阅读全文
posted @ 2021-01-24 11:00 王知无 阅读(242) 评论(0) 推荐(0) 编辑
摘要: Spark3.0已经发布半年之久,这次大版本的升级主要是集中在性能优化和文档丰富上,其中46%的优化都集中在Spark SQL上,SQL优化里最引人注意的非Adaptive Query Execution莫属了。 Adaptive Query Execution(AQE)是英特尔大数据技术团队和百度 阅读全文
posted @ 2021-01-23 18:44 王知无 阅读(2379) 评论(0) 推荐(1) 编辑
摘要: 一面 简单介绍一下自己以及自己做过的项目; Java HashMap 是不是线程安全的?为什么? 请用 Java 写个单例模式 知道几种 GC 算法? 如何实现一个高效的单项列表逆向输出? 数据湖和数据仓库有什么区别? 详细介绍下 Flink 的 Checkpoint 执行机制(分布式快照) 算法题 阅读全文
posted @ 2021-01-23 18:43 王知无 阅读(911) 评论(1) 推荐(0) 编辑
摘要: 高可靠性分析 Kafka的高可靠性的保障来源于其健壮的副本(replication)策略。通过调节其副本相关参数,可以使得Kafka在性能和可靠性之间运转的游刃有余。Kafka从0.8.x版本开始提供Partition级别的复制,replication数量可以配置文件(default.replica 阅读全文
posted @ 2021-01-23 18:42 王知无 阅读(278) 评论(0) 推荐(0) 编辑
摘要: 数据一致性 HDFS作为分布式文件系统在分布式环境下如何保证数据一致性。HDFS中,存储的文件将会被分成若干的大小一致的block分布式地存储在不同的机器上,需要NameNode节点来对这些数据进行管理,存储这些block的结点称为DataNode,NameNode是用来管理这些元数据的。 Name 阅读全文
posted @ 2021-01-23 18:39 王知无 阅读(582) 评论(0) 推荐(0) 编辑
摘要: 我们先抛出一个问题: LSM树是HBase里使用的非常有创意的一种数据结构。在有代表性的关系型数据库如MySQL、SQL Server、Oracle中,数据存储与索引的基本结构就是我们耳熟能详的B树和B+树。而在一些主流的NoSQL数据库如HBase、Cassandra、LevelDB、RocksD 阅读全文
posted @ 2021-01-13 00:17 王知无 阅读(344) 评论(0) 推荐(0) 编辑