关注我,每天一篇大数据开发面试文章,挺进大厂!2021年全套大数据面试题开始更新!
上一页 1 2 3 4 5 6 7 ··· 9 下一页
摘要: 马上要过年了,很多小伙伴可能都已经回家或者准备回家了。 然后咱们周末就消停会,不看代码了,等除夕或者春节在学... 这两天帮着几个星球的球友和群里的小伙伴改了改简历,另外还有几个小伙伴私聊我问了几个问题。有两个同学特别诚恳,就多交流了几句,我也学到挺多东西,可能大家现在遇到的问题,我未来都会遇到,学 阅读全文
posted @ 2020-01-18 14:24 王知无 阅读(269) 评论(0) 推荐(0) 编辑
摘要: 昨天下午在查资料的时候,无意间点到了MySQL的官网。发现MySQL发布了一个新版本。 Mysql这个数据库有没有人不熟悉?不用的?没有吧。 2019年末,MySQL发布的8.0.18 GA版本,带来了一些新特性和增强功能。其中最引人注目的莫过于多表连接查询 支持Hash Join 。 还是老样子, 阅读全文
posted @ 2020-01-15 22:48 王知无 阅读(390) 评论(0) 推荐(0) 编辑
摘要: 本文是根据平时面试以及网上资源进行的整理。希望对小伙伴们面试有帮助。 消息队列的作用和使用场景 通过异步处理提高响应时间,削峰填谷: 场景:数据比较集中且实时要求不是太高,如果同步处理,假如业务高峰需要4台服务支撑,那么在业务高峰过了之后,就会出现资源闲置,如果引入消息队列的话,将数据放到消息队列后 阅读全文
posted @ 2020-01-14 22:39 王知无 阅读(3700) 评论(0) 推荐(0) 编辑
摘要: 这些题目是一个知识星球的球友发给我的,其中有几个题帮着解答了一下。希望对大家有帮助。 如果你不知道如何准备面试,那么看看这个。 年假马上来临,我相信有不少读者都在准备或者考虑面试,无论如何不妨收藏一下。 如果你某个题目不知道答案,那么就去搜一下,如果搜不到,在公众号回复【加群】,可以加到群里寻求小伙 阅读全文
posted @ 2020-01-14 21:46 王知无 阅读(562) 评论(0) 推荐(0) 编辑
摘要: 维表JOIN 绕不过去的业务场景 在Flink 流处理过程中,经常需要和外部系统进行交互,用维度表补全事实表中的字段。 例如:在电商场景中,需要一个商品的skuid去关联商品的一些属性,例如商品所属行业、商品的生产厂家、生产厂家的一些情况; 在物流场景中,知道包裹id,需要去关联包裹的行业属性、发货 阅读全文
posted @ 2020-01-10 22:28 王知无 阅读(3451) 评论(1) 推荐(1) 编辑
摘要: flink是一款开源的大数据流式处理框架,他可以同时批处理和流处理,具有容错性、高吞吐、低延迟等优势,本文简述flink在windows和linux中安装步骤,和示例程序的运行,包括本地调试环境,集群环境。另外介绍Flink的开发工程的构建。 首先要想运行Flink,我们需要下载并解压Flink的二 阅读全文
posted @ 2020-01-06 22:27 王知无 阅读(976) 评论(0) 推荐(1) 编辑
摘要: 1、基本组件栈 了解Spark的朋友会发现Flink的架构和Spark是非常类似的,在整个软件架构体系中,同样遵循着分层的架构设计理念,在降低系统耦合度的同时,也为上层用户构建Flink应用提供了丰富且友好的接口。 https://mmbiz.qpic.cn/mmbiz_png/mqibsuEhdU 阅读全文
posted @ 2020-01-06 22:17 王知无 阅读(474) 评论(0) 推荐(0) 编辑
摘要: Apache Flink是什么? 在当代数据量激增的时代,各种业务场景都有大量的业务数据产生,对于这些不断产生的数据应该如何进行有效的处理,成为当下大多数公司所面临的问题。随着雅虎对hadoop的开源,越来越多的大数据处理技术开始涌入人们的视线,例如目前比较流行的大数据处理引擎Apache Spar 阅读全文
posted @ 2020-01-06 22:15 王知无 阅读(358) 评论(0) 推荐(0) 编辑
摘要: 本文来自由海致网络技术公司翟士丹分享。专注于大数据技术领域,Apache Spark Contributor,有丰富的Spark SQL引擎调优经验。 海致全称海致网络技术公司,成立于2013年7月。作为一家技术驱动的创业型公司,海致的创始班底拥有丰富的技术经验。核心团队成员来自百度、微软、IBM、 阅读全文
posted @ 2019-12-08 19:00 王知无 阅读(775) 评论(0) 推荐(0) 编辑
摘要: 本文围绕什么是数据中台,中台怎么建设,中台产品怎么选择,案例分析介绍企业级数据中台的建设。 什么是数据中台 数据中台是指通过数据技术,对海量数据进行采集、计算、存储、加工,同时统一标准和口径。 数据中台把数据统一之后,会形成标准数据,再进行存储,形成大数据资产层,进而为客户提供高效服务。这些服务跟企 阅读全文
posted @ 2019-12-08 16:52 王知无 阅读(5532) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 9 下一页