摘要: 进阶篇主要包含了 Flink 中的数据传输、容错机制、序列化、数据热点、反压等实际生产环境中遇到的问题等考察点。这一阶段主要考察我们对 Flink 掌握的深度,也是留下好印象的关键环节。 1:请谈谈你对 Flink Table & SQL 的了解情况?以及 TableEnvironment 这个类有 阅读全文
posted @ 2020-09-21 11:18 Christbao 阅读(356) 评论(0) 推荐(0) 编辑
摘要: 罗列Flink基础相关的题。 1:请介绍一下 Flink。 考察我们队 Flink 整体的掌握情况,我们应该从以下几个基本的概念入手。 Flink 是大数据领域的分布式实时和离线计算引擎,其程序的基础构建模块是流(Streams)和转换(Transformations),每一个数据流起始于一个或多个 阅读全文
posted @ 2020-09-21 11:10 Christbao 阅读(192) 评论(0) 推荐(0) 编辑
摘要: 理解用户的各类行为,构建用户画像体系,帮助平台更加精准运营;在用户的各个维度上,利用数据挖掘、机器学习等技术分析建模,驱动营销、治理、评级等方向。 用户画像标签 一般用户画像标签分为统计类、规则类、机器学习挖掘类 统计类:用户性别、年龄、近7天活跃时长、消费记录 规则类:规则类与运营策略相关,标签形 阅读全文
posted @ 2020-09-19 22:46 Christbao 阅读(294) 评论(0) 推荐(0) 编辑
摘要: Table API 和 SQL 处于最顶端,是 Flink 提供的高级 API 操作。Flink SQL 是 Flink 实时计算为简化计算模型,降低用户使用实时计算门槛而设计的一套符合标准 SQL 语义的开发语言. 一个完整的 Flink Table & SQL Job 也是由 Source、Tr 阅读全文
posted @ 2020-09-08 23:02 Christbao 阅读(518) 评论(0) 推荐(0) 编辑
摘要: 面向数据时代的实时计算技术接踵而至。从我们最初认识的 Storm,再到 Spark 的异军突起,迅速占领了整个实时计算领域。Apache Flink 同时支持流式及批量分析应用,实现批流一体。 Flink 在实时数仓和实时 ETL 中有天然的优势: 状态管理,实时数仓里面会进行很多的聚合计算,这些都 阅读全文
posted @ 2020-09-07 23:01 Christbao 阅读(492) 评论(0) 推荐(0) 编辑
摘要: NLP 中文词向量,git地址:https://github.com/Embedding/Chinese-Word-Vectors 条件随机场,文章整理 BiLSTM + CRF 命名实体识别,文章地址 大数据 spark 的推荐系统特征工程;spark 调优;spark与flink 剖析 ;实时数 阅读全文
posted @ 2020-09-04 09:47 Christbao 阅读(200) 评论(0) 推荐(0) 编辑
摘要: argsparse是python的命令行解析的标准模块,内置于python,不需要安装。这个库可以让我们直接在命令行中就可以向程序中传入参数并让程序运行。 我们先在桌面新建“arg学习”的文件夹,在该文件夹中新建demo.py文件,来看一个最简单的argsparse库的使用的例子。 import a 阅读全文
posted @ 2020-09-03 17:10 Christbao 阅读(166) 评论(0) 推荐(0) 编辑
摘要: 有一张用户签到表【t_user_attendence】,标记每天用户是否签到(说明:该表包含所有用户所有工作日的出勤记录) ,包含三个字段: 日期【fdate】;用户id【fuser_id】;用户当天是否签到【fis_sign_in:0否1是】 问题1:请计算截至当前每个用户已经连续签到的天数(输出 阅读全文
posted @ 2020-09-01 14:51 Christbao 阅读(254) 评论(0) 推荐(0) 编辑
摘要: 一、大数据技术涉及的技术层面 数据采集,通过etl将结构化、非结构化数据抽取到中间层,进行清洗、转换、加载到数据集市,作为数据分析、数据挖掘和流计算的基础 数据存储和管理,通过分布式文件系统、数仓、关系型数据库、NoSql数据库,对数据进行存储和管理 数据处理和分析,通过分布式计算框架,进行数据挖掘 阅读全文
posted @ 2020-08-22 17:30 Christbao 阅读(565) 评论(0) 推荐(0) 编辑
摘要: 我想过的100种暴富机会 年轻人想暴富,就是简单直接实现财富自由,但通过对比发现最快的暴富 世界上最公平的是时间,世界上最不公平的也是时间。 第一更:努力工作,拿股权 难度系数:★★★☆,特殊时期:★★★;特别案例:蚂蚁金服。 普通人需要做的是找对一艘船,跟对机会,只需要做好自己就能实现暴富。 点评 阅读全文
posted @ 2020-08-02 21:02 Christbao 阅读(269) 评论(0) 推荐(0) 编辑