摘要:
行列转换 炸裂函数 开窗函数 模糊查询 MySQL中like模糊查询 like模糊查询,支持 % 和 _ 匹配 %:多个字符 _下划线:任意一个字符 示例: 查询名字中含有张的学生信息 select * from student where sname like ‘%张%’; 查询名字中第二个字未知 阅读全文
摘要:
字节 职位职责:1、负责字节跳动大数据平台的权限、审计等安全产品规划与建设,包括态势感知、权限管理、隐私保护和访问控制等,满足安全监管需求;2、深入理解业务场景,与业务部门深度合作,设计架构并落地产品;3、追求**,探索数据安全治理的前沿方向,打造业内一流的数据治理产品体系;4、探索设计基于大数据、 阅读全文
摘要:
一 安装 conda, 类似于 maven , 安装 sh 插件, 模块 wget -c https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh chmod 777 Miniconda3-latest-Linux-x 阅读全文
摘要:
flink-conf.yaml 如下: jobmanager.rpc.address: hadoop106 --jobManager 的IP地址 jobmanager.rpc.port: 6123 --jobManager 的端口,默认为6123 jobmanager.heap.mb: 1024M 阅读全文
摘要:
import pymysql as mysql con = mysql.connect(host="127.0.0.1",port=3306,user="root",passwd="root",db="aaa",charset="utf8") mycursor = con.cursor() prin 阅读全文
摘要:
Flume面试题(约0.5w字) 介绍下Flume Flume架构 Flume有哪些Source 说下Flume事务机制 介绍下Flume采集数据的原理?底层实现? Flume如何保证数据的可靠性 Flume传输数据时如何保证数据一致性(可靠性) Flume拦截器 如何监控消费型Flume的消费情况 阅读全文
摘要:
Hive面试题(约3.3w字) 说下为什么要使用Hive?Hive的优缺点?Hive的作用是什么? Hive是Hadoop生态系统中比不可少的一个工具,它提供了一种SQL(结构化查询语言)方言,可以查询存储在Hadoop分布式文件系统(HDFS)中的数据或其他和Hadoop集成的文件系统,如MapR 阅读全文
摘要:
MapReduce部分 介绍下MapReduce MapReduce优缺点 MapReduce架构 MapReduce工作原理 MapReduce哪个阶段最费时间 MapReduce中的Combine是干嘛的?有什么好外? MapReduce为什么一定要有环型缓冲区 MapReduce为什么一定要有 阅读全文
摘要:
Zookeeper面试题(约2.6w字) 介绍下Zookeeper是什么? Zookeeper有什么作用?优缺点?有什么应用场景? Zookeeper的选举策略,leader和follower的区别? 介绍下Zookeeper选举算法 Zookeeper的节点类型有哪些?分别作用是什么? Zooke 阅读全文
摘要:
HDFS部分 HDFS文件写入和读取流程 HDFS组成架构 介绍下HDFS,说下HDFS优缺点,以及使用场景 HDFS作用 HDFS的容错机制 HDFS的存储机制 HDFS的副本机制 HDFS的常见数据格式,列式存储格式和行存储格式异同点,列式存储优点有哪些? HDFS如何保证数据不丢失? HDFS 阅读全文