CHANG_09

2022年6月30日

摘要：行列转换炸裂函数开窗函数模糊查询 MySQL中like模糊查询 like模糊查询，支持 % 和 _ 匹配 %：多个字符 _下划线：任意一个字符示例：查询名字中含有张的学生信息 select * from student where sname like ‘%张%’；查询名字中第二个字未知阅读全文

posted @ 2022-06-30 09:00 CHANG_09 阅读(36) 评论(0) 推荐(0)

2022年6月29日

Java 开发岗

摘要：字节职位职责：1、负责字节跳动大数据平台的权限、审计等安全产品规划与建设，包括态势感知、权限管理、隐私保护和访问控制等，满足安全监管需求；2、深入理解业务场景，与业务部门深度合作，设计架构并落地产品；3、追求**，探索数据安全治理的前沿方向，打造业内一流的数据治理产品体系；4、探索设计基于大数据、阅读全文

posted @ 2022-06-29 21:26 CHANG_09 阅读(82) 评论(0) 推荐(0)

Linux 环境使用 Python 编写 py 脚本

摘要：一安装 conda，类似于 maven , 安装 sh 插件, 模块 wget -c https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh chmod 777 Miniconda3-latest-Linux-x 阅读全文

posted @ 2022-06-29 21:19 CHANG_09 阅读(226) 评论(0) 推荐(0)

Flink 配置任务提交内存管理

摘要： flink-conf.yaml 如下： jobmanager.rpc.address: hadoop106 --jobManager 的IP地址 jobmanager.rpc.port: 6123 --jobManager 的端口，默认为6123 jobmanager.heap.mb: 1024M 阅读全文

posted @ 2022-06-29 11:01 CHANG_09 阅读(1167) 评论(1) 推荐(0)

2022年6月28日

Python 连接 mysql 并查询表数据

摘要： import pymysql as mysql con = mysql.connect(host="127.0.0.1",port=3306,user="root",passwd="root",db="aaa",charset="utf8") mycursor = con.cursor() prin 阅读全文

posted @ 2022-06-28 20:15 CHANG_09 阅读(400) 评论(0) 推荐(0)

大数据面试题V3.0 -- Flume面试题

摘要： Flume面试题（约0.5w字）介绍下Flume Flume架构 Flume有哪些Source 说下Flume事务机制介绍下Flume采集数据的原理？底层实现？ Flume如何保证数据的可靠性 Flume传输数据时如何保证数据一致性（可靠性） Flume拦截器如何监控消费型Flume的消费情况阅读全文

posted @ 2022-06-28 15:11 CHANG_09 阅读(107) 评论(0) 推荐(0)

大数据面试题V3.0 -- Hive面试题（约3.3w字）

摘要： Hive面试题（约3.3w字）说下为什么要使用Hive?Hive的优缺点?Hive的作用是什么? Hive是Hadoop生态系统中比不可少的一个工具，它提供了一种SQL(结构化查询语言)方言，可以查询存储在Hadoop分布式文件系统（HDFS）中的数据或其他和Hadoop集成的文件系统，如MapR 阅读全文

posted @ 2022-06-28 15:10 CHANG_09 阅读(448) 评论(0) 推荐(0)

大数据面试题V3.0 -- Zookeeper面试题

摘要： Zookeeper面试题（约2.6w字）介绍下Zookeeper是什么? Zookeeper有什么作用?优缺点?有什么应用场景? Zookeeper的选举策略，leader和follower的区别? 介绍下Zookeeper选举算法 Zookeeper的节点类型有哪些?分别作用是什么? Zooke 阅读全文

posted @ 2022-06-28 15:09 CHANG_09 阅读(83) 评论(0) 推荐(0)

大数据面试题V3.0 -- MapReduce部分

摘要： MapReduce部分介绍下MapReduce MapReduce优缺点 MapReduce架构 MapReduce工作原理 MapReduce哪个阶段最费时间 MapReduce中的Combine是干嘛的?有什么好外? MapReduce为什么一定要有环型缓冲区 MapReduce为什么一定要有阅读全文

posted @ 2022-06-28 15:09 CHANG_09 阅读(226) 评论(0) 推荐(0)

大数据面试题V3.0 -- HDFS部分

摘要： HDFS部分 HDFS文件写入和读取流程 HDFS组成架构介绍下HDFS，说下HDFS优缺点，以及使用场景 HDFS作用 HDFS的容错机制 HDFS的存储机制 HDFS的副本机制 HDFS的常见数据格式，列式存储格式和行存储格式异同点，列式存储优点有哪些? HDFS如何保证数据不丢失? HDFS 阅读全文

posted @ 2022-06-28 15:08 CHANG_09 阅读(194) 评论(0) 推荐(0)

公告