Spark优化
摘要:
意识篇 类型转换 优化前: val extractFields: Seq[Row] => Seq[(String, Int)] = { (rows: Seq[Row]) => { var fields = Seq[(String, Int)]() rows.map(row => { fields =
doris
摘要:
## doris ### Partition & Tablet - Partition 逻辑分区往往根据业务通过用户指定的分区列进行范围划分,可以视为逻辑上最小的管理单元,好比导入和删除操作就是partition。 - list partition ,不可被修改;所以一定程度上不存在线程安全问题,如果提供了可变成员变量,一定要注意线程安全问题。 AOP 面向切面编程,抽离公共行为与逻辑,与
微服务
摘要:
注册中心 Nacos和Eureka 共同点 都可以作为服务注册,服务拉取中心。 都有AP特性。 都支持服务提供者心跳方式做健康监测。 异同点 nacos可以做配置中心。 nacos可以支持服务提供者注册服务为非临时实例时: nacos为CP模式。 nacos会主动监测服务提供者是否存活。 nacos
mysql知识点
摘要:
慢查询 定位 借助第三方检测工具 SkyWalking 自研监控系统 mysql开启慢查询 开启慢查询可能会影响mysql服务器的性能,如果硬盘IO已经是瓶颈的话则影响更为明显。 建议做好以下设置: 控制日志最大大小 定时清理日志 使用其他监控工具 使用性能监控工具 arthas 分析 使用 exp
redis知识点
摘要:
redis知识点 场景类 缓存 缓存穿透 定义:大量查询业务不存在的key击穿redis,直接查询数据库. 解决方案: value null 实施:来一个这样的key,写入到缓存中,将其值设置为null。 缺点: 会缓存大量这样的内容,内存存在溢出可能。 后续如果有这样的业务key生成,则缓存中的数
JMM基础
摘要:
指令重排 volatile 防止指令重排(内存栅栏) 保证之前的指令一定能全部执行,之后的指令一定都没有执行。 实例化对象步骤:局部变量压栈-对象实例化-对象地址指向变量。 如果线程够多被调用够快由于本身jvm优化的原因,会出现,第二步和第三步的重排序现象,如果不对需要被多个线程高频次访问的成员变量
hbase知识点
摘要:
定义 Hbase 是一个分布式的、面向列的 NoSQL 数据库,是 Google BigTable 的开源实现,基于 Hadoop 和 Zookeeper 构建,可以提供海量结构化和半结构化数据的存储和随机访问。 NOSql和传统Sql的区别: 传统sql需要设计好结构化的建表语句,而NOSql不需