2022 年 10月随笔档案 - Kotlin

ClickHouse(二)优化

摘要：ClickHouse优化执行计划 AST(语法树)、SYNTAX(优化后的SQL语句)、PIPELINE(查看PIPELINE计划，可看线程数) 建表优化数据类型优化：1.限定好数据类型 2.使用空值会对性能产生负面影响分区索引优化：1.分区按照天分区(一亿分区) 2.order by(就是索阅读全文

posted @ 2022-10-21 20:30 Kotlin 阅读(369) 评论(0) 推荐(0) 编辑

ClickHouse(一)概念、基础

摘要：ClickHouse概念 ClickHouse概述 1.列式是数据库 2.在线分析处理(OLAP) 3.底层是C++编写多样化引擎、数据分区/线程级并行(耗CPU)、顺序读写。适用于固定宽表查询单表查询擅长，多表关联查询不擅长。 ClickHouse数据类型 Int：Int8、Int16、Int 阅读全文

posted @ 2022-10-21 20:25 Kotlin 阅读(57) 评论(0) 推荐(0) 编辑

Kylin

摘要：Kylin Kylin基础概念即席查询工具，多为分析工具，OLAP(在线分析处理) Cube：多个维度组合进行随机数据聚合的其中一个组合。 REST Server：是一套面向应用程序的开发接口，提供了包括查询、触发cube、获取元数据等查询引擎：获取并解析用户的查询，将结果返回，spark作为查阅读全文

posted @ 2022-10-20 21:22 Kotlin 阅读(168) 评论(0) 推荐(0) 编辑

DolphinScheduler

摘要：DolphinScheduler 功能介绍文档：https://dolphinscheduler.apache.org/en-us/docs/latest/user_doc/guide/metrics/metrics.html 租户：worker.properties worker.tentant 阅读全文

posted @ 2022-10-20 14:31 Kotlin 阅读(496) 评论(0) 推荐(0) 编辑

Airflow

摘要：Airflow 文档地址：https://airflow.apache.org/docs/apache-airflow/stable/index.html 动态任务 def taskList(task_conf,batch_size): task = BashOperator( task_id='' 阅读全文

posted @ 2022-10-19 19:53 Kotlin 阅读(177) 评论(0) 推荐(0) 编辑

Flink-CDC

摘要：flink-cdc flink-cdc 概述 flink-cdc 文档地址：https://ververica.github.io/flink-cdc-connectors/master/content/about.html# 依赖 <dependency> <groupId>io.netty</g 阅读全文

posted @ 2022-10-19 19:34 Kotlin 阅读(393) 评论(0) 推荐(0) 编辑

DeBezium

摘要：DeBezium DeBezium简介 DeBezium：功能远远强大与canal、maxwell。构建与kafka之上。优点：1.处理大容量的数据 2.监控多种数据库：mysql、MongoDB、PostgreSQL、 SQL Server。canal、maxwell限于(mysql) 方式一：阅读全文

posted @ 2022-10-19 15:52 Kotlin 阅读(798) 评论(0) 推荐(0) 编辑

Maxwell

摘要：Maxwell Maxwell介绍 Maxwell：实时读取mysql的Binlog，生成json格式的消息，发送给kafka、redis等下载地址：https://github.com/zendesk/maxwell/releases/download/v1.29.2/maxwell-1.29. 阅读全文

posted @ 2022-10-19 09:18 Kotlin 阅读(466) 评论(0) 推荐(0) 编辑

Canal

摘要：Canal Canal介绍功能：通过读取Mysql的Binlog，实时采集数据库数据的变化写到消息队列。原理：将自己伪装成Slave，假装从Master复制数据使用场景：1.异地数据库之间的同步 2.更新缓存，读取主库更新，在缓存服务器中更新 3.实时更新文档地址：https://githu 阅读全文

posted @ 2022-10-18 23:11 Kotlin 阅读(144) 评论(0) 推荐(0) 编辑

datax使用及优化

摘要：datax概述 datax定位：离线同步工具 datax优势： 1.单进程多线程，单机压力大 2.理论上可以打满带宽链接文档链接：https://github.com/alibaba/DataX 下载地址：https://datax-opensource.oss-cn-hangzhou.aliy 阅读全文

posted @ 2022-10-18 11:55 Kotlin 阅读(2481) 评论(0) 推荐(0) 编辑

kafka（三）调优

摘要：kafka局部调优 kafka常用命令 cd /opt/kafka/kafka/bin/ ##启动ZK ./zookeeper-server-start.sh -daemon /opt/kafka/kafka/config/zookeeper.properties ##启动kafka ./kafka 阅读全文

posted @ 2022-10-17 20:37 Kotlin 阅读(119) 评论(0) 推荐(0) 编辑

kafka（二）理论

摘要：kafka理论消息队列作用、模式作用：1.消峰 2.解耦 3.异步通信模式：1.点对点模式(删除对应的消息，只有一个消费者) 2.发布订阅模式(不删除数据消费者相互独立可以多个消费者) kafka中概念 Producer(生产者) 分区(一个topic分为多个分区，) Consumer(消阅读全文

posted @ 2022-10-17 20:26 Kotlin 阅读(94) 评论(0) 推荐(0) 编辑

kafka（一）代码

摘要：生产者生产者异步发送 import java.util import java.util.{Properties, UUID} import org.apache.kafka.clients.producer.{Callback, KafkaProducer, Partitioner, Produ 阅读全文

posted @ 2022-10-17 20:13 Kotlin 阅读(124) 评论(0) 推荐(0) 编辑

Flink 优化(七)

摘要：内存 1.taskmanager.memory.jvm-overhead.fraction 0.1 JVM开销线程堆栈、IO、编译、缓存等进程总大小*当前 taskmanager.memory.jvm-overhead.min 192m taskmanager.memory.jvm-overhea 阅读全文

posted @ 2022-10-14 17:07 Kotlin 阅读(146) 评论(0) 推荐(0) 编辑

Flink Table Sql(六)

摘要：基础代码环境信息 sql-client.sh 启动 SQL 客户端 CREATE TABLE employee_information (emp_id INT,name VARCHAR,dept_id INT) WITH ('connector' = 'filesystem','path' = ' 阅读全文

posted @ 2022-10-14 17:02 Kotlin 阅读(258) 评论(0) 推荐(0) 编辑

Flink Table Api(五)

摘要：基础代码环境信息 //table api flink三层API(processfunction api/datastream api/sql table api) import org.apache.flink.streaming.api.scala.StreamExecutionEnvironm 阅读全文

posted @ 2022-10-14 16:41 Kotlin 阅读(236) 评论(0) 推荐(0) 编辑

Flink DataStream Sink(四)

摘要：Flink DataStream Sink(四) 文档：https://bahir.apache.org/docs/flink/current/flink-streaming-redis/ https://nightlies.apache.org/flink/flink-docs-release-1 阅读全文

posted @ 2022-10-11 15:22 Kotlin 阅读(275) 评论(0) 推荐(0) 编辑

Flink DataStream Transform(三)

摘要：Flink DataStream Transform(三) 环境变量 import org.apache.flink.api.scala.ExecutionEnvironment val env = ExecutionEnvironment.getExecutionEnvironment;//批处理阅读全文

posted @ 2022-10-10 20:03 Kotlin 阅读(92) 评论(0) 推荐(0) 编辑

Kotlin

10 2022 档案

公告

最新随笔

随笔分类

随笔档案