Fork me on GitHub
上一页 1 2 3 4 5 6 7 8 9 10 ··· 31 下一页
摘要: 状态后端(State Backends) 每传入一条数据,有状态的算子任务都会读取和更新状态; 由于有效的状态访问对于处理数据的低延迟至关重要,因此每个并行任务都会在本地内存维护其状态,以确保快速的状态访问。 状态的存储、访问以及维护,由一个可插入的组件决定,这个组件就叫做状态后端(State Ba 阅读全文
posted @ 2020-03-23 23:39 kris12 阅读(4321) 评论(0) 推荐(0) 编辑
摘要: Atlas概述 Apache Atlas为组织提供开放式元数据管理和治理功能,用以构建其数据资产目录,对这些资产进行分类和管理,并为数据分析师和数据治理团队,提供围绕这些数据资产的协作功能。 Atlas架构原理 Atlas安装及使用 1)Atlas官网地址:https://atlas.apache. 阅读全文
posted @ 2020-02-07 21:19 kris12 阅读(7544) 评论(1) 推荐(1) 编辑
摘要: Table API与SQL Table API是流处理和批处理通用的关系型API,Table API可以基于流输入或者批输入来运行而不需要进行任何修改。 Table API是SQL语言的超集并专门为Apache Flink设计的,Table API是Scala 和Java语言集成式的API。与常规S 阅读全文
posted @ 2020-01-31 22:27 kris12 阅读(543) 评论(0) 推荐(0) 编辑
摘要: Druid是一个快速的列式分布式的支持实时分析的数据存储系统,在处理PB级别数据、毫秒级查询、数据实时处理方面,比传统的OLAP系统有了显著的性能改进。 Druid数据结构 与Druid架构相辅相成的是其基于DataSource与Segment的数据结构,它们共同成就了Druid的高性能优势。 Dr 阅读全文
posted @ 2020-01-30 10:20 kris12 阅读(1250) 评论(0) 推荐(0) 编辑
摘要: Presto Presto是一个开源的分布式SQL查询引擎,数据量支持GB到PB字节,主要用来处理秒级查询的场景。 虽presto可以解析SQL,但它不是一个标准的数据库,不是MySQL、Oracle的代替品,也不能用来处理在线事务(OLTP); Presto、Impala性能比较 测试结论:Imp 阅读全文
posted @ 2020-01-09 23:36 kris12 阅读(1951) 评论(0) 推荐(0) 编辑
摘要: 简介 Linux中,周期执行的任务一般由cron这个守护进程来处理 ps -ef | grep cron cron读取一个或多个配置文件,这些配置文件中包含了命令行及其调用时间。 cron的配置文件称为“crontab”,是“cron table”的简写。 1、/var/spool/cron/ 这个 阅读全文
posted @ 2020-01-02 11:16 kris12 阅读(360) 评论(0) 推荐(0) 编辑
摘要: 1. Window概述 一般真实的流都是无界的,怎么处理无界的数据?可以把无限的数据流进行切分,得到有限的数据集进行处理 也就是得到有界流。 streaming流式计算是一种被设计用于处理无限数据集的数据处理引擎,而无限数据集是指一种不断增长的本质上无限的数据集; 而window是把无限数据流为有限 阅读全文
posted @ 2019-12-31 11:12 kris12 阅读(1352) 评论(0) 推荐(0) 编辑
摘要: 夜间多个任务同时并行,总有几个随机性有任务失败,查看日志: 刷选关键词 Caused by 或者 FAILED cat -n ads_channel.log |grep "Caused by" 7732 Caused by: java.util.concurrent.ExecutionExcepti 阅读全文
posted @ 2019-12-21 11:38 kris12 阅读(1059) 评论(0) 推荐(0) 编辑
摘要: 概述 Maxwell是一个能实时读取MySQL二进制日志binlog,并生成 JSON 格式的消息,作为生产者发送给 Kafka,Kinesis、RabbitMQ、Redis、Google Cloud Pub/Sub、文件或其它平台的应用程序。它的常见应用场景有ETL、维护缓存、收集表级别的dml指 阅读全文
posted @ 2019-12-19 19:47 kris12 阅读(4286) 评论(2) 推荐(2) 编辑
摘要: 调优 Hive提供三种可以改变环境变量的方法,分别是: (1)修改${HIVE_HOME}/conf/hive-site.xml配置文件; 所有的默认配置都在${HIVE_HOME}/conf/hive-default.xml文件中,如果需要对默认的配置进行修改,可以创建一个hive-site.xm 阅读全文
posted @ 2019-12-09 18:39 kris12 阅读(858) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 31 下一页
levels of contents