摘要: ####1. 写在前面 flume-ng高可用长在大数据处理环节第一个出现,对于处理日志文件有很好的作用,本篇博客将详细介绍flume-ng的高可用负载均衡搭建 ####2. flume-ng高可用负载均衡描述 在一般情况下,Flume-ng高可用采用server和client模式,client主要 阅读全文
posted @ 2019-04-19 22:41 技术即艺术 阅读(999) 评论(0) 推荐(0) 编辑
摘要: 1. 写在前面 在利用flink实时计算的时候,往往会从kafka读取数据写入数据到kafka,但会发现当kafka多个Partitioner时,特别在P量级数据为了kafka的性能kafka的节点有十几个时,一个topic的Partitioner可能有几十个甚至更多,发现flink写入kafka的 阅读全文
posted @ 2019-04-19 21:46 技术即艺术 阅读(4255) 评论(0) 推荐(0) 编辑
摘要: 1. 写在前面 Flink被誉为第四代大数据计算引擎组件,即可以用作基于离线分布式计算,也可以应用于实时计算。Flink可以自己搭建集群模式已提供为庞大数据的计算。但在实际应用中。都是计算hdfs上的数据文件,所以更多的建立在基于hadoop集群,而hadoop集群的资源调度组件为yarn,所以Fl 阅读全文
posted @ 2019-03-20 20:42 技术即艺术 阅读(7314) 评论(0) 推荐(0) 编辑
摘要: 1. 写在前面 Flink被誉为第四代大数据计算引擎组件,即可以用作基于离线分布式计算,也可以应用于实时计算。Flink的核心是转化为流进行计算。Flink三个核心:Source,Transformation,Sink。其中Source即为Flink计算的数据源,Transformation即为进行 阅读全文
posted @ 2019-03-20 20:18 技术即艺术 阅读(11942) 评论(3) 推荐(2) 编辑
摘要: 1. 写在前面 在大数据实时计算方向,天猫双11的实时交易额是最具权威性的,当然技术架构也是相当复杂的,不是本篇博客的简单实现,因为天猫双11的数据是多维度多系统,实时粒度更微小的。当然在技术的总体架构上是相近的,主要的组件都是用到大数据实时计算组件Flink(当然阿里是用了基于Flink深度定制和 阅读全文
posted @ 2018-11-14 17:50 技术即艺术 阅读(3226) 评论(2) 推荐(0) 编辑
摘要: 1. 完成的场景 在很多大数据场景下,要求数据形成数据流的形式进行计算和存储。上篇博客介绍了Flink消费Kafka数据实现Wordcount计算,这篇博客需要完成的是将实时计算的结果写到redis。当kafka从其他端获取数据立刻到Flink计算,Flink计算完后结果写到Redis,整个过程就像 阅读全文
posted @ 2018-05-24 17:33 技术即艺术 阅读(25920) 评论(0) 推荐(2) 编辑
摘要: 1. Flink Flink介绍: Flink 是一个针对流数据和批数据的分布式处理引擎。它主要是由 Java 代码实现。目前主要还是依靠开源社区的贡献而发展。对 Flink 而言,其所要处理的主要场景就是流数据,批数据只是流数据的一个极限特例而已。再换句话说,Flink 会把所有任务当成流来处理, 阅读全文
posted @ 2018-05-11 16:54 技术即艺术 阅读(10716) 评论(0) 推荐(0) 编辑
摘要: 1. 了解各个组件的作用 Filebeat是一个日志文件托运工具,在你的服务器上安装客户端后,filebeat会监控日志目录或者指定的日志文件,追踪读取这些文件(追踪文件的变化,不停的读) Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据 Logstas 阅读全文
posted @ 2018-04-16 17:14 技术即艺术 阅读(23256) 评论(2) 推荐(1) 编辑
摘要: 1. 利用spring boot提供的工具(http://start.spring.io/)自动生成一个标准的spring boot项目架构 2. 因为这里我们是搭建spring boot+mybatis+quartz架构,故在pom.xml文件中配置相关依赖 3. spring boot的理念是做 阅读全文
posted @ 2017-11-21 10:33 技术即艺术 阅读(3571) 评论(1) 推荐(1) 编辑
摘要: 一般Hive依赖关系型数据库Mysql,故先安装Mysql 安装配置Hive 1. 配置环境变量 2. 配置Hive的基本信息 3. 编辑hive env.sh,为了方便,直接在最后加上以下信息: hive site.xml配置,这个文件较大,只配置name和以下对应的即可,其他信息可以不用管 这里 阅读全文
posted @ 2017-11-10 18:35 技术即艺术 阅读(757) 评论(0) 推荐(0) 编辑