2019 年 4月 27 日随笔档案 - 王知无

2019年4月27日

摘要：戳更多文章： 1-Flink入门 2-本地环境搭建&构建第一个Flink应用 3-DataSet API 4-DataSteam API 5-集群部署 6-分布式缓存 7-重启策略 8-Flink中的窗口 9-Flink中的Time Flink时间戳和水印 Broadcast广播变量 FlinkTa 阅读全文

posted @ 2019-04-27 19:54 王知无阅读(928) 评论(0) 推荐(0) 编辑

Flink从入门到放弃(入门篇1)-Flink是什么

posted @ 2019-04-27 19:54 王知无阅读(3245) 评论(0) 推荐(0) 编辑

Flink从入门到放弃(入门篇3)-DataSetAPI

posted @ 2019-04-27 19:53 王知无阅读(2312) 评论(0) 推荐(0) 编辑

Flink从入门到放弃(入门篇4) DataStreamAPI

posted @ 2019-04-27 19:52 王知无阅读(1490) 评论(0) 推荐(0) 编辑

Flink重启策略

posted @ 2019-04-27 19:51 王知无阅读(930) 评论(0) 推荐(0) 编辑

Flink中的Time

posted @ 2019-04-27 19:50 王知无阅读(445) 评论(0) 推荐(0) 编辑

Flink的分布式缓存

摘要：分布式缓存 Flink提供了一个分布式缓存，类似于hadoop，可以使用户在并行函数中很方便的读取本地文件，并把它放在taskmanager节点中，防止task重复拉取。此缓存的工作机制如下：程序注册一个文件或者目录(本地或者远程文件系统，例如hdfs或者s3)，通过ExecutionEnviron 阅读全文

posted @ 2019-04-27 19:50 王知无阅读(3353) 评论(0) 推荐(0) 编辑

8-Flink中的窗口

posted @ 2019-04-27 19:49 王知无阅读(1152) 评论(0) 推荐(0) 编辑

10-Flink集群的高可用(搭建篇补充)

posted @ 2019-04-27 19:48 王知无阅读(2353) 评论(1) 推荐(0) 编辑

Flink-Kafka-Connector Flink结合Kafka实战

posted @ 2019-04-27 19:47 王知无阅读(28023) 评论(0) 推荐(0) 编辑

15-Flink实战项目之实时热销排行

posted @ 2019-04-27 19:45 王知无阅读(1045) 评论(0) 推荐(0) 编辑

16-Flink-Redis-Sink

posted @ 2019-04-27 19:44 王知无阅读(1753) 评论(0) 推荐(0) 编辑

17-Flink消费Kafka写入Mysql

posted @ 2019-04-27 19:43 王知无阅读(4251) 评论(2) 推荐(0) 编辑

分布式文件系统-HDFS

摘要：从RAID说起大数据技术主要要解决的问题的是大规模数据的计算处理问题，那么首先要解决的就是大规模数据的存储问题。大规模数据存储要解决的核心问题有三个方面：数据存储容量的问题，既然大数据要解决的是数以PB计的数据计算问题，而一般的服务器磁盘容量通常1-2TB，那么如何存储这么大规模的数据。数据读阅读全文

posted @ 2019-04-27 19:40 王知无阅读(425) 评论(0) 推荐(0) 编辑

一文读懂MapReduce

摘要： Hadoop解决大规模数据分布式计算的方案是MapReduce。MapReduce既是一个编程模型，又是一个计算框架。也就是说，开发人员必须基于MapReduce编程模型进行编程开发，然后将程序通过MapReduce计算框架分发到Hadoop集群中运行。我们先看一下作为编程模型的MapReduce。阅读全文

posted @ 2019-04-27 19:39 王知无阅读(343) 评论(0) 推荐(0) 编辑

HBase学习——4.HBase过滤器

摘要： 1.过滤器基础API中的查询操作在面对大量数据的时候是非常苍白的，这里Hbase提供了高级的查询方法：Filter。Filter可以根据簇、列、版本等更多的条件来对数据进行过滤，基于Hbase本身提供的三维有序（主键有序、列有序、版本有序），这些Filter可以高效的完成查询过滤的任务。带有Fil 阅读全文

posted @ 2019-04-27 19:36 王知无阅读(306) 评论(0) 推荐(0) 编辑

HBase学习——3.HBase表设计

摘要： 1.建表高级属性建表过程中常用的shell命令 1.1 BLOOMFILTER 默认是 NONE 是否使用布隆过虑及使用何种方式，布隆过滤可以每列族单独启用使用HColumnDescriptor.setBloomFilterType(NONE|ROW|ROWCOL)对列族单独启用布隆 - Def 阅读全文

posted @ 2019-04-27 19:35 王知无阅读(486) 评论(0) 推荐(0) 编辑

HBase学习-HBase原理

摘要： 1.系统架构 1.1 图解从HBase的架构图上可以看出，HBase中的组件包括Client、Zookeeper、HMaster、HRegionServer、HRegion、Store、MemStore、StoreFile、HFile、HLog等，每一个 RegionServer 就只有一个 HL 阅读全文

posted @ 2019-04-27 19:34 王知无阅读(448) 评论(0) 推荐(0) 编辑

HBase学习笔记

摘要：最近在学习HBase先关的知识，顺便做一下笔记，以加深知识的了解和掌握。 Hbase常用工具文件检测修复工具 hbase hbck -help 常用选项： -details 显示所有region检查的完整报告 -summary 输出表和状态的总结信息 -metaonly 只检查-ROOT-和.ME 阅读全文

posted @ 2019-04-27 19:33 王知无阅读(444) 评论(0) 推荐(0) 编辑

王知无

公告