独孤风 - 博客园

2019年12月11日

摘要： flink是一款开源的大数据流式处理框架，他可以同时批处理和流处理，具有容错性、高吞吐、低延迟等优势，本文简述flink在windows和linux中安装步骤，和示例程序的运行，包括本地调试环境，集群环境。另外介绍Flink的开发工程的构建。首先要想运行Flink，我们需要下载并解压Flink的二阅读全文

posted @ 2019-12-11 09:17 独孤风阅读(1557) 评论(0) 推荐(1)

2019年12月10日

Flink入门（二）——Flink架构介绍

摘要： 1、基本组件栈了解Spark的朋友会发现Flink的架构和Spark是非常类似的，在整个软件架构体系中，同样遵循着分层的架构设计理念，在降低系统耦合度的同时，也为上层用户构建Flink应用提供了丰富且友好的接口。 Flink分为架构分为三层，由上往下依次是API&Libraries层、Runtim 阅读全文

posted @ 2019-12-10 09:02 独孤风阅读(1976) 评论(0) 推荐(0)

2019年11月26日

「漏洞预警」Apache Flink 任意 Jar 包上传导致远程代码执行漏洞复现

摘要：漏洞描述 Apache Flink是一个用于分布式流和批处理数据的开放源码平台。Flink的核心是一个流数据流引擎，它为数据流上的分布式计算提供数据分发、通信和容错功能。Flink在流引擎之上构建批处理，覆盖本地迭代支持、托管内存和程序优化。近日有安全研究人员发现apache flink允许上传任意阅读全文

posted @ 2019-11-26 09:25 独孤风阅读(1231) 评论(0) 推荐(0)

2019年11月22日

数据治理的王者——Apache Atlas

摘要：一、Atlas是什么？在当今大数据的应用越来越广泛的情况下，数据治理一直是企业面临的巨大问题。大部分公司只是单纯的对数据进行了处理，而数据的血缘，分类等等却很难实现，市场上也急需要一个专注于数据治理的技术框架，这时Atlas应运而生。 Atlas官网地址：https://atlas.apache 阅读全文

posted @ 2019-11-22 11:03 独孤风阅读(3131) 评论(0) 推荐(0)

2019年11月18日

Flink入门（一）——Apache Flink介绍

摘要： Apache Flink是什么？在当代数据量激增的时代，各种业务场景都有大量的业务数据产生，对于这些不断产生的数据应该如何进行有效的处理，成为当下大多数公司所面临的问题。随着雅虎对hadoop的开源，越来越多的大数据处理技术开始涌入人们的视线，例如目前比较流行的大数据处理引擎Apache Sp 阅读全文

posted @ 2019-11-18 10:20 独孤风阅读(863) 评论(0) 推荐(1)

2019年11月11日

ES入门宝典（详细截图版）

摘要：本文使用版本基于elasticsearch-6.4.0 1、什么是ES？官网： https://www.elastic.co/products/elasticsearch 中文官网：https://www.elastic.co/cn/products/elasticsearch ES是一个全文检索阅读全文

posted @ 2019-11-11 09:49 独孤风阅读(1556) 评论(0) 推荐(0)

2019年10月21日

什么是全文检索

摘要：全文检索技术被广泛的应用于搜索引擎，查询检索等领域。我们在网络上的大部分搜索服务都用到了全文检索技术。对于数据量大、数据结构不固定的数据可采用全文检索方式搜索，比如百度、Google等搜索引擎、论坛站内搜索、电商网站站内搜索等。什么是全文检索呢？先看一下百度百科的专业定义。为了能更好的理解，我阅读全文

posted @ 2019-10-21 09:47 独孤风阅读(5073) 评论(0) 推荐(2)

2019年10月14日

Hbase入门(五)——客户端（Java，Shell，Thrift，Rest，MR，WebUI）

摘要： Hbase的客户端有原生java客户端，Hbase Shell，Thrift，Rest，Mapreduce，WebUI等等。下面是这几种客户端的常见用法。一、原生Java客户端原生java客户端是hbase最主要，最高效的客户端。涵盖了增删改查等API，还实现了创建，删除，修改表等DDL操作阅读全文

posted @ 2019-10-14 10:44 独孤风阅读(1835) 评论(0) 推荐(0)

2019年10月8日

Hbase入门(四)——表结构设计-RowKey

摘要： Hbase的表结构设计与关系型数据库有很多不同，主要是Hbase有Rowkey和列族、timestamp这几个全新的概念，如何设计表结构就非常的重要。创建 Hbase就是通过表 Rowkey 列族 timestamp确定一行数据。这与关系型数据库完全不同：属性 HBase RDBMS 数据类阅读全文

posted @ 2019-10-08 10:28 独孤风阅读(1974) 评论(0) 推荐(1)

2019年9月30日

Hbase入门(三)——数据模型

摘要： Hbase最核心但也是最难理解的就是数据模型，由于与传统的关系型数据库不同，虽然Hbase也有表（Table），也有行（Row）和列（Column），但是与关系型数据库不同的是Hbase有一个列族（Column Family）的概念，它将一列或者多列组织在一起，HBase必须属于某一个列族。行和列阅读全文

posted @ 2019-09-30 09:39 独孤风阅读(1525) 评论(0) 推荐(1)

大数据流动

公众号大数据流动。追随大数据的流动，专注于大数据相关技术。相关学习交流群已经成立，欢迎加入~

公告

大数据流动

公众号 大数据流动。 追随大数据的流动，专注于大数据相关技术。 相关学习交流群已经成立，欢迎加入~

公告

公众号大数据流动。追随大数据的流动，专注于大数据相关技术。相关学习交流群已经成立，欢迎加入~