随笔分类 - 大数据
摘要:azkaban 1、B站尚硅谷视频的学习笔记 https://blog.csdn.net/qq_35128600/article/details/104848294 大数据博客好文 hive函数 Hive函数详解与案列实战 https://blog.51cto.com/u_10312890/2469
阅读全文
摘要:1. MapReduce 介绍 1.1. MapReduce 设计构思和框架结构 3. WordCount 需求: 在一堆给定的文本文件中统计输出每一个单词出现的总次数 4. MapReduce 运行模式 yarn jar hadoop_hdfs_operate‐1.0‐SNAPSHOT.jar c
阅读全文
摘要:Hadoop 02 核心介绍 1. HDFS HDFS(Hadoop Distributed File System) 是一个 Apache Software Foundation 项目, 是 Apache Hadoop 项目的一个子项目. Hadoop 非常适于存储大型数据 (比如 TB 和 PB
阅读全文
摘要:Hadoop01-入门&集群环境搭建 今日内容 Hadoop的介绍 集群环境搭建准备工作 Linux命令和Shell脚本增强 集群环境搭建 大数据概述 大数据: 就是对海量数据进行分析处理,得到一些有价值的信息,然后帮助企业做出判断和决策. 处理流程: 1:获取数据
阅读全文
摘要:1 概述 MQ(Message Queue)消息队列,是一种用来保存消息数据的队列 队列:数据结构的一种,特征为 “先进先出” 2.MQ 的作用 应用解耦(技术上必须弄好才能使用MQ ) 快速应用变更维护 流量削锋(削峰填谷) 3.MQ的优缺点 缺点: 1系统可用性降低: 集群 2系统复杂度
阅读全文