伍点 - 博客园

2022年9月14日

摘要：数据仓库与hive hive——数据仓库建模工具之一一、数据库、数据仓库 1.1 数据库关系数据库本质上是一个二元关系，说的简单一些，就是一个二维表格，对普通人来说，最简单的理解就是一个Excel表格。这种数据库类型，具有结构化程度高，独立性强，冗余度低等等优点，一下子就促进了计算机的发展。 1 阅读全文

posted @ 2022-09-14 15:26 伍点阅读(223) 评论(0) 推荐(0) 编辑

2022年9月7日

Hive的基本知识与操作

摘要： Hive的基本知识与操作 Hive的基本概念 Hive本质是将SQL转换为MapReduce的任务进行运算，底层由HDFS来提供数据存储，说白了hive可以理解为一个将SQL转换为MapReduce的任务的工具，甚至更近一步说hive就是一个MapReduce客户端。为什么使用Hive? 如果直接阅读全文

posted @ 2022-09-07 21:38 伍点阅读(834) 评论(0) 推荐(0) 编辑

2022年8月30日

hadoop项目之求出每年二月的最高气温（Combiner优化）

摘要： hadoop项目之求出每年二月的最高气温（Combiner优化）一、项目结构一、java实现随机生成日期和气温 package com.shujia.weather; import java.io.BufferedWriter; import java.io.FileWriter; import 阅读全文

posted @ 2022-08-30 21:16 伍点阅读(470) 评论(0) 推荐(0) 编辑

2022年8月28日

Hadoop-MapReduce

摘要： Hadoop-MapReduce 一、MapReduce设计理念 map >映射 reduce >归纳 mapreduce必须构建在hdfs之上的一种大数据离线计算框架在线：实时数据处理离线：数据处理时效性没有在线那么强，但是相对也需要很快得到结果 mapreduce不会马上得到结果，他阅读全文

posted @ 2022-08-28 20:37 伍点阅读(112) 评论(0) 推荐(0) 编辑

2022年8月24日

Hadoop HA(高可用)、脑裂、联邦机制详解

摘要： Hadoop HA(高可用) 一、hadoop1.x的问题 1.单点故障每个集群只有一个NameNode，NameNode存在单点故障（SPOF）如果该计算机或者NameNode进程不可用，那么整个集群在NameNode重启或在另一台计算机上启动之前不可用计划内的维护事件，例如NameNode 阅读全文

posted @ 2022-08-24 19:41 伍点阅读(1566) 评论(0) 推荐(0) 编辑

2022年8月23日

HDFS的读写流程——宏观与微观

摘要： HDFS的读写流程——宏观与微观 HDFS：分布式文件系统，负责存放数据分布式文件系统：就是将我们的数据放到多台电脑上存储。 **写数据：**就是将客户端上的数据上传到HDFS 宏观过程客户端向HDFS发送读写数据请求 hdfs dfs -put student.txt /shujia/ 客户端阅读全文

posted @ 2022-08-23 10:13 伍点阅读(168) 评论(0) 推荐(0) 编辑

2022年8月22日

Java操作HDFS

摘要： Java操作HDFS ```java import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.*; import org.apache.hadoop.fs.permission.FsPermission; im 阅读全文

posted @ 2022-08-22 23:23 伍点阅读(91) 评论(0) 推荐(0) 编辑

Hadoop的由来、Block切分、进程详解

摘要： Hadoop的由来、Block切分、进程详解一、hadoop的由来 Google发布了三篇论文: GFS(Google File System) MapReduce(数据计算方法) BigTable：Hbase Doug cutting 花费了两年的业余时间实现了前两篇论文，并重新命名为HDFS和阅读全文

posted @ 2022-08-22 20:03 伍点阅读(723) 评论(0) 推荐(2) 编辑

2022年8月21日

Hadoop搭建出现问题的强制解决办法

摘要： 1、停止正在运行的集群 stop-all.sh 2、删除所有节点hadoop根目录中的tmp文件夹 3、在主节点（master）中hadoop的根目录中的bin目录下，重新格式化HDFS ./hdfs namenode -format 4、启动集群 start-all.sh 阅读全文

posted @ 2022-08-21 19:26 伍点阅读(53) 评论(0) 推荐(0) 编辑

Hadoop集群搭建的详细过程

摘要： Hadoop集群搭建一、准备三台虚拟机：master01，node1,node2 时间同步 1.date命令查看三台虚拟机时间是否一致 2.不一致时间同步：ntpdate ntp.aliyun.com 调整时区 cp /usr/share/zoneinfo/Asia/Shanghai /etc/ 阅读全文

posted @ 2022-08-21 17:42 伍点阅读(1267) 评论(0) 推荐(1) 编辑

bfy0221

公告