hadoop - 随笔分类 - 伍点

hadoop项目之求出每年二月的最高气温（Combiner优化）

摘要：hadoop项目之求出每年二月的最高气温（Combiner优化）一、项目结构一、java实现随机生成日期和气温 package com.shujia.weather; import java.io.BufferedWriter; import java.io.FileWriter; import 阅读全文

posted @ 2022-08-30 21:16 伍点阅读(470) 评论(0) 推荐(0) 编辑

Hadoop-MapReduce

摘要：Hadoop-MapReduce 一、MapReduce设计理念 map >映射 reduce >归纳 mapreduce必须构建在hdfs之上的一种大数据离线计算框架在线：实时数据处理离线：数据处理时效性没有在线那么强，但是相对也需要很快得到结果 mapreduce不会马上得到结果，他阅读全文

posted @ 2022-08-28 20:37 伍点阅读(114) 评论(0) 推荐(0) 编辑

Hadoop HA(高可用)、脑裂、联邦机制详解

摘要：Hadoop HA(高可用) 一、hadoop1.x的问题 1.单点故障每个集群只有一个NameNode，NameNode存在单点故障（SPOF）如果该计算机或者NameNode进程不可用，那么整个集群在NameNode重启或在另一台计算机上启动之前不可用计划内的维护事件，例如NameNode 阅读全文

posted @ 2022-08-24 19:41 伍点阅读(1587) 评论(0) 推荐(0) 编辑

HDFS的读写流程——宏观与微观

摘要：HDFS的读写流程——宏观与微观 HDFS：分布式文件系统，负责存放数据分布式文件系统：就是将我们的数据放到多台电脑上存储。 **写数据：**就是将客户端上的数据上传到HDFS 宏观过程客户端向HDFS发送读写数据请求 hdfs dfs -put student.txt /shujia/ 客户端阅读全文

posted @ 2022-08-23 10:13 伍点阅读(169) 评论(0) 推荐(0) 编辑

Java操作HDFS

摘要：Java操作HDFS ```java import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.*; import org.apache.hadoop.fs.permission.FsPermission; im 阅读全文

posted @ 2022-08-22 23:23 伍点阅读(91) 评论(0) 推荐(0) 编辑

Hadoop的由来、Block切分、进程详解

摘要：Hadoop的由来、Block切分、进程详解一、hadoop的由来 Google发布了三篇论文: GFS(Google File System) MapReduce(数据计算方法) BigTable：Hbase Doug cutting 花费了两年的业余时间实现了前两篇论文，并重新命名为HDFS和阅读全文

posted @ 2022-08-22 20:03 伍点阅读(727) 评论(0) 推荐(2) 编辑

Hadoop搭建出现问题的强制解决办法

摘要：1、停止正在运行的集群 stop-all.sh 2、删除所有节点hadoop根目录中的tmp文件夹 3、在主节点（master）中hadoop的根目录中的bin目录下，重新格式化HDFS ./hdfs namenode -format 4、启动集群 start-all.sh 阅读全文

posted @ 2022-08-21 19:26 伍点阅读(53) 评论(0) 推荐(0) 编辑

Hadoop集群搭建的详细过程

摘要：Hadoop集群搭建一、准备三台虚拟机：master01，node1,node2 时间同步 1.date命令查看三台虚拟机时间是否一致 2.不一致时间同步：ntpdate ntp.aliyun.com 调整时区 cp /usr/share/zoneinfo/Asia/Shanghai /etc/ 阅读全文

posted @ 2022-08-21 17:42 伍点阅读(1268) 评论(0) 推荐(1) 编辑

bfy0221

随笔分类 - hadoop

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

推荐排行榜