摘要: 1.mapreduce的定义 MapReduce是一个分布式运算程序的编程框架,是用户开发“基于Hadoop的数据分析应用”的核心框架; MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并运行在一个Hadoop集群上; 2.mapreduce的核心思 阅读全文
posted @ 2020-09-26 16:28 _蒲公英_ 阅读(824) 评论(0) 推荐(0) 编辑
摘要: 1.大量小文件影响 NameNode存储着文件系统的元数据,每个文件、目录、块大概有150字节的元数据,因此文件数量的限制也由NameNode内存大小决定,如果小文件过多则会造成NameNode的压力过大,且hdfs能存储的数据量也会变小 2.HAR文件方案 本质启动mr程序,需要启动yarn 用法 阅读全文
posted @ 2020-09-23 14:40 _蒲公英_ 阅读(369) 评论(0) 推荐(0) 编辑
摘要: 1.NameNode与secondaryNameNode解析 NameNode主要负责集群中的元数据信息管理,而且元数据信息进场需要随机访问,因为元数据信息必高效的检索,那么保证NameNode快速检索呢?如何保证元数据的持久安全呢? 为了元数据信息的快速检索,那么我们就必须将元数据存放在内存当中, 阅读全文
posted @ 2020-09-23 00:06 _蒲公英_ 阅读(536) 评论(0) 推荐(0) 编辑
摘要: 1.JVM虚拟机内存组成介绍 a)JVM内存划分为堆内存和非堆内存,堆内存分为年轻代(YoungGen)、老年代(OldGen),非堆内存就有一个永久代(PermGen) b)年轻代分为生成区(Eden)和生存区(Survivor),Survivor有FromSpace和ToSpace组成。Eden 阅读全文
posted @ 2020-09-22 16:42 _蒲公英_ 阅读(137) 评论(0) 推荐(0) 编辑
摘要: 1.jvm基本介绍 JVM是Java Virtual Machine(java虚拟机)的缩写,JVM是一种用于计算设备的规范,它是一个虚构出来的计算机,是通过在实际的计算机上仿真模拟各种计算机功能来实现的。 jvm是直接与操作系统进行交互的,与操作系统交互的结构如下: jvm是直接与操作系统进行交互 阅读全文
posted @ 2020-09-22 10:34 _蒲公英_ 阅读(464) 评论(0) 推荐(0) 编辑
摘要: 1.创建maven工程并导入jar包 jdk使用1.8、maven3.x版本 pom.xml添加一下内容 <repositories> <repository> <id>cloudera</id> <url>https://repository.cloudera.com/artifactory/cl 阅读全文
posted @ 2020-04-08 23:43 _蒲公英_ 阅读(403) 评论(0) 推荐(0) 编辑
摘要: 1.hdfs的架构以及block块和副本机制 hdfs分布式文件系统也是一个主从架构,主节点是我们的namenode,负责整个集群以及维护集群的元数据信息。从节点是datanode,主要负责文件数据存储。 hdfs将所有的文件全部抽象为block块来进行存储,不管文件大小,全部一视同仁都是以bloc 阅读全文
posted @ 2020-04-07 18:30 _蒲公英_ 阅读(188) 评论(0) 推荐(0) 编辑
摘要: 安全模式是hdfs所处的一种特殊状态,在这种状态下,文件系统只接受读数据的请求,而不接受删除修改等变更请求。在NameNode主节点启动时,HDFS首先进入安全模式,DataNode在启动的时候会向namenode汇报可用的block等状态,在整个系统达到安全标准时(最小副本数不小于99.9%,小于 阅读全文
posted @ 2020-04-06 23:49 _蒲公英_ 阅读(457) 评论(0) 推荐(0) 编辑
摘要: 1.shell的操作命令 hdfs命令有两种风格:hadoop fs、hdfs dfs 两种命令均可使用,效果相同。 1)查看子命令 hadoop fs、hdfs dfs 2)如果查看hdfs或hadoop子命令信息 hdfs dfs -help shellCmd hadoop fs -help s 阅读全文
posted @ 2020-04-06 23:14 _蒲公英_ 阅读(904) 评论(0) 推荐(0) 编辑
摘要: 软件版本:VMware Fusion 11.0.1 系统版本:MacOs 10.15.4 1.下载VMware Fusion 百度网盘下载地址 密码: 8dcd 2.安装并破解VM(商用请使用正版) a.双击下图文件 b.出现下图双击图标 c.出现下图点击打开 d.安装并输入激活码。 3.关闭自动更 阅读全文
posted @ 2020-04-04 17:37 _蒲公英_ 阅读(1709) 评论(0) 推荐(0) 编辑