摘要: 一、工作机制 1、原理 NameNode元数据储存在内存中,存在断电及消失的特性,因此产生磁盘备份元数据FsImage,但是当NameNode元数据更新时,若要时刻备份元数据到FsImage,效率会低下,因此使用Edites文件,当元数据更新时,对Edits文件进行追加操作,当发生断电时,FsIma 阅读全文
posted @ 2020-08-31 22:47 市丸银 阅读(197) 评论(0) 推荐(0) 编辑
摘要: 1、网络拓扑-节点距离计算 节点距离:两个节点到达最近的共同祖先的距离总和(一条线的长度为1) 2、机架感知-副本储存节点选择 当副本为三个时: 本地机架上的一个节点 本地机架上的另一个节点 不同机架的不同节点 3、读写数据流 1)、读 (fs)向NameNode请求读取文件 -> NameNode 阅读全文
posted @ 2020-08-31 21:12 市丸银 阅读(163) 评论(0) 推荐(0) 编辑
摘要: 一、IO流文件上传 @Test public void testIOPut() throws URISyntaxException, IOException, InterruptedException { // 1. 获取对象 Configuration conf = new Configurati 阅读全文
posted @ 2020-08-31 19:20 市丸银 阅读(198) 评论(0) 推荐(0) 编辑
摘要: 一、HDFS 文件上传 @Test public void testCopyFromLocal() throws URISyntaxException, IOException, InterruptedException { // 1. 获取 fs 对象 Configuration conf = n 阅读全文
posted @ 2020-08-31 12:00 市丸银 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 前提:安装windows Hadoop 一、IDEA IntelliJ IDEA 二、搭建 1、创建maven项目 2、导入依赖 <dependencies> <dependency> <groupId>junit</groupId> <artifactId>junit</artifactId> < 阅读全文
posted @ 2020-08-31 09:28 市丸银 阅读(175) 评论(0) 推荐(0) 编辑
摘要: 1、安装配置JDK 2、安装Cygwin 参考:https://www.cnblogs.com/feipeng8848/p/8555648.html 3、安装hadoop https://blog.csdn.net/qq_35535690/article/details/81976032 阅读全文
posted @ 2020-08-31 09:04 市丸银 阅读(536) 评论(0) 推荐(0) 编辑