上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 67 下一页
摘要: 一、工作机制 1、原理 NameNode元数据储存在内存中,存在断电及消失的特性,因此产生磁盘备份元数据FsImage,但是当NameNode元数据更新时,若要时刻备份元数据到FsImage,效率会低下,因此使用Edites文件,当元数据更新时,对Edits文件进行追加操作,当发生断电时,FsIma 阅读全文
posted @ 2020-08-31 22:47 市丸银 阅读(189) 评论(0) 推荐(0) 编辑
摘要: 1、网络拓扑-节点距离计算 节点距离:两个节点到达最近的共同祖先的距离总和(一条线的长度为1) 2、机架感知-副本储存节点选择 当副本为三个时: 本地机架上的一个节点 本地机架上的另一个节点 不同机架的不同节点 3、读写数据流 1)、读 (fs)向NameNode请求读取文件 -> NameNode 阅读全文
posted @ 2020-08-31 21:12 市丸银 阅读(156) 评论(0) 推荐(0) 编辑
摘要: 一、IO流文件上传 @Test public void testIOPut() throws URISyntaxException, IOException, InterruptedException { // 1. 获取对象 Configuration conf = new Configurati 阅读全文
posted @ 2020-08-31 19:20 市丸银 阅读(196) 评论(0) 推荐(0) 编辑
摘要: 一、HDFS 文件上传 @Test public void testCopyFromLocal() throws URISyntaxException, IOException, InterruptedException { // 1. 获取 fs 对象 Configuration conf = n 阅读全文
posted @ 2020-08-31 12:00 市丸银 阅读(172) 评论(0) 推荐(0) 编辑
摘要: 前提:安装windows Hadoop 一、IDEA IntelliJ IDEA 二、搭建 1、创建maven项目 2、导入依赖 <dependencies> <dependency> <groupId>junit</groupId> <artifactId>junit</artifactId> < 阅读全文
posted @ 2020-08-31 09:28 市丸银 阅读(173) 评论(0) 推荐(0) 编辑
摘要: 1、安装配置JDK 2、安装Cygwin 参考:https://www.cnblogs.com/feipeng8848/p/8555648.html 3、安装hadoop https://blog.csdn.net/qq_35535690/article/details/81976032 阅读全文
posted @ 2020-08-31 09:04 市丸银 阅读(534) 评论(0) 推荐(0) 编辑
摘要: 一、格式 1、父类 bin/hadoop fs 命令 2、子类 bin/hdfs dfs 命令 二、命令 1、help 作用:获取帮助文档格式:hadoop fs -help 命令名称 2、ls 作用:查看HDFS路径的文件 格式: hadoop fs -ls 路径 hadoop fs -ls -R 阅读全文
posted @ 2020-08-30 13:35 市丸银 阅读(489) 评论(0) 推荐(0) 编辑
摘要: 一、优缺点 A、优点 1、高容错性 默认开启三个副本 2、适合处理大数据 3、廉价 B、缺点 1、速度慢,不适合低延迟的数据访问 2、无法高效的对大量小文件进行存储,小文件占用 NameNode 3、不支持并发写入,只支持append(追加) HDFS块的大小设置主要取决于磁盘传输速率(机器性能) 阅读全文
posted @ 2020-08-30 11:02 市丸银 阅读(79) 评论(0) 推荐(0) 编辑
摘要: 官方地址:https://mirrors.tuna.tsinghua.edu.cn/help/centos/ 前提:连接外网 1、copy sudo cp /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.bak 阅读全文
posted @ 2020-08-29 22:19 市丸银 阅读(2029) 评论(0) 推荐(0) 编辑
摘要: 一、crond 系统定时任务 1、启动服务 service crond start 2、crontab基本语法 * * * * * 分 时 日 月 星期(0-7)0和 7代表 星期日 特殊符号 * 代表任意时间 , 代表不连续的时间 - 代表连续的时间 */n 代表每隔多久执行一次 二、集群时间同步 阅读全文
posted @ 2020-08-29 22:08 市丸银 阅读(306) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 67 下一页