摘要:
一、数据迁移使用场景 1.冷热集群数据同步、分类存储 2.整体数据整体搬迁 3.数据准实时同步(备份) 二、考量因素 1.网络传输带宽及时间,是否会影响现有业务 2.性能,单机?多线程?分布式? 3.是否正常增量同步 4.数据迁移的同步性(同步单位时间数据超过单位时间) 三、DistCp工具使用 3 阅读全文
摘要:
一、Hadoop 简介 1.1 Hadoop3核心组件 HDFS:分布式文件系统:解决海量数据存储 YARN:集群资源管理和任务调度框架:解决资源任务调度 MapReduce:分布式计算框架:解决海量数据计算 1.2 Hadoop集群简介 Hadoop集群包括两个集群:HDFS YARN 两个集群 阅读全文
摘要:
一、安装编译相关依赖 此篇文档及Hadoop相关文档相关软件包统一在此百度网盘: 链接:https://pan.baidu.com/s/11F4THdIfgrULMn2gNcObRA?pwd=cjll yum install snappy snappy-devel bzip2 bzip2-devel 阅读全文