上一页 1 ··· 13 14 15 16 17 18 19 20 21 ··· 24 下一页
摘要: Hadoop常用命令 启动HDFS集群 启动YARN集群 查看HDFS系统根目录 创建文件夹 级联创建文件夹 查看hsdf系统根目录下的所有文件包括子文件夹里面的文件 [hadoop@hadoop1 ~]$ hadoop fs -ls -R /aadrwxr-xr-x - hadoop superg 阅读全文
posted @ 2018-03-21 10:59 扎心了,老铁 阅读(16176) 评论(2) 推荐(1) 编辑
摘要: HDFS前言 HDFS:Hadoop Distributed File System ,Hadoop分布式文件系统,主要用来解决海量数据的存储问题 设计思想 1、分散均匀存储 dfs.blocksize = 128M 2、备份冗余存储 dfs.replication = 3 在大数据系统中作用 为各 阅读全文
posted @ 2018-03-21 10:52 扎心了,老铁 阅读(9994) 评论(3) 推荐(2) 编辑
摘要: 分布式集群的通用问题 当前的HDFS和YARN都是一主多从的分布式架构,主从节点 管理者和工作者 问题:如果主节点或是管理者宕机了。会出现什么问题? 群龙无首,整个集群不可用。所以在一主多从的架构中都会有一个通用的问题: 当集群中的主节点宕机之后,整个集群不可用。这个现象叫做:单点故障。SPOF 单 阅读全文
posted @ 2018-03-21 10:46 扎心了,老铁 阅读(9414) 评论(2) 推荐(0) 编辑
摘要: 概念了解 主从结构:在一个集群中,会有部分节点充当主服务器的角色,其他服务器都是从服务器的角色,当前这种架构模式叫做主从结构。 主从结构分类: 1、一主多从 2、多主多从 Hadoop中的HDFS和YARN都是主从结构,主从结构中的主节点和从节点有多重概念方式: 1、主节点 从节点 2、master 阅读全文
posted @ 2018-03-21 10:41 扎心了,老铁 阅读(51403) 评论(6) 推荐(7) 编辑
摘要: 下载Hadoop源码 1、登录官网 2、确定你要安装的软件的版本 一个选取原则: 不新不旧的稳定版本 几个标准: 1)一般来说,刚刚发布的大版本都是有很多问题 2)应该选择某个大版本中的最后一个小版本 阅读编译文档 1、准备一个hadoop源码包,我选择的hadoop的版本是:hadoop-2.7. 阅读全文
posted @ 2018-03-21 10:22 扎心了,老铁 阅读(13124) 评论(13) 推荐(4) 编辑
摘要: Hadoop产生的背景 1. HADOOP最早起源于Nutch。Nutch的设计目标是构建一个大型的全网搜索引擎,包括网页抓取、索引、查询等功能,但随着抓取网页数量的增加,遇到了严重的可扩展性问题——如何解决数十亿网页的存储和索引问题。 2. 2003年开始谷歌陆续发表的三篇论文为该问题提供了可行的 阅读全文
posted @ 2018-03-21 10:20 扎心了,老铁 阅读(14622) 评论(4) 推荐(7) 编辑
摘要: 三个题目 第一题 问题描述 统计出当前这个一行一个IP的文件中,到底哪个IP出现的次数最多 解决思路 问题难点 1、当读取的文件的大小超过内存的大小时,以上的解决方案是不可行的。 2、假如说你的内存足够大,能装下这个文件中的所有ip,整个任务的执行效率会非常低,消耗的时间会非常的长。 1GB -- 阅读全文
posted @ 2018-03-07 18:33 扎心了,老铁 阅读(12919) 评论(4) 推荐(1) 编辑
摘要: Thread中start()和run()的区别 start() : 它的作用是启动一个新线程,新线程会执行相应的run()方法。start()不能被重复调用。run() : run()就和普通的成员方法一样,可以被重复调用。单独调用run()的话,会在当前线程中执行run(),而并不会启动新线程! 阅读全文
posted @ 2018-03-02 18:34 扎心了,老铁 阅读(1222) 评论(0) 推荐(1) 编辑
摘要: 并发系列参考文章http://www.cnblogs.com/skywang12345/p/3323085.html#3907193 synchronized原理 在java中,每一个对象有且仅有一个同步锁。这也意味着,同步锁是依赖于对象而存在。当我们调用某对象的synchronized方法时,就获 阅读全文
posted @ 2018-03-02 18:34 扎心了,老铁 阅读(904) 评论(0) 推荐(2) 编辑
摘要: 基本概念讲述 什么是同步? 同步就是:如果有多个任务或者事件要发生,这些任务或者事件必须逐个地进行,一个事件或者任务的执行会导致整个流程的暂时等待,这些事件没有办法并发地执行。 什么是异步? 异步就是:如果有多个任务或者事件发生,这些事件可以并发地执行,一个事件或者任务的执行不会导致整个流程的暂时等 阅读全文
posted @ 2018-03-02 18:34 扎心了,老铁 阅读(1946) 评论(0) 推荐(0) 编辑
上一页 1 ··· 13 14 15 16 17 18 19 20 21 ··· 24 下一页