02 2023 档案
摘要:红黑树——一种自平衡的二叉树 一、红黑树简介 普通二叉树在数据不够均匀的情况下,可能导致左右子树高度会相差比较大,最坏情况下树的结构相当于一个链表,时间复杂度为n。为了使二叉树在最坏情况下也能有log(n)的性能,需要对二叉树进行平衡操作,相应的算法有很多,红黑树就是其中一种算法。红黑树是一种自平衡
阅读全文
摘要:YARN简介 一、YARN是什么 YARN不是facebook的那个yarn,它从Hadoop 2引入,最初目的是改善MapReduce的实现,但是因为具备足够通用性,同样也可以支持其他的分布式计算模式。YARN全称是Yet Another Resource Negotiator,翻译过来是另一种资
阅读全文
摘要:安装一个Hadoop分布式集群 最小化的Hadoop已经可以满足学习过程中大部分需求,但是为了研究Hadoop集群运行机制,部署一个类生产的环境还是有必要的。因为集群机器比较少,笔者没有配置ssh,所以就需要在每一台机器上手动启动服务。启动上相对繁琐一些,优点是可以高度自定义集群中的任务节点数量,从
阅读全文