摘要: Spark-shell有两种使用方式: 1:直接Spark-shell 会启动一个SparkSubmit进程来模拟Spark运行环境,是一个单机版的。 2:Spark-shell --master Spark://hadoop1:7077,hadoop2:7077,hadoop3:7077 --to 阅读全文
posted @ 2017-01-06 13:06 水分子Andy 阅读(9714) 评论(0) 推荐(0) 编辑
摘要: 大数据离线部分 1、HDFS 1:HDFS的架构部分及工作原理 NameNode:负责管理元素据,将信息保存在内存中 DataNode:保存数据,以块的形式保存。启动后需要定时的向NameNode发送心跳,报告自身存储的块信息 2:HDFS的上传过程 3:HDFS的下载 4:NameNode的元数据 阅读全文
posted @ 2017-01-06 12:36 水分子Andy 阅读(2363) 评论(0) 推荐(1) 编辑
摘要: HashMap的工作原理 HashMap的工作原理是近年来常见的Java面试题。几乎每个Java程序员都知道HashMap,都知道哪里要用HashMap,知道HashTable和HashMap之间的区别,那么为何这道面试题如此特殊呢?是因为这道题考察的深度很深。这题经常出现在高级或中高级面试中。投资 阅读全文
posted @ 2016-12-14 11:09 水分子Andy 阅读(131) 评论(0) 推荐(0) 编辑
摘要: Spark是一个内存迭代式运算框架,通过RDD来描述数据从哪里来,数据用那个算子计算,计算完的数据保存到哪里,RDD之间的依赖关系。他只是一个运算框架,和storm一样只做运算,不做存储。 Spark程序可以运行在Yarn、standalone、mesos等平台上,standalone是Spark提 阅读全文
posted @ 2016-10-29 22:03 水分子Andy 阅读(824) 评论(0) 推荐(0) 编辑
摘要: 最近面试发现自己的知识框架有好多问题。明明脑子里知道这个知识点,流程原理也都明白,可就是说不好,不知道是自己表达技能没点,还是确实是自己基础有问题。不管了,再巩固下基础知识总是没错的,反正最近空闲时间挺多的,也不打算找工作了。(都是看的网上资料,乱,仅个人笔记) Java集合类提供了一套设计良好的支 阅读全文
posted @ 2016-08-02 11:35 水分子Andy 阅读(473) 评论(0) 推荐(1) 编辑
摘要: 5.串,由零个或多个字符组成的序列,又叫字符串串的比较是通过组成字符串的字符之间的编码来进行的,而字符串编码指的是字符在对应字符集中的符号。串的存储结构与线性表相同分两种串的顺序存储结构串的顺序存储结构是用一组地址连续的存储单元来存储串中的字符序列的。按照预定义的大小,为每个定义的串变量分配一个固定 阅读全文
posted @ 2016-07-12 14:42 水分子Andy 阅读(264) 评论(0) 推荐(0) 编辑
摘要: 4.栈和队列栈(stack),是仅限定在表尾进行插入和删除操作的线性表 (一种特殊的线性表,有前驱后继关系)我们把允许插入和删除的一端称为栈顶,另一端称为栈底,不含任何元素的称为空栈,栈又称为先进后出的线性表简称LIFO结构先进后出,后进先出,最先进栈的元素不一定最后出,因为栈对元素的删除和增加位置 阅读全文
posted @ 2016-07-04 17:21 水分子Andy 阅读(255) 评论(0) 推荐(0) 编辑
摘要: 大学上数据结构课都逃了,后来发现其重要,期间又自己抱起书学了一遍,因为当时懒,自学的成果也不大,如今工作有一年了,也写过几个项目越来越感觉数据结构对个人思想的重要,如今趁裸辞的空窗期,好好恶补下,顺便写个笔记总结下。 1,数据结构,是相互之间存在一种或多种关系的数据元素的集合从不同角度讨论,有不同的 阅读全文
posted @ 2016-06-29 11:25 水分子Andy 阅读(289) 评论(0) 推荐(0) 编辑