摘要: 转一篇:http://blog.csdn.net/fengxingzhe001/article/details/67640083 原来使用一行一行读取文本的方式,速度是慢的的可以,弄了好久还是不行,后来看了下才知道要用字节流传输会快很多 我自己也测了一下80M的文件,发现给读入块的大小会很明显的影响 阅读全文
posted @ 2017-09-29 14:11 LazyJoJo 阅读(6472) 评论(0) 推荐(0) 编辑
摘要: 使用的命令为: 阅读全文
posted @ 2017-09-29 13:46 LazyJoJo 阅读(555) 评论(0) 推荐(0) 编辑
摘要: 从深层次的含义讲,yarn-cluster和yarn-client模式的区别其实就是Application Master进程的区别,yarn-cluster模式下,driver运行在AM(Application Master)中,它负责向YARN申请资源,并监督作业的运行状况。当用户提交了作业之后, 阅读全文
posted @ 2017-09-15 16:49 LazyJoJo 阅读(331) 评论(0) 推荐(0) 编辑
摘要: 别的不说先上官网: action 这些算子中需要注意: 1、reduce 和 reduceByKey 虽说都有reduce,但是一个是action级别,一个是transformation级别,速度上会有很大的差异 2、groupBy的使用如下 groupBy :将元素通过函数生成相应的 Key,数据 阅读全文
posted @ 2017-09-15 15:45 LazyJoJo 阅读(727) 评论(0) 推荐(0) 编辑
摘要: 1、创建项目方法和步骤,网上一搜一大把 2、主要出现了一个配置上的错误,java_home的配置 发现idea和eclipse有一个地方配置不同,就是java_home,在eclipse中 mvn的配置文件pom.xml 中配置${JAVA_HOME}可以自动读取,然而 同样的写法在idea中则无法 阅读全文
posted @ 2017-09-11 09:29 LazyJoJo 阅读(241) 评论(0) 推荐(0) 编辑
摘要: 转自:http://blog.chinaunix.net/uid-23302288-id-3785105.html 阅读全文
posted @ 2017-09-06 10:45 LazyJoJo 阅读(119) 评论(0) 推荐(0) 编辑
摘要: \d 代表 [0-9]\l 代表 [a-z]\u 代表 [A-Z]\a 代表 [A-Za-z]\w 代表 [A-Za-z0-9_] 后面有+号表示可以有多个 阅读全文
posted @ 2017-09-06 09:53 LazyJoJo 阅读(122) 评论(0) 推荐(0) 编辑
摘要: 方法一: 1、显示当前行行号,在VI的命令模式下输入 :nu 2、显示所有行号,在VI的命令模式下输入 :set nu 方法二: 使用vi编辑~/.vimrc文件,在该文件中加入一行"set nu",添加内容不含引号, 命令如下: 可能这个文件不存在,直接创建一个新的,在里面添加 set nu 方法 阅读全文
posted @ 2017-09-05 17:48 LazyJoJo 阅读(2096) 评论(0) 推荐(0) 编辑
摘要: 转自:http://blog.csdn.net/y2888886/article/details/50535033 在上篇博文的基础上做如下修改 注意一些常见命令中间就要加 “ ” ,否则很多命令无法识别 sh **.sh 和 bash **.sh 在一些命令的解析上还是有差别的,所以尽量使用bas 阅读全文
posted @ 2017-09-05 17:43 LazyJoJo 阅读(187) 评论(0) 推荐(0) 编辑
摘要: 假如我们要开发一个定时器,该定时器每秒钟执行一定的动作,我们如何把要执行的动作传给定时器?最直观的回答是:传一个实现动作的函数(function) 其中callback是一个int => Unit的函数名,oncePerSecond接收一个函数作为参数,而不是这个函数的结果,因此该函数sendinf 阅读全文
posted @ 2017-09-04 11:32 LazyJoJo 阅读(880) 评论(0) 推荐(0) 编辑