竞争无处不在,青春永不言败!专业撸代码,副业修bug

Talk is cheap , show me the code!



摘要: https://learnxinyminutes.com/ 阅读全文
posted @ 2018-01-16 15:30 云雾散人 阅读(162) 评论(0) 推荐(0) 编辑
摘要: 0. 好习惯 分号 ; 花括号 {}, var 弄清楚 null , undefined 区别 , isNaN, 与 == 区别 1. prompt , confirm , alert 不同框框 数组常用方法 var arr = [10, 20, '30', 'xyz']; arr.indexOf( 阅读全文
posted @ 2018-01-16 13:51 云雾散人 阅读(439) 评论(0) 推荐(0) 编辑
摘要: fold 操作 区别 与 co 1.mapValus 2.flatMapValues 3.comineByKey 4.foldByKey 5.reduceByKey 6.groupByKey 7.sortByKey 8.cogroup 9.join 10.LeftOutJoin 11.RightOutJoin 1.map(func) 2.flatMap(func) 3.mapPart... 阅读全文
posted @ 2018-01-16 12:26 云雾散人 阅读(5203) 评论(0) 推荐(1) 编辑
摘要: Apache Parquet是Hadoop生态圈中一种新型列式存储格式,它可以兼容Hadoop生态圈中大多数计算框架(Hadoop、Spark等),被多种查询引擎支持(Hive、Impala、Drill等),并且它是语言和平台无关的。Parquet最初是由Twitter和Cloudera(由于Impala的缘故)合作开发完成并开源,2015年5月从Apache的孵化器里毕业成为Apache顶级项... 阅读全文
posted @ 2018-01-16 12:24 云雾散人 阅读(3100) 评论(0) 推荐(0) 编辑
摘要: spark dataframe派生于RDD类,但是提供了非常强大的数据操作功能。当然主要对类SQL的支持。 在实际工作中会遇到这样的情况,主要是会进行两个数据集的筛选、合并,重新入库。 首先加载数据集,然后在提取数据集的前几行过程中,才找到limit的函数。 而合并就用到union函数,重新入库,就是registerTemple注册成表,再进行写入到HIVE中。 不得不赞叹datafra... 阅读全文
posted @ 2018-01-16 12:23 云雾散人 阅读(16483) 评论(0) 推荐(0) 编辑
摘要: Scala入门到精通 http://lib.csdn.net/base/scala/structure http://hongjiang.info/scala/ http://blog.csdn.net/lovehuangjiaju/article/details/47612699 http://www.scala-lang.org/old/node/104.html https://... 阅读全文
posted @ 2018-01-16 11:37 云雾散人 阅读(335) 评论(0) 推荐(0) 编辑
摘要: 在最开始处引入 log 相关的 包 import org.apache.log4j.{Logger,Level} 在需要屏蔽日志输出的地方加上这两行代码 // 屏蔽不必要的日志显示在终端上 Logger.getLogger("org.apache.spark").setLevel(Level.ERROR) Logger.getLogger("org.eclipse.jetty.... 阅读全文
posted @ 2018-01-16 11:26 云雾散人 阅读(712) 评论(0) 推荐(0) 编辑
摘要: 脚本语言的第一行,目的就是指出,你想要你的这个文件中的代码用什么可执行程序去运行它,就这么简单 #!/usr/bin/python是告诉操作系统执行这个脚本的时候,调用/usr/bin下的python解释器;#!/usr/bin/env python这种用法是为了防止操作系统用户没有将python装 阅读全文
posted @ 2018-01-16 11:00 云雾散人 阅读(570) 评论(0) 推荐(0) 编辑

Your attitude not your aptitude will determine your altitude!

如果有来生,一个人去远行,看不同的风景,感受生命的活力!