二黑诶 - 博客园

2020年4月11日

摘要：注意：默认的Map中的元素是无序的，也就是不会按照你插入数据的顺序进行排序，是无序的 1.创建一个不可变的Map 方式一：语法： Map( key -> value , key2 -> value2) 方式二语法： Map((key1 , value1) , (value2, value2) ) 阅读全文

posted @ 2020-04-11 19:47 二黑诶阅读(578) 评论(0) 推荐(0) 编辑

小记--------scala- 数组操作之Array、ArrayBuffer以及遍历数组

摘要： 1.Array 在scala中，Array代表的含义与java中类似，也是长度不可改变的数组。此外，由于scala与java都是运行在JVM中，双方可以相互调用，因此Scala数组的底层实际上是Java数组。例如字符串数组在底层就是Java的String[] ，整数数组在底层就是Java的Int[] 阅读全文

posted @ 2020-04-11 19:21 二黑诶阅读(3297) 评论(0) 推荐(1) 编辑

小记--------scala的函数定义及使用

摘要： 1.定义函数：需要定义函数的函数名、参数、函数体函数语法： def 函数名(参数名:参数类型，参数名:参数类型) = {函数体} scala要求必须给出所有参数的类型，但是不一定给出函数返回值的类型，只要右侧的函数体中不包含递归的语句，scala就可以自己根据右侧的表达式推断出返回类型。 2. 阅读全文

posted @ 2020-04-11 18:58 二黑诶阅读(780) 评论(0) 推荐(0) 编辑

小记--------scala语言基础学习

摘要： scala与java的关系 scala是基于java虚拟机，也就是JVM的一门编程语言，所有scala代码，都需要经过编译为字节码，然后交由java虚拟机来运行。所以scala和java是可以无缝互操作的。scala可以任意调用java代码，所以scala与java的关系是非常紧密的。 val 是阅读全文

posted @ 2020-04-11 18:42 二黑诶阅读(149) 评论(0) 推荐(0) 编辑

记一次--------spark.sql.codegen.wholeStage=false参数修改

摘要：程序虽然报错提示如下程序虽然现实报错内容，但是没有指定到具体代码位置，查看hive结果表，结果表正常插入hive表中。虽然不影响结果运行，但是看到日志报错内容，决定解决一下。在脚本中加入一下参数配置，默认spark2.2 是true。 --conf spark.sql.codegen.who 阅读全文

posted @ 2020-04-11 18:33 二黑诶阅读(1912) 评论(0) 推荐(0) 编辑

记一次--------集群升级CDH版本到6.3.2程序运行报错scope属性的provided值

摘要：测试程序：原来运行环境是升级后的运行环境执行在低版本环境的程序 1.首先将高版本的pom文件修改、 2.在将resource配置文件配置然后执行程序报错首先追踪错误代码行APP 45行。是sparkSQL读hive仓库的表最后一个报错代码说：无法识别的hadoop主版本号然后就在考阅读全文

posted @ 2020-04-11 18:32 二黑诶阅读(325) 评论(0) 推荐(0) 编辑

2020年3月29日

小记--------hadoop的yarn资源管理器原理剖析

摘要：首先，yarn在hadoop2.x之后才诞生的，主要作用是为了对计算框架进行总体资源管理调度的 yarn启动命令： ./start-yarn 启动之后，通过jps查看进程会有两个进程： 1.ResourceManager 以下简称RM 2.NodeManager 以下简称NM 2.RM的组成部分阅读全文

posted @ 2020-03-29 22:45 二黑诶阅读(353) 评论(0) 推荐(0) 编辑

2020年3月25日

记一次--------sparkSQL程序local模式运行不起来，增加参数配置spark.locality.wait

摘要：问题：跑本地模式一直卡在下图最下面日志部分30分钟不动查看运行日志一直卡在箭头处不动，没有任何报错。因为处理逻辑只是简单的sparksql两个表left join， union， having等简单的函数操作。测试环境数据仅有3w条。虽然将程序打包到集群，但还是跑的local模式，阅读全文

posted @ 2020-03-25 22:50 二黑诶阅读(1387) 评论(0) 推荐(0) 编辑

记一次--------spark.driver.host参数报错问题

摘要：报错日志： 20/03/25 10:28:07 WARN UserGroupInformation: PriviledgedActionException as:root (auth:SIMPLE) cause:org.apache.spark.SparkException: Exception t 阅读全文

posted @ 2020-03-25 22:45 二黑诶阅读(5021) 评论(3) 推荐(0) 编辑

2020年2月21日

小记--------spark-worker原理分析及源码分析

摘要： Worker类源码位置： org.apache.spark.deploy.worker 1 /** 2 *启动driver的源码分析 3 */ 4 case LaunchDriver(driverId, driverDesc) => 5 logInfo(s"Asked to launch drive 阅读全文

posted @ 2020-02-21 23:09 二黑诶阅读(205) 评论(0) 推荐(0) 编辑

于二黑

公告