上一页 1 2 3 4 5 6 7 8 9 10 ··· 12 下一页
摘要: 注意:默认的Map中的元素是无序的,也就是不会按照你插入数据的顺序进行排序,是无序的 1.创建一个不可变的Map 方式一: 语法: Map( key -> value , key2 -> value2) 方式二 语法: Map((key1 , value1) , (value2, value2) ) 阅读全文
posted @ 2020-04-11 19:47 二黑诶 阅读(578) 评论(0) 推荐(0) 编辑
摘要: 1.Array 在scala中,Array代表的含义与java中类似,也是长度不可改变的数组。此外,由于scala与java都是运行在JVM中,双方可以相互调用,因此Scala数组的底层实际上是Java数组。例如字符串数组在底层就是Java的String[] ,整数数组在底层就是Java的Int[] 阅读全文
posted @ 2020-04-11 19:21 二黑诶 阅读(3297) 评论(0) 推荐(1) 编辑
摘要: 1.定义函数:需要定义函数的函数名、参数、函数体 函数语法: def 函数名(参数名:参数类型 , 参数名:参数类型) = {函数体} scala要求必须给出所有参数的类型,但是不一定给出函数返回值的类型,只要右侧的函数体中不包含递归的语句,scala就可以自己根据右侧的表达式推断出返回类型。 2. 阅读全文
posted @ 2020-04-11 18:58 二黑诶 阅读(780) 评论(0) 推荐(0) 编辑
摘要: scala与java的关系 scala是基于java虚拟机,也就是JVM的一门编程语言,所有scala代码,都需要经过编译为字节码,然后交由java虚拟机来运行。 所以scala和java是可以无缝互操作的。scala可以任意调用java代码,所以scala与java的关系是非常紧密的。 val 是 阅读全文
posted @ 2020-04-11 18:42 二黑诶 阅读(149) 评论(0) 推荐(0) 编辑
摘要: 程序虽然报错提示如下 程序虽然现实报错内容,但是没有指定到具体代码位置, 查看hive结果表,结果表正常插入hive表中。 虽然不影响结果运行,但是看到日志报错内容,决定解决一下。 在脚本中加入一下参数配置,默认spark2.2 是true。 --conf spark.sql.codegen.who 阅读全文
posted @ 2020-04-11 18:33 二黑诶 阅读(1912) 评论(0) 推荐(0) 编辑
摘要: 测试程序:原来运行环境是 升级后的运行环境 执行在低版本环境的程序 1.首先将高版本的pom文件修改、 2.在将resource配置文件配置 然后执行程序 报错 首先追踪错误代码行APP 45行。 是sparkSQL读hive仓库的表 最后一个报错代码说: 无法识别的hadoop主版本号 然后就在考 阅读全文
posted @ 2020-04-11 18:32 二黑诶 阅读(325) 评论(0) 推荐(0) 编辑
摘要: 首先,yarn在hadoop2.x之后才诞生的,主要作用是为了对计算框架进行总体资源管理调度的 yarn启动命令: ./start-yarn 启动之后,通过jps查看进程 会有两个进程: 1.ResourceManager 以下简称RM 2.NodeManager 以下简称NM 2.RM的组成部分 阅读全文
posted @ 2020-03-29 22:45 二黑诶 阅读(353) 评论(0) 推荐(0) 编辑
摘要: 问题: 跑本地模式 一直卡在下图最下面日志部分30分钟不动 查看运行日志一直卡在 箭头处不动,没有任何报错。 因为处理逻辑只是简单的sparksql两个表left join, union, having等简单的函数操作。 测试环境 数据仅有3w条。 虽然将程序打包到集群,但还是跑的local模式, 阅读全文
posted @ 2020-03-25 22:50 二黑诶 阅读(1387) 评论(0) 推荐(0) 编辑
摘要: 报错日志: 20/03/25 10:28:07 WARN UserGroupInformation: PriviledgedActionException as:root (auth:SIMPLE) cause:org.apache.spark.SparkException: Exception t 阅读全文
posted @ 2020-03-25 22:45 二黑诶 阅读(5021) 评论(3) 推荐(0) 编辑
摘要: Worker类源码位置: org.apache.spark.deploy.worker 1 /** 2 *启动driver的源码分析 3 */ 4 case LaunchDriver(driverId, driverDesc) => 5 logInfo(s"Asked to launch drive 阅读全文
posted @ 2020-02-21 23:09 二黑诶 阅读(205) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 12 下一页