上一页 1 2 3 4 5 6 7 8 ··· 45 下一页
摘要: 首先我们我们对case class 和case object类型对象进行反编译 首先来编译 case class,有如下编译内容: case class Person(age:Int,name:String) 它会产生两个文件如下: Person.class的编译内容如下: import scala 阅读全文
posted @ 2020-04-21 19:22 大葱拌豆腐 阅读(1806) 评论(0) 推荐(0) 编辑
摘要: /** class、object、case class、case object区别 * * class 类似Java中的class; * object Scala不能定义静态成员,用定义单例对象代之; * case class被称为样例类,是一种特殊的类,常被用于模式匹配。 * * 一、class 阅读全文
posted @ 2020-04-21 19:09 大葱拌豆腐 阅读(1884) 评论(0) 推荐(0) 编辑
摘要: 通常我们将spark任务编写后打包成jar包,使用spark-submit进行提交,因为spark是分布式任务,如果运行机器上没有对应的依赖jar文件就会报ClassNotFound的错误。 下面有二个解决方法: 方法一:spark-submit –jars 根据spark官网,在提交任务的时候指定 阅读全文
posted @ 2020-04-21 15:19 大葱拌豆腐 阅读(2030) 评论(0) 推荐(0) 编辑
摘要: Delta Lake 特性 支持ACID事务 可扩展的元数据处理 统一的流、批处理API接口 更新、删除数据,实时读写(读是读当前的最新快照) 数据版本控制,根据需要查看历史数据快照,可回滚数据 自动处理schema变化,可修改表结构 maven依赖 <dependency> <groupId>io 阅读全文
posted @ 2020-04-21 10:13 大葱拌豆腐 阅读(3687) 评论(0) 推荐(0) 编辑
摘要: 链接:https://zhuanlan.zhihu.com/p/85105155 一个JOB提交到spark集群中时候,需要预准备一些环境变量这里涉及到主要三个关键词: SparkContext,SparkConf,SparkSession Spark版本历史演进中非常重要的一个节点是Spark2. 阅读全文
posted @ 2020-04-20 15:11 大葱拌豆腐 阅读(257) 评论(0) 推荐(0) 编辑
摘要: 出自:https://zhuanlan.zhihu.com/p/81033956 概述 Hadoop作为最早开源的大数据处理系统,经过多年发展为业界主流架构,并拥有一套完善的生态圈,同时作为应用在HDFS之上的数仓解决方案,通过这么多年发展,是大企业大数据平台广泛采用的方案。但是Hive由于采用的M 阅读全文
posted @ 2020-04-20 10:39 大葱拌豆腐 阅读(1281) 评论(0) 推荐(0) 编辑
摘要: 通常我们将spark任务编写后打包成jar包,使用spark-submit进行提交,因为spark是分布式任务,如果运行机器上没有对应的依赖jar文件就会报ClassNotFound的错误。 下面有三个解决方法: 方法一:spark-submit –jars根据spark官网,在提交任务的时候指定– 阅读全文
posted @ 2019-12-31 15:24 大葱拌豆腐 阅读(3903) 评论(0) 推荐(0) 编辑
摘要: Spark 依赖包来源我们知道Spark application运行加载依赖有三个地方: SystemClasspath -- Spark安装时候提供的依赖包Spark-submit --jars 提交的依赖包Spark-submit --config "spark.{driver/executor 阅读全文
posted @ 2019-12-31 15:05 大葱拌豆腐 阅读(3934) 评论(0) 推荐(0) 编辑
摘要: 到目前为止,Scala 环境下至少存在6种 Json 解析的类库,这里面不包括 Java 语言实现的 Json 类库。所有这些库都有一个非常相似的抽象语法树(AST)。而 json4s 项目旨在提供一个单一的 AST 树供其他 Scala 类库来使用。 json4s 的使用非常的简单,它可以将类直接 阅读全文
posted @ 2019-11-27 22:37 大葱拌豆腐 阅读(1086) 评论(0) 推荐(0) 编辑
摘要: Spark的官方文档再三强调那些将要作用到RDD上的操作,不管它们是一个函数还是一段代码片段,它们都是“闭包”,Spark会把这个闭包分发到各个worker节点上去执行,这里涉及到了一个容易被忽视的问题:闭包的“序列化”。 显然,闭包是有状态的,这主要是指它牵涉到的那些自由变量以及自由变量依赖到的其 阅读全文
posted @ 2019-11-27 22:29 大葱拌豆腐 阅读(1357) 评论(1) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 45 下一页