戈瑾 - 博客园

2022年1月12日

摘要： RDD简介、创建方式、分区阅读全文

posted @ 2022-01-12 22:39 戈瑾阅读(87) 评论(0) 推荐(0) 编辑

2022年1月11日

摘要：一、spark-submit 1、类似于：hadoop jar; [主要负责jar包的提交]; 2、语法：spark-submit [options] <app jar | python file> [app arguments] 通过- -help 查看参数：参数options： -master 阅读全文

posted @ 2022-01-11 22:38 戈瑾阅读(66) 评论(0) 推荐(0) 编辑

2022年1月10日

spark学习进度10——spark概述与安装

摘要：一、spark概述 1、Spark是什么 Spark是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。（1） Spark是一种由Scala语言开发的快速、通用、可扩展的大数据分析引擎（2）Spark Core中提供了Spark最基础与最核心的功能（3） Spark SQL是Spark用来阅读全文

posted @ 2022-01-10 20:30 戈瑾阅读(65) 评论(0) 推荐(0) 编辑

2022年1月9日

spark学习进度9——Scala集合的常用方法

摘要： 1、Map方法说明：map 方法主要是一对一映射，取出集合中的每个元素，执行操作，返回值和集合的类型一致。示例：将数组 val array=Array(1,2,3,4,5) 中的每个元素*10 阅读全文

posted @ 2022-01-09 23:48 戈瑾阅读(28) 评论(0) 推荐(0) 编辑

2022年1月8日

spark学习进度8——Scala中的set集合

摘要： 1、特点无序、不能重复 2、声明（1）不可变 val set=Set(1,2,3,4,1,2,3)——自动去重（2）可变 var set = scala.collection.immutable.Set(1,2,3) 3、常用方法 +=、++=、-=、、head、tail等没有insert 阅读全文

posted @ 2022-01-08 23:14 戈瑾阅读(146) 评论(0) 推荐(0) 编辑

2022年1月7日

spark学习进度7——Scala中的Map集合

摘要：一、不可变集合 1、声明（1）使用 -> 的方式声明备注：声明的Map集合的时候如果不加泛型，必须保证声明的map集合中有数据，因为有数据会自动适配，没有数据会返回Nothing （2）使用对偶元组的方式声明（3）Map集合在创建的时候不能使用new关键字，因为Map是一个接口 Java中也阅读全文

posted @ 2022-01-07 23:04 戈瑾阅读(821) 评论(0) 推荐(0) 编辑

2022年1月6日

spark学习进度6——Scala中的List

摘要：一、List集合 1、分类 mutable 可变——元素个数和值等可以改变（ListBuffer） immutable不可变——长度和元素的值都不可变（List）在scala.collection.mutable/immutable包中，常用的List就是immutable下面的集合。 2、Lis 阅读全文

posted @ 2022-01-06 23:48 戈瑾阅读(603) 评论(0) 推荐(0) 编辑

2022年1月5日

spark学习进度5——Scala中的数组

摘要：一、数组分类 mutable 可变——元素个数和值等可以改变（需要导包） immutable不可变——数组的长度不能被改变，但是值可以被改变在scala.collection.mutable/immutable包中，常用的Array就是immutable下面的数组。二、不可变数组 1、语法 va 阅读全文

posted @ 2022-01-05 19:57 戈瑾阅读(319) 评论(0) 推荐(0) 编辑

2022年1月4日

spark学习进度4——Scala中的元组

摘要：一、Scala中的集合 1、按照常用性进行排序： 1-元组 2-数组（Array，在scala中Array是单独存在的，直接声明Array[type]） 3-List 4-Map 5-Set (去重) 2、以上的集合数据都分为两种（除了元组）： mutable 可变集合——集合声明以后，元素个数和值阅读全文

posted @ 2022-01-04 20:23 戈瑾阅读(332) 评论(0) 推荐(0) 编辑

2022年1月3日

spark学习进度3——Scala方法与函数

摘要： Scala中的方法与函数阅读全文

posted @ 2022-01-03 20:22 戈瑾阅读(114) 评论(0) 推荐(0) 编辑