2021 年 12月随笔档案 - chenghaixinag

寒假学习进度6

摘要：今天继续学习sparkRDD的算子（1）flatMap def main(args: Array[String]): Unit = { val sparkConf = new SparkConf().setMaster("local[*]").setAppName("Operator11") va 阅读全文

posted @ 2021-12-31 22:41 chenghaixinag 阅读(23) 评论(0) 推荐(0) 编辑

寒假学习进度5

摘要：今天开始学习spark中RDD算子首先是Value类型（1）map 练习代码： def main(args: Array[String]): Unit = { val sparkConf = new SparkConf().setMaster("local[*]").setAppName("Op 阅读全文

posted @ 2021-12-28 23:28 chenghaixinag 阅读(18) 评论(0) 推荐(0) 编辑

寒假学习进度4

摘要：今天开始学习spark3大数据结构中的RDD 什么是RDD： RDD（Resilient Distributed Dataset）叫做弹性分布式数据集，是 Spark 中最基本的数据处理模型。代码中是一个抽象类，它代表一个弹性的、不可变、可分区、里面的元素可并行计算的集合。 RDD有5大核心属性阅读全文

posted @ 2021-12-26 21:04 chenghaixinag 阅读(24) 评论(0) 推荐(0) 编辑

寒假学习进度3

摘要：今天继续spark的学习，今天完成了Standalone 模式的配置和在windows上的运行首先是Standalone 模式更改spark目录下conf文件中的salves文件，添加内容更改spark目录下conf文件中的spark-env文件，添加内容 export JAVA_HOME=/ 阅读全文

posted @ 2021-12-24 23:09 chenghaixinag 阅读(19) 评论(0) 推荐(0) 编辑

寒假学习进度2

摘要：今天接着昨天spark学习使用spark自己自带的函数完成对文本中的单词统计，昨天代码的进阶版代码：package com.chenghaixiang.core.wcimport org.apache.spark.rdd.RDDimport org.apache.spark.{SparkConf 阅读全文

posted @ 2021-12-22 21:55 chenghaixinag 阅读(30) 评论(0) 推荐(0) 编辑

寒假学习进度

摘要：今天开始学习sqark，主要参考学习的是尚硅谷的sqark教程。 Spark 核心模块 1.在idea中添加scala 因为在idea中添加scala插件下载速度过慢，所以用离线添加在idea官网插件库中下载scala :https://plugins.jetbrains.com/plugin/1 阅读全文

posted @ 2021-12-21 23:46 chenghaixinag 阅读(32) 评论(0) 推荐(0) 编辑

每日总结

摘要：Mapreduce实例——ChainMapReduce 依赖： <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-common</artifactId> <version>3.2.0</version> </de 阅读全文

posted @ 2021-12-09 02:10 chenghaixinag 阅读(84) 评论(0) 推荐(0) 编辑

每日总结

摘要：Mapreduce实例——倒排索引依赖： <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-common</artifactId> <version>3.2.0</version> </dependency> 阅读全文

posted @ 2021-12-08 20:15 chenghaixinag 阅读(34) 评论(0) 推荐(0) 编辑

项目总结

摘要：Mapreduce实例——二次排序依赖： <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-common</artifactId> <version>3.2.0</version> </dependency> 阅读全文

posted @ 2021-12-06 22:02 chenghaixinag 阅读(72) 评论(0) 推荐(0) 编辑

每日总结

摘要：Mapreduce实例——Map端join 依赖： <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-common</artifactId> <version>3.2.0</version> </dependen 阅读全文

posted @ 2021-12-03 18:48 chenghaixinag 阅读(29) 评论(0) 推荐(0) 编辑

每日总结

摘要：Mapreduce实例——单表join 依赖： <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-common</artifactId> <version>3.2.0</version> </dependency 阅读全文

posted @ 2021-12-02 21:46 chenghaixinag 阅读(27) 评论(0) 推荐(0) 编辑

每日总结

摘要：Mapreduce实例——排序依赖： <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-common</artifactId> <version>3.2.0</version> </dependency> <d 阅读全文

posted @ 2021-12-01 21:03 chenghaixinag 阅读(24) 评论(0) 推荐(0) 编辑

chenghaixinag

12 2021 档案

公告

搜索

常用链接

随笔档案

阅读排行榜

推荐排行榜