会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
花伤错零
静看落花落流水,坐遇晚风恰逢君
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
···
21
下一页
2024年1月24日
1.24总结
摘要: 第九天 Spark内核调度(重点理解) DAG DAG的宽窄依赖和阶段划分 内存迭代计算 Spark并行度 Spark任务调度 DAG调度器 Task调度器 拓展-Spark概念名称大全
阅读全文
posted @ 2024-01-24 21:37 花伤错零
阅读(9)
评论(0)
推荐(0)
2024年1月23日
1.23总结
摘要: 第八天。 共享变量 广播变量 累加器 广播变量累加器综合案例 # coding:utf8 import time from pyspark import SparkConf, SparkContext from pyspark.storagelevel import StorageLevel imp
阅读全文
posted @ 2024-01-23 19:41 花伤错零
阅读(3)
评论(0)
推荐(0)
2024年1月22日
1.22总结
摘要: 第七天。 Spark案例练习 搜索引擎日志分析案例 提交到集群运行
阅读全文
posted @ 2024-01-22 18:54 花伤错零
阅读(0)
评论(0)
推荐(0)
2024年1月20日
1.20总结
摘要: 第六天。 RDD的持久化 RDD的数据是过程数据 RDD缓存 # coding:utf8 import time from pyspark import SparkConf, SparkContext from pyspark.storagelevel import StorageLevel if
阅读全文
posted @ 2024-01-20 23:07 花伤错零
阅读(2)
评论(0)
推荐(0)
2024年1月19日
1.19总结
摘要: 第五天 对于算子部分总结在了昨天,今天不在进行复述。 继续上部分内容 RDD算子 分区操作算子 转换算子-mapPartitions # coding:utf8 from pyspark import SparkConf, SparkContext if __name__ == '__main__'
阅读全文
posted @ 2024-01-19 21:29 花伤错零
阅读(4)
评论(0)
推荐(0)
2024年1月18日
1.18总结——RDD算子
摘要: 第四天。 RDD算子 算子:分布式集合对象上的API称之为算子。 方法\函数:本地对象的API,叫做方法\函数 算子:分布式对象的API,叫做算子。 算子分类 Transformation:转换算子 定义:RDD的算子,返回值仍然师一个RDD的。 特性:lazy懒加载,如果没有action算子,Tr
阅读全文
posted @ 2024-01-18 22:00 花伤错零
阅读(66)
评论(0)
推荐(0)
2024年1月16日
1.16总结
摘要: 寒假记录第三天 今天正式开始学习spark 原来对于spark有一定的基础了解学习 今天开始学习SparkCore。 RDD定义 RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象,代表一个不可变、可分区、里面的元素可并行计算的集
阅读全文
posted @ 2024-01-16 22:45 花伤错零
阅读(1)
评论(0)
推荐(0)
2024年1月14日
spark安装
摘要: # Spark Local环境部署 ## 下载地址 https://dlcdn.apache.org/spark/spark-3.2.0/spark-3.2.0-bin-hadoop3.2.tgz ## 条件 - PYTHON 推荐3.8 - JDK 1.8 ## Anaconda On Linux
阅读全文
posted @ 2024-01-14 15:53 花伤错零
阅读(74)
评论(0)
推荐(0)
2024年1月12日
1.12日总结
摘要: 今天完成了对题目的审查 【A21】基于区块链的碳核算和碳交易系统【云象网络】 发布时间: 2023-12-27 14:36:53 1.命题方向 企业服务+智能计算 2.题目类别 应用类 3.题目名称 基于区块链的碳核算和碳交易系统 4.背景说明 【整体背景】 2020年中国作出碳达峰碳中和重大承诺,
阅读全文
posted @ 2024-01-12 15:43 花伤错零
阅读(29)
评论(0)
推荐(0)
2023年12月20日
代码大全2读书总结03
摘要: 第十一章:《对象思考》本章深入探讨了面向对象编程的概念和技术。作者介绍了类的设计、继承、多态等概念,并提供了一些实用的面向对象设计原则,帮助读者更好地理解和应用面向对象编程的思想。 第十二章:《自定义数据类型》在这一章中,作者讨论了如何定义和使用自定义数据类型,包括结构体、枚举、类等。通过合理使用自
阅读全文
posted @ 2023-12-20 19:08 花伤错零
阅读(24)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
···
21
下一页
公告