2025 年 1月随笔档案 - KuanDong24

1月31日

摘要：复习Spark生态体系中的各个组件阅读全文

posted @ 2025-01-31 19:08 KuanDong24 阅读(1) 评论(0) 推荐(0) 编辑

1月30日

摘要：观看Spark的资源管理视频阅读全文

posted @ 2025-01-31 19:08 KuanDong24 阅读(4) 评论(0) 推荐(0) 编辑

1月29日

摘要：新年快乐阅读全文

posted @ 2025-01-31 19:07 KuanDong24 阅读(5) 评论(0) 推荐(0) 编辑

1月28日

摘要：庆祝除夕阅读全文

posted @ 2025-01-31 19:07 KuanDong24 阅读(7) 评论(0) 推荐(0) 编辑

1月27日

摘要：from pyspark.sql import SparkSession from pyspark.sql.functions import col # 创建SparkSession spark = SparkSession.builder \ .appName("SparkMonitoringEx 阅读全文

posted @ 2025-01-31 19:06 KuanDong24 阅读(3) 评论(0) 推荐(0) 编辑

1月26日

摘要：观看Spark错机制的代码示例，通过设置持久化级别和检查点，确保了Spark程序的可靠性复习Spark的故障恢复流程阅读全文

posted @ 2025-01-26 23:16 KuanDong24 阅读(11) 评论(0) 推荐(0) 编辑

1月25日

摘要：观看Spark的性能优化技巧教学视频完成了性能优化的代码示例，通过调整配置参数和优化代码，提升了Spark程序的性能： from pyspark.sql import SparkSession from pyspark.sql.functions import col # 创建SparkSessi 阅读全文

posted @ 2025-01-26 07:23 KuanDong24 阅读(12) 评论(0) 推荐(0) 编辑

1月24日

摘要：观看Spark生态体系相关视频，复习了Spark生态体系中的各个组件，总结了它们之间的协同工作方式学习Spark Core、Spark SQL 阅读全文

posted @ 2025-01-24 20:17 KuanDong24 阅读(4) 评论(0) 推荐(0) 编辑

1月23日

摘要：学习了Spark GraphX中的图算法，最短路径、连通分量阅读全文

posted @ 2025-01-24 20:16 KuanDong24 阅读(10) 评论(0) 推荐(0) 编辑

1月22日

摘要：过小年阅读全文

posted @ 2025-01-22 20:45 KuanDong24 阅读(8) 评论(0) 推荐(0) 编辑

1月21日

摘要：观看了Spark MLlib中的特征提取和转换方法相关视频阅读全文

posted @ 2025-01-22 20:44 KuanDong24 阅读(15) 评论(0) 推荐(0) 编辑

1月20日

摘要：今日学习了Spark MLlib中的聚类和分类算法，如K-Means、随机森林等完成了聚类和分类算法的代码示例，对一个数据集进行了聚类和分类分析 from pyspark.sql import SparkSession from pyspark.ml.feature import VectorAs 阅读全文

posted @ 2025-01-22 20:44 KuanDong24 阅读(16) 评论(0) 推荐(0) 编辑

1月19日

摘要：学习了Spark MLlib机器学习库的基本功能，包括线性回归、逻辑回归和决策树等算法阅读全文

posted @ 2025-01-22 20:42 KuanDong24 阅读(10) 评论(0) 推荐(0) 编辑

1月18日

摘要：继续学习Spark Streaming，重点研究了Spark Streaming的高级特性，如状态管理、窗口操作和滑动窗口完成了Spark Streaming的高级特性代码示例，实现了一个基于窗口的实时数据统计程序 from pyspark import SparkContext from pys 阅读全文

posted @ 2025-01-22 20:42 KuanDong24 阅读(7) 评论(0) 推荐(0) 编辑

1月17日

摘要：今日学习了Spark Streaming的基本原理，包括DStream的创建和操作完成了Spark Streaming的代码示例，实现了一个简单的实时数据处理程序 from pyspark import SparkContext from pyspark.streaming import Stre 阅读全文

posted @ 2025-01-22 20:40 KuanDong24 阅读(9) 评论(0) 推荐(0) 编辑

1月16日

摘要：今日深入学习了Spark SQL的使用方法，了解了DataFrame和Dataset的API 完成了Spark SQL的代码示例，包括数据加载、查询和保存尝试将Python与Spark SQL结合，运行了一个简单的SQL查询，体验了Spark SQL的便捷性阅读全文

posted @ 2025-01-22 20:39 KuanDong24 阅读(9) 评论(0) 推荐(0) 编辑

1月15日

摘要：今日学习了Spark大数据处理的基本概念，包括RDD的创建、转换和行动操作完成了几个简单的RDD操作示例，如map、filter、reduceByKey等通过实际代码，理解了Spark的分布式计算模型和延迟计算机制阅读全文

posted @ 2025-01-22 20:38 KuanDong24 阅读(8) 评论(0) 推荐(0) 编辑

1月14日

摘要：今日深入学习了Python的高级特性，如列表推导式、生成器、装饰器等完成了Python高级特性的代码示例，编写了一个简单的装饰器用于计时函数执行时间复习了Python的异常处理机制阅读全文

posted @ 2025-01-22 20:38 KuanDong24 阅读(5) 评论(0) 推荐(0) 编辑

1月13日

摘要：今日学习了Python编程语言的基础知识，包括变量、数据结构、循环和函数等完成了Python基础语法的练习，编写了简单的数据处理脚本尝试安装了Python的常用数据处理库（如NumPy、Pandas）阅读全文

posted @ 2025-01-22 20:38 KuanDong24 阅读(7) 评论(0) 推荐(0) 编辑

1月12日

摘要：今日继续学习Scala编程语言，重点研究了Scala的类和对象、继承和特质等面向对象编程特性完成了Scala类和对象的代码示例，尝试定义了一个简单的类继承结构阅读了Scala编程规范阅读全文

posted @ 2025-01-22 20:37 KuanDong24 阅读(18) 评论(0) 推荐(0) 编辑

1月11日

摘要：今日深入学习了Scala编程语言的基础语法，包括变量定义、数据类型、控制结构等。完成了几个简单的Scala代码练习，熟悉了Scala的函数式编程风格。尝试将Scala与Spark结合，运行了一个简单的WordCount程序，加深了对Scala在Spark中应用的理解。阅读全文

posted @ 2025-01-22 20:37 KuanDong24 阅读(6) 评论(0) 推荐(0) 编辑

1月10日

摘要：今日学习了Spark生态体系的基本概念，了解了Spark的起源、特点以及与其他大数据技术的关系。完成了Spark生态体系的思维导图绘制，梳理了各组件（如Spark Core、Spark SQL、Spark Streaming、MLlib、GraphX）的功能和用途。阅读全文

posted @ 2025-01-22 20:36 KuanDong24 阅读(9) 评论(0) 推荐(0) 编辑

kuandong24

01 2025 档案

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜