02 2024 档案

摘要:什么是架构: 架构产生的必要条件包括: 必须由人执行的工作; 每个人的能力有限; 每个人的时间有限; 人们对目标系统有更高要求; 目标系统的复杂性超出单个人的能力范围。 架构的本质是对目标系统的规划、设计和构建过程,具体体现为: 根据要解决的问题,明确目标系统的边界; 基于某个原则对系统进行有效的切 阅读全文
posted @ 2024-02-28 19:12 一个小虎牙 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2024-02-06 17:51 一个小虎牙 阅读(4) 评论(0) 推荐(0) 编辑
摘要:为什么SparkSQL可以自动优化而RDD不可以? Catalyst优化器 流程 阅读全文
posted @ 2024-02-05 08:32 一个小虎牙 阅读(3) 评论(0) 推荐(0) 编辑
摘要:# coding:utf8 # 指定源代码编码格式为UTF-8 from pyspark.sql import SparkSession # 导入SparkSession类,用于创建和管理Spark应用上下文 from pyspark.sql.functions import concat, exp 阅读全文
posted @ 2024-02-03 18:07 一个小虎牙 阅读(2) 评论(0) 推荐(0) 编辑
摘要:#coding:utf8 #三种创建DataFramed的方法 import pandas as pd from pyspark.sql import SparkSession from pyspark.sql.types import StructType,StringType,IntegerTy 阅读全文
posted @ 2024-02-02 13:56 一个小虎牙 阅读(1) 评论(0) 推荐(0) 编辑
摘要:# coding:utf8 # 指定源代码编码格式为UTF-8 from pyspark.sql import SparkSession # 导入SparkSession类,用于创建和管理Spark应用上下文 from pyspark.sql.functions import concat, exp 阅读全文
posted @ 2024-02-01 14:20 一个小虎牙 阅读(5) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示