123学习总结
1.框架 vs 类库
类库:一堆别人写好的代码,你可以导入进使用。pandas就是python的类库
框架:可以独立运行,并提供变成结构的一种软件产品 。spark就是一个独立的框架
pandas:用于小规模数据集的处理
spark:用于大规模数据集的处理
2.pyspark:spark官方提供的一个python类库,内置了完全的spark api,可以通过pyspark应用程序,并将其提交到saprk集群中运行
3.bin/pyspark是一个交互式程序,可以提供交互式编程并执行spark计算
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Ollama——大语言模型本地部署的极速利器
· 使用C#创建一个MCP客户端
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· Windows编程----内核对象竟然如此简单?
· ollama系列1:轻松3步本地部署deepseek,普通电脑可用