sparkSQL
限定:结构化数据处理
特点:1.融合性无缝集成 2.统一数据访问:一套标准API可以访问不同数据源 3.兼容hive 4.可以通过JDBC/ODBC链接
与hive相比:内存计算/磁盘迭代 底层基于sparkrdd/基于mr sql、代码混合执行/仅sql开发 无元数据管理/metastore
sparksql的数据抽象为dataframe,与pandas不同的是单机与集群的区别
spark2.0之后推出的sparksession,sparksession中可以取出sparkcontext,因此基于sparksession可以进行RDD或者sparksql
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
2023-02-22 2月22日软件工程日报
2023-02-22 AS上的基础中级控件-图形定制