Fork me on GitHub
摘要: 1、前序 sparkSQL-2 2、spark程序的序列化 2.1 spark程序序列化描述 对于分布式计算来说,数据后期先需要进行序列化,然后发送给对应的其他计算节点,然后反序列化获取对象数据,最后进行任务执行。 2.2 程序序列化流程 1、在Driver端先把对象数据进行序列化 2、然后把序列化 阅读全文
posted @ 2021-07-13 17:38 是阿凯啊 阅读(69) 评论(0) 推荐(0) 编辑
摘要: SparkSQL-2 1.前言 sparksql-1 2、JDBC数据源 sparksql可以从mysql表中加载大量的数据,然后进行相应的统计分析查询,也可以把最后得到的结果数据写回到mysql表 2.1 通过sparksql加载mysql表中的数据 代码开发 package cn.doit.sp 阅读全文
posted @ 2021-07-13 17:29 是阿凯啊 阅读(91) 评论(0) 推荐(0) 编辑