摘要: 面向对象 1.初识类: 2.类属性引用和实例化 属性引用:类型.属性 实例化:类名加括号就是实例化,会自动触发__init__函数的运行,可以用它来为每个实例定制自己的特征 3.类命名空间与对象、实例的命名空间 4.面向对象三大特性 继承: 新建的类可以继承一个或多个父类,父类又可称为基类或超类,新 阅读全文
posted @ 2019-04-26 15:58 问题不大1 阅读(232) 评论(0) 推荐(0) 编辑
摘要: RDD.DataFrame.DataSet的区别和联系 共性: 1)都是spark中得弹性分布式数据集,轻量级 2)都是惰性机制,延迟计算 3)根据内存情况,自动缓存,加快计算速度 4)都有partition分区概念 5)众多相同得算子:map flatmap 等等 区别: 1)RDD不支持SQL 2)DF每一行都是Row类型,不能直接访问字段,必须解析才行 3)DS每一行是... 阅读全文
posted @ 2019-04-26 10:49 问题不大1 阅读(480) 评论(0) 推荐(0) 编辑
摘要: package kafka import java.io.InputStream import java.text.SimpleDateFormat import java.util.{Date, HashMap, Properties} import com.google.gson.JsonObject import org.apache.kafka.clients.producer.{K... 阅读全文
posted @ 2019-04-26 10:33 问题不大1 阅读(172) 评论(0) 推荐(0) 编辑