摘要: object CatalogApiTest { def main(args: Array[String]): Unit = { val spark = SparkSession .builder() .appName("CatalogApiTest") .getOrCreate() //查看spark sql应用用的是哪一种catalog... 阅读全文
posted @ 2019-09-08 23:04 花未全开*月未圆 阅读(1010) 评论(0) 推荐(0) 编辑
摘要: object ParquetFileTest { def main(args: Array[String]): Unit = { val spark = SparkSession .builder() .appName("ParquetFileTest") .getOrCreate() //1: 将json文件数据转化成parquet文件数据 val df = spark.read.json(s" 阅读全文
posted @ 2019-09-08 23:03 花未全开*月未圆 阅读(546) 评论(0) 推荐(0) 编辑
摘要: import com.twq.dataset.Utils._ import org.apache.spark.sql.{SaveMode, SparkSession} object FilePartitionTest { def main(args: Array[String]): Unit = { val spark = SparkSession .builder() .appName("Fil 阅读全文
posted @ 2019-09-08 23:02 花未全开*月未圆 阅读(1296) 评论(0) 推荐(0) 编辑
摘要: object JdbcDatasourceTest { def main(args: Array[String]): Unit = { val spark = SparkSession .builder() .appName("JdbcDatasourceTest") .master("local") .getOrCreate() ... 阅读全文
posted @ 2019-09-08 23:01 花未全开*月未圆 阅读(850) 评论(0) 推荐(0) 编辑
摘要: object CSVFileTest { def main(args: Array[String]): Unit = { val spark = SparkSession .builder() .appName("CSVFileTest") .master("local") .getOrCreate() import spar... 阅读全文
posted @ 2019-09-08 23:00 花未全开*月未圆 阅读(4762) 评论(0) 推荐(1) 编辑
摘要: 阅读全文
posted @ 2019-09-08 22:59 花未全开*月未圆 阅读(1301) 评论(0) 推荐(0) 编辑
摘要: 数据源-基本操作load和save 阅读全文
posted @ 2019-09-08 22:58 花未全开*月未圆 阅读(2196) 评论(0) 推荐(0) 编辑
摘要: Dataset创建 DataFrame创建 RDD&Dataset&DataFrame的转换 schema的定义以及复杂数据类型的用法 阅读全文
posted @ 2019-09-08 22:54 花未全开*月未圆 阅读(365) 评论(0) 推荐(0) 编辑
摘要: 一、Flume简介 flume 作为 cloudera 开发的实时日志收集系统,受到了业界的认可与广泛应用。Flume 初始的发行版本目前被统称为 Flume OG(original generation),属于 cloudera。 但随着 FLume 功能的扩展,Flume OG 代码工程臃肿、核 阅读全文
posted @ 2019-09-08 21:52 花未全开*月未圆 阅读(252) 评论(0) 推荐(0) 编辑
摘要: Spark Streaming通过push模式和pull模式两种模式来集成Flume push模式:Spark Streaming端会启动一个基于Avro Socket Server的Receiver来接收Flume中的avro sink发来的数据,这个时候Flume avro sink就是作为客户 阅读全文
posted @ 2019-09-08 21:42 花未全开*月未圆 阅读(454) 评论(0) 推荐(0) 编辑