SparkSQL个人记录

　　SparkSQL将RDD封装成一个DataFrame对象，这个对象类似于关系型数据库中的表。

一、SparkSQL入门

　　相当于数据库中的一张表，它是一个只读的表，不能在运算过程中再往里加元素。RDD.toDF("列名")

　　txt文件不能直接转化成DataFrame，先利用RDD转换成tuple，然后toDF()转换为DataFrame

　　实现步骤：

　　　　①将mysql的驱动jar包上传至Spark的jars目录下

　　　　②重启Spark服务

　　　　③进入spark客户端

　　　　④执行代码，比如在mysql的数据库下有一个test_db库，在test_db库下有一张表为cust_info

　　sh spark-submit --class demo01 ./sparksql-demo-1.0.jar ，执行后出现如下结果：

posted @ 2020-01-30 22:20 coder、阅读(325) 评论(0) 收藏举报

刷新页面返回顶部