摘要: 总结一下前几天遇到的问题以及解决方案 1.为什么要将RDD转换为DataFrame? 因为这样的话,我们就可以直接针对HDFS等任何可以构建为RDD的数据, 使用Spark SQL进行SQL查询了。这个功能是无比强大的。针对HDFS中的数据,直接就可以使用SQL进行查询。 第一种方式,是使用反射来推 阅读全文
posted @ 2020-02-15 20:19 云破月来花弄影 阅读(73) 评论(0) 推荐(0) 编辑