摘要: spark 1.5.1是支持直接读取gz格式的压缩包的,和普通文件没有什么区别: 使用spark-shell进入spark shell 交互界面: 输入命令: 回车后是可以看到该目下很多个gz压缩包文件都被打印出来了。 参考文章: http://blog.csdn.net/xuyaoqiaoyaog 阅读全文
posted @ 2016-11-20 04:01 cctext 阅读(6449) 评论(0) 推荐(0) 编辑
摘要: DataFrame写入hive API: 将DataFrame数据写入hive指定数据表的分区中 将数据写入分区表的思路是:首先将DataFrame数据写入临时表,之后是由hiveContext.sql语句将数据写入hive分区表中。具体操作如下: 声明本文转自:http://www.aboutyu 阅读全文
posted @ 2016-11-20 03:43 cctext 阅读(16664) 评论(0) 推荐(0) 编辑