摘要: 一个Dataset是一个分布式的数据集,而且它是一个新的接口,这个新的接口是在Spark1.6版本里面才被添加进来的,所以要注意DataFrame是先出来的,然后在1.6版本才出现的Dataset,提供了哪些优点呢?比如强类型,支持lambda表达式,还有还提供了sparksql执行引擎的一些优化, 阅读全文
posted @ 2019-10-26 00:30 wqbin 阅读(565) 评论(0) 推荐(0) 编辑