2017年5月14日

摘要: 假设workflow里有两个action节点,shell和hive,hive需要用到shell节点里的值,shell脚本如下 hive节点需传入day这个参数。需要用到shell节点里<capture-output/>这个属性,如下 <action name="shell-118a "> <shel 阅读全文
posted @ 2017-05-14 15:46 ilinux_one 阅读(2392) 评论(0) 推荐(0) 编辑
摘要: 1、DataFrame简介: 在Spark中,DataFrame是一种以RDD为基础的分布式数据据集,类似于传统数据库听二维表格,DataFrame带有Schema元信息,即DataFrame所表示的二维表数据集的每一列都带有名称和类型。 类似这样的 2、准备测试结构化数据集 people.json 阅读全文
posted @ 2017-05-14 09:36 ilinux_one 阅读(4363) 评论(0) 推荐(0) 编辑

导航