摘要:
假设workflow里有两个action节点,shell和hive,hive需要用到shell节点里的值,shell脚本如下 hive节点需传入day这个参数。需要用到shell节点里<capture-output/>这个属性,如下 <action name="shell-118a "> <shel 阅读全文
摘要:
1、DataFrame简介: 在Spark中,DataFrame是一种以RDD为基础的分布式数据据集,类似于传统数据库听二维表格,DataFrame带有Schema元信息,即DataFrame所表示的二维表数据集的每一列都带有名称和类型。 类似这样的 2、准备测试结构化数据集 people.json 阅读全文