2019年1月21日
摘要: 采集需求:某服务器的某特定目录下,会不断产生新的文件,每当有新文件出现,就需要把文件采集到HDFS中去 根据需求,首先定义以下3大要素 l 采集源,即source——监控文件目录 : spooldir l 下沉目标,即sink——HDFS文件系统 : hdfs sink l source和sink之 阅读全文
posted @ 2019-01-21 21:25 o_0的园子 阅读(559) 评论(0) 推荐(0) 编辑