05 2022 档案

摘要:采集文件到HDFS 采集需求:**业务系统使用 log4j 生成的日志,日志内容不断增加,需要把追加到日志文件中的数据实时采集到 hdfs **根据需求,首先定义一下三大要素: 采集源:即source——监控文件内容更新:exec ‘tail -F file’ 下沉目标,即sink——HDFS文件系 阅读全文
posted @ 2022-05-19 11:37 shan_zhayidian 阅读(179) 评论(0) 推荐(0) 编辑