1-12日报

Source 组件 -Taildir source

监听一个文件夹或者文件,通过正则表达式匹配需要监听的 数据源文件,Taildir Source通过将监听的文件位置写入到文件中来实现断点续传,并且能够保证没有重复数据的读取.

  • 重要参数

    type:source类型TAILDIR

    positionFile:保存监听文件读取位置的文件路径

    idleTimeout:关闭空闲文件延迟时间,如果有新的记录添加到已关闭的空闲文件

    taildir srouce将继续打开该空闲文件,默认值120000毫秒

    writePosInterval:向保存读取位置文件中写入读取文件位置的时间间隔,默认值
    3000毫秒

    batchSize:批量写入channel最大event数,默认值100

    maxBackoffSleep:每次最后一次尝试没有获取到监听文件最新数据的最大延迟时 间,默认值5000毫秒

    cachePatternMatching:对于监听的文件夹下通过正则表达式匹配的文件可能数量 会很多,将匹配成功的监听文件列表和读取文件列表的顺序都添加到缓存中,可以提高性能,默认值true

    fileHeader :是否添加文件的绝对路径到event的header中,默认值false

    fileHeaderKey:添加到event header中文件绝对路径的键值,默认值file

    filegroups:监听的文件组列表,taildirsource通过文件组监听多个目录或文件

    filegroups.<filegroupName>:文件正则表达式路径或者监听指定文件路径
    channels:Source对接的Channel名称


posted @ 2022-01-12 20:10  软工新人  阅读(34)  评论(0编辑  收藏  举报