openmetadata connector 开发简单说明

主要说明开发流程,后续说明具体的开发

参考流程

包含的内容(source,processor,sink) 以及特殊的stage 以及bulksink

  1. wokrlfow 从source 过去record
  2. 如果 processor 配置了,workflow 发送数据到processor
  3. 如果配置多个processor 将会基于顺序处理
  4. processor 处理完成之后回到sink
  5. 重复执行 
    如果需要进行聚合操作,可以使用stage 可以写到其他的file 或者外部存储中,然后就可以使用bulk sink 打不到openmetadata 
    或者es 中

说明

openmetadata 的机制还是比较健全的,而且还是比较清晰简单

参考资料

https://docs.open-metadata.org/open-source-community/developer/build-a-connector
https://github.com/open-metadata/OpenMetadata/tree/main/ingestion/src/metadata/ingestion/api
https://docs.open-metadata.org/open-source-community/developer/build-a-connector/stage
https://docs.open-metadata.org/open-source-community/developer/build-a-connector/bulksink

posted on   荣锋亮  阅读(353)  评论(0编辑  收藏  举报

编辑推荐:
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
历史上的今天:
2020-10-23 apache trafficcontrol 开源的基于golang 的cdn 框架
2020-10-23 sftpgo 多功能高度可配置的sftp server
2020-10-23 opencsv csv 数据解析通用包
2020-10-23 jenkins+ rclone定时同步sftp数据到s3
2018-10-23 statik golang 静态资源嵌入二进制文件工具使用(docker 构建)
2018-10-23 Open-sourcing sso, the way we secure services at BuzzFeed
2018-10-23 streamsets 3.5 的一些新功能

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示