09 2019 档案

DataPipeline CTO陈肃：构建批流一体数据融合平台的一致性语义保证

摘要：本文将从数据融合角度，谈一下DataPipeline对批流一体架构的看法，以及如何设计和使用一个基础框架。其次，数据的一致性是进行数据融合时最基础的问题。如果数据无法实现一致，即使同步再快，支持的功能再丰富，都没有意义。另外，DataPipeline目前使用的基础框架为Kafka Connect。为实现一致性的语义保证，我们做了一些额外工作，希望对大家有一定的参考意义。最后，会提一些我们在应用Kafka Connect框架时，遇到的一些现实的工程问题，以及应对方法。尽管大家的场景、环境和数据量级不同，但也有可能会遇到这些问题。希望对大家的工作有所帮助。阅读全文

posted @ 2019-09-20 15:22 DataPipeline数见科技阅读(455) 评论(0) 推荐(0) 编辑

DataPipeline数见科技

09 2019 档案

公告