Linkis数据处理实战_ApacheCon_Asia演讲稿
背景
从事大数据开发,参与Linkis社区建设很长时间了,Beam 和 Hive Hook 血缘 搭建大数据平台
缺点
没有统一外部访问,形式比较单一
开发成本比较高,新手不容易扩展
元数据访问复杂
架构
选型
Apache Livy是一种通过REST接口与Spark集群轻松交互的服务。
Apache Zeppelin Web 的交互式数据分析 Notebook,聚焦于“扩展”能力
Netflix Geine 它是分布式作业编排引擎,聚焦于“管控”能力。强大的标签体系,支持按需路由作业到不同的 Hadoop 集群。
openLooKeng 它是一款高性能数据虚拟化引擎,提供统一 SQL 接口,具备跨数据源 / 数据中心分析能力。
Apache Linkis 在上层应用程序和底层引擎之间构建了一层计算中间件。
Linkis 构建解耦计算中间件层,具备连接、扩展、管理、编排和复用能力
金融级别框架,考虑情况比较综合。
- 计算治理服务,支持计算任务/请求处理流程的3个主要阶段:提交->准备->执行;
- 公共增强服务,包括上下文服务、物料管理服务及数据源服务等;
- 微服务治理服务,包括定制化的Spring Cloud Gateway、Eureka、Open Feign。
- 丰富的组件
- 活跃的社区
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· 使用C#创建一个MCP客户端
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· Windows编程----内核对象竟然如此简单?