apache spark conenct 提升spark 能力

spark 是一个很强大的工具,但是大家可能也会使用比较费事,包含了集群管理,以及多租户管理,所以社区开发了不少
基于spark 的扩展,apachekyuubi 就是一个典型提供了多租户以及直接使用sql 进行spark 操作的能力

原有spark 集成模式

 

 

新spark 集成模式

 

 

说明

apache spark conenct 利用了grpc 以及arrow 进行协议通信,这样以后我们开发基于spark 的处理就很简单了,从目前来说原有开源软件基于单体的模式都在向模块化
以及可灵活集成发现

参考资料

https://databricks.com/blog/2022/07/07/introducing-spark-connect-the-power-of-apache-spark-everywhere.html

posted on   荣锋亮  阅读(133)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
历史上的今天:
2017-07-09 转 neighbour table overflow 问题解决
2015-07-09 window.close(); 关闭浏览器窗口js代码的分析总结

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示