撰写的《大数据处理框架Apache Spark设计与实现》出版了

拖拖拉拉写了很久的书《大数据处理框架Apache Spark设计与实现》终于出版了。书的内容是以Apache Spark为主,系统总结了大数据处理框架的一些基本问题、设计原理、实现方案、以及性能和可靠性。相比之前在github上写的 《SparkInternals》,内容更完善专业深入,书中大概有一半的页配有全彩插图。

感谢孙学瑛编辑及团队的付出、感谢朋友们提出的审阅意见、以及实验室和亲朋好友的大力支持!

大数据处理框架发展很快,还有很多优美匠心的设计和实现方案,本书抛砖引玉,期待有更多的朋友把这些知识总结展示出来。

书籍封面:

京东链接:https://item.jd.com/12924768.html

书的前言(包含简介和版本等信息): https://github.com/JerryLead/ApacheSparkBook/blob/master/Preface.pdf 或者点这里

编辑推荐:

posted on   JerryLead  阅读(2655)  评论(5编辑  收藏  举报

编辑推荐:
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

点击右上角即可分享
微信分享提示