霸王花本花

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

今天跟大家分享的是Spark 中文实战图鉴的部分内容,下拉文末获取网盘链接

一、Spark 最佳实践

  1. 使用 Databricks 作为分析平台

  1. 领英如何应对 Apache Spark 的 Scalability 挑战

  1. 利用闪存优化在 Cosco 基础上的 Spark Shuffle

  2. 基于 Spark 和 TensorFlow 的机器学习实践

  3. 在 kubernetes 上运行 apache spark:最佳实践和陷阱

  4. 使用 RayOnSpark 在大数据平台上运行新兴的人工智能应用

  5. 使用 Ray 将可扩展的自动化机器学习(AutoML)用于时序预测

  6. Apache Spark 3.0 对 Prometheus 监控的原生支持

二、阿里云开源大数据平台实践

  1. 助力云上开源生态 - 阿里云开源大数据平台的发展

  2. EMR Spark-SQL 性能极致优化揭秘 概览篇

  3. EMR Spark-SQL 性能极致优化揭秘 RuntimeFilter Plus

  4. EMR Spark-SQL 性能极致优化揭秘 Native Codegen Framework

  5. Spark Codegen 浅析

  6. Tablestore 结合 Spark 的流批一体 SQL 实战

  7. Tablestore+Delta Lake(快速开始)

点击链接获取完整文档
链接:https://pan.baidu.com/s/1vMjeg7Ylx3vjT7TuDNLEVw
提取码:palq

posted on 2020-12-03 22:00  霸王花本花  阅读(108)  评论(0编辑  收藏  举报