天下之事,必先处之难,而后易之。

Apache Spark 通过容器镜像拉起实例

Apache Spark™ 是一种多语言引擎,用于在单节点机器或集群上执行数据工程、数据科学和机器学习。它提供 Scala、Java、Python 和 R 中的高级 API,以及支持用于数据分析的通用计算图的优化引擎。它还支持一组丰富的高级工具,包括用于 SQL 和 DataFrames 的 Spark SQL、用于 pandas 工作负载的 Spark 上的 pandas API、用于机器学习的 MLlib、用于图形处理的 GraphX 和用于流处理的结构化流。

Apache Spark™ - Unified Engine for large-scale data analytics

拉取镜像

https://registry.hub.docker.com/r/apache/spark

直接获取镜像命令如下:

docker pull apache/spark

在线文档


您还可以再网上找到最新的 Spark 文档,包括编程指南。此 README 文件仅包含基本设置说明。

Documentation | Apache Spark


交互式 Scala Shell

开始使用 Spark 的最简单方法是通过 Scala shell:

docker run -it apache/spark /opt/spark/bin/spark-shell

尝试以下命令,它应该返回 1,000,000,000:

scala> spark.range(1000 * 1000 * 1000).count()


​在 Kubernetes 上运行 Spark

https://spark.apache.org/docs/latest/running-on-kubernetes.html ⁠icon-default.png?t=O83Ahttps://spark.apache.org/docs/latest/running-on-kubernetes.html

 在 Spark 上运行 Python

使用https://hub.docker.com/r/apache/spark-pyicon-default.png?t=O83Ahttps://hub.docker.com/r/apache/spark-py

 在 Spark 上运行 R

使用https://hub.docker.com/r/apache/spark-ricon-default.png?t=O83Ahttps://hub.docker.com/r/apache/spark-r

posted @   boonya  阅读(3)  评论(0编辑  收藏  举报  
相关博文:
阅读排行:
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
历史上的今天:
2023-09-08 Eclipse 安装Gradle插件
2022-09-08 解决视频OCX在调用云台指令使用鼠标事件来发起和结束指令动作无效
我有佳人隔窗而居,今有伊人明月之畔。
轻歌柔情冰壶之浣,涓涓清流梦入云端。
美人如娇温雅悠婉,目遇赏阅适而自欣。
百草层叠疏而有致,此情此思怀彼佳人。
念所思之唯心叩之,踽踽彳亍寤寐思之。
行云如风逝而复归,佳人一去莫知可回?
深闺冷瘦独自徘徊,处处明灯影还如只。
推窗见月疑是归人,阑珊灯火托手思忖。
庐居闲客而好品茗,斟茶徐徐漫漫生烟。

我有佳人在水之畔,瓮载渔舟浣纱归还。
明月相照月色还低,浅近芦苇深深如钿。
庐山秋月如美人衣,画堂春阁香气靡靡。
秋意幽笃残粉摇曳,轻轻如诉画中蝴蝶。
泾水潺潺取尔浇园,暮色黄昏如沐佳人。
青丝撩弄长裙翩翩,彩蝶飞舞执子手腕。
香带丝缕缓缓在肩,柔美体肤寸寸爱怜。
如水之殇美玉成欢,我有佳人清新如兰。
伊人在水我在一边,远远相望不可亵玩。

点击右上角即可分享
微信分享提示