Apache Spark 通过容器镜像拉起实例
Apache Spark™ 是一种多语言引擎,用于在单节点机器或集群上执行数据工程、数据科学和机器学习。它提供 Scala、Java、Python 和 R 中的高级 API,以及支持用于数据分析的通用计算图的优化引擎。它还支持一组丰富的高级工具,包括用于 SQL 和 DataFrames 的 Spark SQL、用于 pandas 工作负载的 Spark 上的 pandas API、用于机器学习的 MLlib、用于图形处理的 GraphX 和用于流处理的结构化流。
Apache Spark™ - Unified Engine for large-scale data analytics
拉取镜像
https://registry.hub.docker.com/r/apache/spark
直接获取镜像命令如下:
docker pull apache/spark
在线文档
您还可以再网上找到最新的 Spark 文档,包括编程指南。此 README 文件仅包含基本设置说明。
交互式 Scala Shell
开始使用 Spark 的最简单方法是通过 Scala shell:
docker run -it apache/spark /opt/spark/bin/spark-shell
尝试以下命令,它应该返回 1,000,000,000:
scala> spark.range(1000 * 1000 * 1000).count()
在 Kubernetes 上运行 Spark
在 Spark 上运行 Python
使用https://hub.docker.com/r/apache/spark-pyhttps://hub.docker.com/r/apache/spark-py
在 Spark 上运行 R
使用https://hub.docker.com/r/apache/spark-rhttps://hub.docker.com/r/apache/spark-r
纸上得来终觉浅,绝知此事要躬行。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
2023-09-08 Eclipse 安装Gradle插件
2022-09-08 解决视频OCX在调用云台指令使用鼠标事件来发起和结束指令动作无效