Spark—编译Spark源码
Spark版本:Spark-2.1.0
Hadoop版本:hadooop-2.6.0-cdh5.7.0
官方文档:http://spark.apache.org/docs/latest/building-spark.html
一、环境配置
安装并配置好JDK
安装并配置好MAVEN
安装并配置好SCALA
注意:jdk要8以上,maven要3.3.9版本以上
二、在spark源码中的pom.xml中添加cdh仓库源
<repository> <id>cloudera-releases</id> <name>cdh</name> <url>https://repository.cloudera.com/artifactory/cloudera-repos/</url> </repository>
三、使用make-distribution.sh脚本编译生成可运行包
./dev/make-distribution.sh --name 2.6.0-cdh5.7.0 --tgz -Pyarn -Phadoop-2.6 -Phive -Phive-thriftserver -Dhadoop.version=2.6.0-cdh5.7.0
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具