SynapseML MMLSpark 集群 机器学习 训练

 

spark-shell --packages com.microsoft.azure:synapseml_2.12:0.9.5
pyspark --packages com.microsoft.azure:synapseml_2.12:0.9.5
spark-submit --packages com.microsoft.azure:synapseml_2.12:0.9.5 MyApp.jar


#参考地址 https://github.com/microsoft/SynapseML

#参考文档 https://microsoft.github.io/SynapseML/
 
 

初探大规模GBDT训练

初探大规模GBDT训练 - 知乎 (zhihu.com)

 

spark-submit 提交方式 jar

复制代码
/home/work/cloud-hadoop-client/spark232/bin/spark-submit \
--master yarn \
--queue survey \
--deploy-mode cluster \
--name "development_lightgbm" \
--conf spark.yarn.dist.archives=hdfs://shanghai/tools/pylightgbm.tar.gz#pyenv \
--conf spark.pyspark.python=./pyenv/pylightgbm/bin/python \
--jars mmlspark_2.11-0.18.1.jar,lightgbmlib-2.2.350.jar \
--executor-memory 2G \
--driver-memory 4G \
--conf spark.driver.host=10.157.18.46 \
--conf spark.driver.maxResultSize=5g  \
--executor-cores 2 \
--num-executors 2 \
lightgbm_python.py
复制代码

 参考 (21条消息) [机器学习] LightGBM on Spark (MMLSpark) 使用完全手册_魔都Vincent的博客-CSDN博客_mmlspark

 

Spark应用程序第三方jar文件依赖解决方案

(21条消息) Spark应用程序第三方jar文件依赖解决方案_DemonHunter211的博客-CSDN博客_spark第三方包

 

第三方jar手动下载地址

Maven Repository: Search/Browse/Explore (mvnrepository.com)

 

posted @   cup_leo  阅读(516)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
点击右上角即可分享
微信分享提示