会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
hgz_dm
博客园
首页
新随笔
联系
订阅
管理
2021年12月20日
利用pyspark pandas_udf 加速机器学习任务
摘要: 实验是最能定义数据科学家日常生活的词。为了为给定的问题构建一个合适的机器学习模型,数据科学家需要训练多个模型。此过程包括诸如寻找模型的最佳超参数、使用 K 折交叉验证模型,有时甚至训练具有多个输出的模型等任务。前面提到的所有这些任务都很耗时,但对于模型开发的成功来说却极为重要。在这篇博文中,我们将展
阅读全文
posted @ 2021-12-20 20:50 hgz_dm
阅读(1381)
评论(0)
推荐(1)
编辑
公告