会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
桌子哥
勿忘初心,勿忘心安。
博客园
首页
新随笔
联系
订阅
管理
2020年4月9日
Python+Spark2.0+hadoop学习笔记——Spark ML Pipeline机器学习流程
摘要: 情况一:二元分类 这部分使用的数据集是判断网页是暂时的还是长青的。因为涉及到了文本的信息,所以需要进行文本的数字化和向量化。 在这部分中,机器学习分为三个部分,第一部分是建立机器学习流程pipeline,第二部分是训练,第三部分是预测。 在建立机器学习流程pipeline中包含4个阶段,如下所示:
阅读全文
posted @ 2020-04-09 17:05 桌子哥
阅读(906)
评论(0)
推荐(0)
编辑