机器学习项目工作的标准流程,可以参考

标准流程:

  1. 理解问题:理解问题的核心,相关领域的问题、经验、限制、惯例、内外影响等等。
  2. Collect input features
  3. Preprocess:Fillna(fill 0,mean,or by model(eg rf)), Outlier
  4. Feature engineering:
    1. Normalize: min-max,z-score,pca,zca
    2. Transform: square,log,exp,sin,cos,rotate
    3. Embedding: one-hot, category
    4. Binning: eg. age 0-14:1 , 14-20:2
    5. Cross feature: eg. X1*X2
    6. De-periodic:eg. fft
    7. TD: y[n] = x[n] -x[n-t]
  5. Sampling: Uniform, Stratified, Pool, Undersampling, Oversampling,MCMC, Gibbs, SMOTE
  6. Build Model : DL or ML
  7. Train: Hyper params(grid search), cross validation
  8. Validate: Get metrics
posted @   blcblc  阅读(45)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
历史上的今天:
2020-02-21 NLP思维导图,可以用来查漏补缺
2020-02-21 敏感性Sensitivity和特异性Specificity的说明
2020-02-21 各种指标回顾,很好,F1-score, p, r, roc, auc
2020-02-21 highway, resnet, inception
2018-02-21 美团技术博客笔记 - 推荐,AI 相关,频繁集干预
2018-02-21 反省,初二初三和初五没有做笔记,没关系,持之以恒,这三天没做的笔记后面再补上,一万小时定律
2017-02-21 求所有逆序对
点击右上角即可分享
微信分享提示