Pycaret 3.0的RC版本已经发布了,什么重大的改进呢?

Pycaret是Python中的一个开源可自动化机器学习工作流程的低代码机学习库。它是一种端到端的机器学习和模型管理工具。要了解有关Pycaret的更多信息,可以查看官方网站或GitHub。

1、与最新版本的Scikit-Learn完全兼容

Pycaret 2.x需要Scikit-Learn 0.23.2,如果您想在同一Python环境中使用Scikit-Learn和Pycaret的最新版本是不可能的,但是 Pycaret 3.0将与Scikit-Learn的最新版本完全兼容。

2、面向对象的API

PyCaret很棒,但缺乏面向对象的思想。通过加入类和对象,PyCaret改变了从1.0开始的工作方式,

  1. # Functional API (Existing)
  2. # load dataset
  3. from pycaret.datasets import get_data
  4. data = get_data('juice')
  5. # init setup
  6. from pycaret.classification import *
  7. s = setup(data, target = 'Purchase', session_id = 123)
  8. # compare models
  9. best = compare_models()

这很方便,但如果现在你想在同一个notebook上运行不同参数的多个实验,你可能就会遇到参数被覆盖的问题,并且因为是变量的形式,这些参数被覆盖了你也很难发现他们。现在有了新的面向对象的API,参数保存在对象中,不会产生多余的变量,简化了操作。

  1. # load dataset
  2. from pycaret.datasets import get_data
  3. data = get_data('juice')
  4. # init setup 1
  5. from pycaret.classification import ClassificationExperiment
  6. exp1 = ClassificationExperiment()
  7. exp1.setup(data, target = 'Purchase', session_id = 123)
  8. # compare models init 1
  9. best = exp1.compare_models()
  10. # init setup 2
  11. exp2 = ClassificationExperiment()
  12. exp2.setup(data, target = 'Purchase', normalize = True, session_id = 123)
  13. # compare models init 2
  14. best2 = exp2.compare_models()

你还可以使用get_leaderboard函数为每个实验生成结果列表,然后进行比较。

完整文章:

 

https://avoid.overfit.cn/post/5a08306734164b128837e4aca4291554

posted @   deephub  阅读(56)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
点击右上角即可分享
微信分享提示