Pycaret 3.0的RC版本已经发布了,什么重大的改进呢?

Pycaret是Python中的一个开源可自动化机器学习工作流程的低代码机学习库。它是一种端到端的机器学习和模型管理工具。要了解有关Pycaret的更多信息,可以查看官方网站或GitHub。

1、与最新版本的Scikit-Learn完全兼容

Pycaret 2.x需要Scikit-Learn 0.23.2,如果您想在同一Python环境中使用Scikit-Learn和Pycaret的最新版本是不可能的,但是 Pycaret 3.0将与Scikit-Learn的最新版本完全兼容。

2、面向对象的API

PyCaret很棒,但缺乏面向对象的思想。通过加入类和对象,PyCaret改变了从1.0开始的工作方式,

  1. # Functional API (Existing)
  2. # load dataset
  3. from pycaret.datasets import get_data
  4. data = get_data('juice')
  5. # init setup
  6. from pycaret.classification import *
  7. s = setup(data, target = 'Purchase', session_id = 123)
  8. # compare models
  9. best = compare_models()

这很方便,但如果现在你想在同一个notebook上运行不同参数的多个实验,你可能就会遇到参数被覆盖的问题,并且因为是变量的形式,这些参数被覆盖了你也很难发现他们。现在有了新的面向对象的API,参数保存在对象中,不会产生多余的变量,简化了操作。

  1. # load dataset
  2. from pycaret.datasets import get_data
  3. data = get_data('juice')
  4. # init setup 1
  5. from pycaret.classification import ClassificationExperiment
  6. exp1 = ClassificationExperiment()
  7. exp1.setup(data, target = 'Purchase', session_id = 123)
  8. # compare models init 1
  9. best = exp1.compare_models()
  10. # init setup 2
  11. exp2 = ClassificationExperiment()
  12. exp2.setup(data, target = 'Purchase', normalize = True, session_id = 123)
  13. # compare models init 2
  14. best2 = exp2.compare_models()

你还可以使用get_leaderboard函数为每个实验生成结果列表,然后进行比较。

完整文章:

 

https://avoid.overfit.cn/post/5a08306734164b128837e4aca4291554

posted @ 2022-05-07 11:31  deephub  阅读(54)  评论(0编辑  收藏  举报