Auto ML(Auto Machine Learning)自动机器学习是个宽泛的概念,有不只一个软件以此命名,本篇介绍的Auto-ML并非谷歌基于云平台的 AUTOML。本篇介绍的Auto-ML也是一款开源的离线工具,它的优势在于简单快速,且输出信息比较丰富。它默认支持Keras、TensorFlow、XGBoost、LightGBM 、CatBoost和 Sklearn等机器学习模型,整体使用进化网格搜索的方法完成特征处理和模型优化。
安装
Auto-ML安装方法如下:
$ pip install auto-ml
为更多地了解auto-ml的功能和用法,建议下载其源码:
$ git clone https://github.com/ClimbsRocks/auto_ml
举例
本例也使用96年美国大选数据,将”投票vote”作为因变量,它有只0/1两种取值,因此使用分类方法type_of_estimator=’classifier’,训练时需要用字典的方式指定各字段类型:其中包括:因变量output,分类型变量categorical,时间型变量date,文本nlp,以及不参与训练的变量ignore。
from auto_ml import Predictor
import statsmodels.api as sm
data = sm.datasets.anes96.load_pandas().data
column_descriptions = {
'vote': 'output',
'TVnews': 'categorical',
'educ': 'categorical',
'income': 'categorical',
}
ml_predictor = Predictor(type_of_estimator='classifier',
column_descriptions=column_descriptions)
model = ml_predictor.train(data)
model.score(data, data.vote)
# 谢彦技术博客
程序的输出较多,不在此列出,相对Auto-Sklearn,Auto-ML的输出内容丰富得多,包含最佳模型,特征重要性,对预测结果的各种评分,建议读者自行运行上述例程。由于它同时支持深度学习模型和机器学习模型,可使用深度学习模型提取特征,用机器学习模型完成具体的预测,从而得到更好的训练结果。
(转载请注明出处:https://blog.csdn.net/xieyan0811/article/details/89059887)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具