摘要: 关联规则学习是一种基于规则的机器学习方法,用于发现大型数据库中变量之间的有趣关系。它旨在使用一些有趣的度量来识别数据库中发现的强规则。例如,在超市销售数据中找到的规则{洋葱,土豆} --> {汉堡}将表明,如果客户一起购买洋葱和土豆,他们很可能也会购买汉堡。此类信息可用作营销活动决策的基础,例如促销 阅读全文
posted @ 2022-12-19 11:50 软锰矿 阅读(84) 评论(0) 推荐(0) 编辑
摘要: 异常检测是识别与大多数数据明显不同的稀有物品、事件或观察结果的任务。通常,异常项目会转化为某种问题,例如银行欺诈、结构缺陷、医疗问题或文本中的错误。存在三大类异常检测技术: 无监督异常检测:无监督异常检测技术通过查找似乎最不适合数据集其余部分的实例来检测未标记测试数据集中的异常,前提是数据集中的大多 阅读全文
posted @ 2022-12-19 09:33 软锰矿 阅读(162) 评论(0) 推荐(0) 编辑
摘要: 聚类分析是将一组对象分组的任务,使同一组(称为聚类)中的对象彼此之间比其他组中的对象更相似。它是一种探索性数据挖掘活动,也是用于许多领域的统计数据分析的常用技术,包括机器学习、模式识别、图像分析、信息检索、生物信息学、数据压缩和计算机图形学。集群的一些常见现实用例是: 根据购买历史或兴趣进行客户细分 阅读全文
posted @ 2022-12-18 23:25 软锰矿 阅读(267) 评论(0) 推荐(0) 编辑
摘要: 回归 回归分析是一组统计过程,用于估计因变量(通常称为“结果变量”或“目标”)与一个或多个自变量(通常称为“特征”、“预测变量”或“协变量”)之间的关系。机器学习回归的目标是预测连续值,如销售金额、数量、温度等。 PyCaret 的回归模块是一个监督机器学习模块,用于使用各种技术和算法预测连续值/结 阅读全文
posted @ 2022-12-18 20:27 软锰矿 阅读(223) 评论(0) 推荐(0) 编辑
摘要: PyCaret 的分类模块是一个监督式机器学习模块,用于将元素分类为组。目标是预测离散和无序的分类类标签。一些常见的用例包括预测客户违约(是或否)、预测客户流失(客户将离开或留下)、发现的疾病(阳性或阴性)。此模块可用于二进制或多类问题。它提供了几个预处理准备数据以进行建模的功能set up功能。它 阅读全文
posted @ 2022-12-16 23:16 软锰矿 阅读(163) 评论(0) 推荐(0) 编辑
摘要: 特征工程 在机器学习实验中经常会看到,通过算术运算组合的两个特征在解释数据中的差异时变得比单独使用同一两个特征更为重要。通过现有特征的交互创建新特征称为特征交互。它可以在PyCaret中使用设置中的 feature_interaction 和 feature_ratio 参数来实现。特征交互通过两个 阅读全文
posted @ 2022-12-16 14:53 软锰矿 阅读(407) 评论(0) 推荐(0) 编辑
摘要: 一、数据规范化 规范化是机器学习中常用的一种数据准备技术。规范化的目标是重新调整数据集中数值列的值,而不会扭曲值范围中的差异或丢失信息。这可以在PyCaret中使用设置中的 normalize 参数来实现。有几种方法可用于规范化,默认情况下,它使用“zscore”来规范化数据,可以在安装程序中使用n 阅读全文
posted @ 2022-12-15 22:25 软锰矿 阅读(141) 评论(0) 推荐(0) 编辑
摘要: 一、缺失值处理 由于各种原因,数据集可能有丢失的值或空记录,通常编码为空或NaN,删除缺少值的样本是一种基本策略,有时会用到,但它会带来丢失可能有价值的数据和相关信息或模式的代价。一个更好的策略是估算缺失的值。默认情况下,PyCaret按数字特征的“平均值”和分类特征的“常量”输入数据集中缺少的值。 阅读全文
posted @ 2022-12-15 22:13 软锰矿 阅读(146) 评论(0) 推荐(0) 编辑
摘要: 1、新建一个名为pycaret的环境 conda create -n pycaret 因为当前版本过于低,需要安装新版本,按y继续则可安装成功 2、激活新建的环境 conda activate pycaret 3、安装python环境 conda install python=3.6.2 4、在新环 阅读全文
posted @ 2022-12-13 14:52 软锰矿 阅读(144) 评论(0) 推荐(0) 编辑
摘要: 一、灰度预测函数 def GM11(x0): #自定义灰色预测函数 import numpy as np x1 = x0.cumsum() #1-AGO序列 z1 = (x1[:len(x1)-1] + x1[1:])/2.0 #紧邻均值(MEAN)生成序列 z1 = z1.reshape((len 阅读全文
posted @ 2022-04-02 10:24 软锰矿 阅读(75) 评论(0) 推荐(0) 编辑