摘要:
用计数或观察频率代替类别 阅读全文
摘要:
Python Feature Engineering Cookbook 填补缺失数据 缺失数据(即某些观测值缺失)是大多数数据源中不可避免的问题。一些机器学习模型实现可以立即处理缺失数据。要训练其他模型,我们必须删除缺失数据的观测值或将其转换为允许的值。 删除缺失数据的观测值 完整案例分析(Comp 阅读全文
摘要:
Python 3.11.9 pandas 2.2.2 openpyxl 3.1.5 data_frame = pd.read_excel( input_file, "january_2013", index_col=None, engine="openpyxl" ) 出现如下警告: D:\pytho 阅读全文
摘要:
从简单线性回归到多元线性回归 目录从简单线性回归到多元线性回归多项式回归正则化应用线性回归探索数据 之前,我们使用简单线性回归对一个解释变量和一个连续响应变量之间的关系进行建模,并使用披萨的直径去预测其价格。我们将讨论多元线性回归,它一种将一个连续响应变量在多个特征上进行回归的简单线性回归泛化形式。 阅读全文
摘要:
简单线性回归 虽然简单线性回归对于现实世界的问题几乎不具有可用性,但是理解简单线性回归是理解许多其他模型的关键。 简单线性回归(一元) 假设你希望了解披萨的价格。你可能会简单地查看菜单。但是这里,我们将基于能观测到的披萨的属性或者说解释变量,来预测披萨的价格。让我们来对披萨的尺寸和价格之间的关系进行 阅读全文
摘要:
线性模型:逻辑回归 目录线性模型:逻辑回归引言机器学习中的逻辑回归提供训练集和测试集 引言 线性回归是一种非常古老的方法,也是传统统计的一部分。机器学习线性回归涉及训练集和测试集。这样,就可以通过利用交叉验证与其他模型和算法进行比较。传统的线性回归对整个数据集进行训练和测试。这仍然是一种常见的做法, 阅读全文
摘要:
高性能机器学习:Numpy 目录高性能机器学习:NumpyNumPy 基础Numpy 数组的形状与维度Numpy 广播初始化 Numpy 数组和数据类型 机器学习强调测量预测能力,而使用 scikit-learn 我们可以准确、快速地进行预测。衡量预测能力主要依靠在训练数据上构建模型,在测试数据上衡 阅读全文
摘要:
Getting Started with Reportlab 当在 PDF 中定位项目时,是根据距离原点的点数进行定位的。这是点,而不是像素、毫米或英寸。 Canvas 对象 showPage() 方法将保存画布的当前页面。实际上这不是必需的,但建议这样做。showPage() 方法还会结束当前页面 阅读全文