11 2023 档案
pandas学习
摘要:1. Series类型 Series类型由一组数据及与之相关的数据索引组成 也可以自定义索引: 1.1 初始化 从标量创建: 从字典创建: 从ndarray类型创建: 1.2 基本操作 Series类型包括index和values两部分。 Series类型的操作类似ndarray类型 Series类
matplotlib学习
摘要:1. 简介 Matplotlib库的效果:http://matplotlib.org/gallery.html Matplotlib库由各种可视化类构成,内部结构复杂,受Matlab启发 matplotlib.pyplot是绘制各类可视化图形的命令子库相当于快捷方式。 import matplotl
numpy库学习
摘要:1. 初始化 numpy数组即numpy的ndarray对象,创建numpy数组就是把一个列表传入np.array()方法。 下面介绍4种方法: 从Python中的列表、元组等类型创建ndarray数组。 x = np.array(list/tuple) x = np.array(list/tupl
6.支持向量机
摘要:1. 线性可分支持向量机 线性可分支持向量机(Linearly Separable Support Vector Machine)是支持向量机中的一种特例,用于解决线性可分的分类问题。它的目标是找到一个超平面,将不同类别的数据点分隔开,同时最大化分类的间隔。 首先,我们来定义线性可分的SVM的目标函
5. Sklearn岭回归
摘要:1. 线性回归 对于矩阵X,若某些列线性相关性较大(即训练样本中某些属性线性相关 ),就会导致的值接近0,在计算时就会出现不稳定性。 结论:传统的基于最小二乘的线性回归法缺乏稳定性 2.岭回归 通常情况下会
4.Sklearn多项式回归
摘要:1.多项式回归介绍 在一元回归分析中,如果依变量y与自变量X的关系为非线性的,但是又找不到适当的函数曲线来拟合,则可以采用一元多项式回归 多项式回归的最大优点就是可以通过增加X的高次项对实测点进行逼近,直至满意为止。 事实上,多项式回归可以处理相当一类非线性问题,它在回归分析中占有重要的地位,因为任
3.Sklearn-一元线性回归
摘要:1. 导入包 import numpy as np import matplotlib.pyplot as plt from sklearn import linear_model 2. 加载训练数据 # 建立datasets_X和datasets_Y用来存储数据中的房屋尺寸和房屋成交价格。 dat
2.Sklearn库标准数据集及基本功能
摘要:1. sklearn数据集 波士顿房价数据集 波士顿房价数据集包含506组数据,每条数据包含房屋以及房屋周围的详细信息。其中包括城镇犯罪率、一氧化氮浓度、住宅平均房间数、到中心区域的加权距离以及自住房平均房价等。因此,波士顿房价数据集能够应用到回归问题上。 使用sklearn.datasets.lo
2. 电力负荷预测-一元回归
摘要:1. 负荷预测思路 电力负荷的时间序列通常可以由三部分组成。 随机项一般假设为白噪声,即标准正态分布,不改变均值。 周期项有两种假设方法 在数据预处理时进行去周期处理,然后在得到预测结果后,再还原周期。 直接
1. 电力负荷预测概念
摘要:本文完全是视频的照抄啊,原视频:数学建模MATLAB语言及应用(2023秋) 1. 预测 1.1 预测定义 预测就是人们根据事物过去发展变化的客观过程和某些规律性,根据事物运动和变化的状态运用各种定性和定量分析方法,对事物未来可能出现的趋势和可能达到的水平所进行的科学推测 1.2 预测、插值区别 插
lambda,map,filter
摘要:1. Lambda Lambda函数是一种匿名函数,它可以在一行内定义,并通常用于需要简单函数的地方。Lambda函数使用lambda关键字后跟参数列表和冒号,然后在冒号后面定义函数的主体。例如: add = lambda x, y: x + y print(add(2, 3)) # 输出5 Lam
过拟合与欠拟合
摘要:1. 定义 欠拟合的偏差过大,过拟合的方差过高 上图分别为:欠拟合,正常,过拟合 图片中的是多项式回归任务。图一左边的应该是欠拟合,没有将x与o正确分类,中间的是正常的,右边的是过拟合,原因在与x的n次方中的n这个超参数设置太大,导致对训练数据过于拟合,此时应引入正则化项来惩罚次数较高从而导致过大的
逻辑回归
摘要:1. 分类 1.1 motivation 只有两种分类结果的问题成为二分类问题,通常使用0指代false,1指代true 样本也可分为负样本(negative class)和正样本(positive class),例如针对邮件是否为垃圾邮件的问题,正常邮件就是负样本,垃圾邮件就是正样本 由此可知,正