混合学习 实战
摘要:简介 code #数据增强 from tensorflow.keras.preprocessing.image import ImageDataGenerator path = """original_data""" dst_path = """gen_data""" datagen = Image
阅读全文
posted @
2022-04-30 17:50
HDU李少帅
阅读(32)
推荐(0) 编辑
迁移学习实战
摘要:简介 实现 二次函数的拟合,然后将新的二次函数进行迁移拟合 code import numpy as np import matplotlib.pyplot as plt def fix_seed(seed=1): # reproducible np.random.seed(seed) # make
阅读全文
posted @
2022-04-30 15:49
HDU李少帅
阅读(66)
推荐(0) 编辑
混合学习
摘要:简介 样本数据中 有带标签和 不带标签的。 半监督学习 监督学习与无监督学习相结合的一种学习方法,它同时利用有标记样本与无标记样本进行学习。 目的: 在标记样本有限的情况下, 尽可能识别出总样本的共同特性。 英文: Semi-Supervised Learning 伪标签学习:用有标签数据训练一个分
阅读全文
posted @
2022-04-30 11:53
HDU李少帅
阅读(110)
推荐(0) 编辑
迁移学习&在线学习
摘要:简介 英文: transfer learning 以已训练好的模型A为起点,在新场景中,根据新数据建立模型B 目的:将某个领域或任务上学习到的知识或模式,应用到不同但相关的领域或问题中。 特征提取 使用模型A,移除输出层,提取目标特征信息 结构引用 使用模型A的结构,重新/二次训练权重系数参数 部分
阅读全文
posted @
2022-04-30 11:33
HDU李少帅
阅读(201)
推荐(0) 编辑
LSTM 文本预测
摘要:LSTM RNN对于前面的信息会有意外,LSTM可以基础相应的信息 code #加载数据 data = open("LSTM_text.txt").read() #移除换行 data = data.replace("\n","").replace("\r","") print(data) #分出字符
阅读全文
posted @
2022-04-29 15:27
HDU李少帅
阅读(226)
推荐(0) 编辑
RNN实现股价预测
摘要:简介 import pandas as pd import numpy as np data = pd.read_csv('zgpa_train.csv') data.head() price = data.loc[:,'close'] price.head() # 归一化处理 price_norm
阅读全文
posted @
2022-04-29 11:13
HDU李少帅
阅读(352)
推荐(0) 编辑
循环神经网络RNN
摘要:简介 前部序列的信息经过处理后,作为输入信息传递到后部序列。 普通RNN结构 前面的信息会在传递的过程中丢失 求解过程中梯度消失 LSTM 长短期记忆网络 在网络结构很深的情况下,也能保留重要信息 解决了普通RNN求解过程中的梯度消失问题 DRNN
阅读全文
posted @
2022-04-28 16:49
HDU李少帅
阅读(40)
推荐(0) 编辑
卷积神经网络
摘要:简介 卷积神经网络 专有名词释义 卷积层, 使用算子对图像进行卷积,感觉是对图像信息的一种压缩。 池化层, 分块提取信息 padding, 防止卷积的时候信息丢失 全连接层,图像信息都对对接 经典CNN模型 参考经典的CNN结构搭建新模型 使用经典的CNN模型结构对图像预处理,再建立MLP模型 经典
阅读全文
posted @
2022-04-28 10:56
HDU李少帅
阅读(197)
推荐(0) 编辑
多层感知器
摘要:简介 将多个 逻辑回归 网络 层叠起来 构建 多层感知器 在不增加高次项数据的情况下,如何通过MLP实现非线性分类预测。 + MNIST 数据集的MLP模型 参考链接 推荐安装 李沐 的 cuda 还有GPU版本 https://www.bilibili.com/video/BV18K411w7Vs
阅读全文
posted @
2022-04-26 14:44
HDU李少帅
阅读(120)
推荐(0) 编辑
实战(二) 机器学习之数据分离与混淆矩阵
摘要:简介 使用多个KNN参数进行训练 参考链接 https://blog.csdn.net/weixin_46344368/article/details/107214449?spm=1001.2014.3001.5502 code #加载数据 import pandas as pd import nu
阅读全文
posted @
2022-04-25 17:20
HDU李少帅
阅读(87)
推荐(0) 编辑
实战(一):酶活性预测
摘要:简介 使用多个 线性回归参数对模型进行预测。 code # load the data import pandas as pd import numpy as np data_train = pd.read_csv('T-R-train.csv') data_train #数据预览 #define
阅读全文
posted @
2022-04-25 13:25
HDU李少帅
阅读(346)
推荐(0) 编辑
模型优化
摘要:简介 探讨模型优化 任务二分类 问题1: 用什么算法? 逻辑回归 KNN 决策树 神经网络 问题2: 具体算法的核心结构或参数如何选择? 逻辑回归边界函数用什么:线性,多项式? KNN的核心参数n_neighbors取多少合适。 问题3: 模型表现不佳,怎么办?? 训练数据准确率太低 测试数据准确率
阅读全文
posted @
2022-04-25 11:46
HDU李少帅
阅读(109)
推荐(0) 编辑
机器学习之数据分离与混淆矩阵
摘要:简介 实例基本流程: 数据载入->数据可视化与预处理->模型创建->全数据用于模型训练->模型评估 数据分离可以用于模型评估 对全数据进行数据分离,部分用于训练,部分用于新数据的结果预测! 通常来说分为3步: 把数据分成两部分:训练集、测试集 使用训练集数据进行模型训练 使用测试集数据进行预测,更有
阅读全文
posted @
2022-04-25 11:23
HDU李少帅
阅读(202)
推荐(0) 编辑
欠拟合 与 过拟合
摘要:简介 模型不合适,导致其无法对数据实现有效预测 | | 训练数据 | 预测数据 | | | | | | 欠拟合 | 不准确 | 不准确 | | 过拟合 | 准确 | 不准确 | | 好模型 | 准确 | 准确 | 原因 模型结构过于复杂(维度过高) 使用了过多属性,模型训练时包含了干扰信息 解决办法
阅读全文
posted @
2022-04-22 15:39
HDU李少帅
阅读(39)
推荐(0) 编辑
实战 PCA
摘要:简介 PCA code #加载数据 import pandas as pd import numpy as np data = pd.read_csv('iris_data.csv') data.head(100) print(pd.value_counts(data.loc[:,'label'])
阅读全文
posted @
2022-04-22 15:15
HDU李少帅
阅读(34)
推荐(0) 编辑
实战 异常检测
摘要:简介 参考链接 https://blog.csdn.net/weixin_46344368/article/details/106312536?spm=1001.2014.3001.5502 code # 实战 异常检测 #加载数据 import pandas as pd import numpy
阅读全文
posted @
2022-04-22 14:37
HDU李少帅
阅读(54)
推荐(0) 编辑
PCA 主成分分析
摘要:简介 数据降维, 是指在某些限定条件下,降低随机变量个数,得到一组不相关主变量的过程 作用: 实现数据可视化 减少模型分析数据量,提升处理效率,降低计算难度 如何实现? 使投影后数据的方差最大,因为方差越大数据也越分散 计算过程: 原始数据预处理(标准化 \(\mu = 0, \sigma = 1\
阅读全文
posted @
2022-04-22 11:22
HDU李少帅
阅读(88)
推荐(0) 编辑
异常检测
摘要:简介 自动寻找 异常 根据输入数据, 对不符合预期模式的数据进行识别 概率密度 概率密度函数是一个描述随机变量在某个确定的取值点附近的可能性的函数 区间概率
P(x1,x2)∫x2x1p(x)dx 高斯分布(正态分布?) \[ p(x)=\frac{1}{\si
阅读全文
posted @
2022-04-22 11:03
HDU李少帅
阅读(69)
推荐(0) 编辑
决策树
摘要:简介 一种对实例进行分类的树形结构,通过多层判断区分目标所属类别 本质:通过多层判断,从训练数据集中归纳出一组分类规则 优点: 计算量小,运算速度较快 易于理解,可清晰查看各属性的重要性 缺点: 忽略属性间的相关性 样本类别分布不均匀时,容易影响模型表现 问题核心:特征选择, 每一个节点,应该选用哪
阅读全文
posted @
2022-04-22 10:44
HDU李少帅
阅读(92)
推荐(0) 编辑
无监督学习 Kmeans
摘要:无监督学习 自动对输入数据进行分类或者分群 优点: 算法不受监督信息(偏见)的约束,可能考虑到新的信息 不需要标签数据,极大程度扩大数据样本 Kmeans 聚类 根据数据与中心点距离划分类别 基于类别数据更新中心点 重复过程直到收敛 特点:实现简单、收敛快;需要指定类别数量(需要告诉计算机要分成几类
阅读全文
posted @
2022-04-21 10:51
HDU李少帅
阅读(68)
推荐(0) 编辑
逻辑回归
摘要:简介 逻辑回归: 使用了逻辑回归函数对数据进行了拟合就叫逻辑回归??
P(x)=11+e−x(sigmoidfunction) \[ y= \begin{cases}1, & P(x) \geq 0.5 \\ \hline 0, & P(x)<0.5\end{c
阅读全文
posted @
2022-04-20 10:24
HDU李少帅
阅读(107)
推荐(0) 编辑
多因子线性回归
摘要:简介 对于房价的预测,采用多因子进行预测,例如房屋面积,人口密度等等。 参考链接 https://blog.csdn.net/weixin_46344368/article/details/105775078 (内涵数据集) code import pandas as pd import numpy
阅读全文
posted @
2022-04-19 20:27
HDU李少帅
阅读(177)
推荐(0) 编辑
使用机器学习对曲线进行线性回归
摘要:简介 线性回归:根据数据,确定两种或两种以上变量间相互依赖的定量关系 评价曲线的拟合效果使用均方误差和R方值进行拟合质量评估
MSE=1mm∑i=1(y′i−yi)2 R方值 \(\left
阅读全文
posted @
2022-04-19 19:47
HDU李少帅
阅读(144)
推荐(0) 编辑
体积模量
摘要:简介 体积模量是一个比较稳定的材料常数,单位为帕斯卡。
K=E3(1−2μ)
阅读全文
posted @
2022-04-07 22:44
HDU李少帅
阅读(684)
推荐(0) 编辑
泊松比
摘要:简介 泊松比形容一个橡皮筋带子在受力情况下会变瘦多少。即其横向应变与纵向应变的比率。
ν=−εxεz 对于一个二维 泊松比 在[-1,0.5] 之间。橡胶就是一种泊松比很接近0.5的材料。叫做不可压缩材料。水就是一
阅读全文
posted @
2022-04-07 22:44
HDU李少帅
阅读(984)
推荐(0) 编辑
构造拉格朗日函数有什么意义
摘要:简介 其实不是特别懂。 也就是说用拉格朗日函数来求条件极值,和用定义求条件极值是等价的。所以我们可以通过解④⑤这个方程组,来求 [公式] 的条件极值。
h(x,y)=g(x,y)+λ(f(x,y)−c) 为了求解g(x,y)的极值,其中f(x,y)的极值已知为c。 上式就是拉格
阅读全文
posted @
2022-04-05 16:14
HDU李少帅
阅读(598)
推荐(0) 编辑
力学名称:杨氏模量
摘要:简介 简单来说就是衡量物体的弹性的参数。比较长做的实验是测量一个钢丝的杨氏模量。杨氏模量也称弹性模量。 参考链接 https://zhuanlan.zhihu.com/p/309616424 公式
E=σε E: 杨氏模量 \(\sig
阅读全文
posted @
2022-04-05 15:00
HDU李少帅
阅读(1855)
推荐(0) 编辑