03 2022 档案
摘要:numpy pandas 更多详细链接:https://zhuanlan.zhihu.com/p/61013882
阅读全文
摘要:目的: 统一不同量纲下的数据,消除量纲的影响。 通过中心化和标准化处理,得到均值为0,标准差为1的服从标准正态分布的数据。 。。。 详细链接:https://blog.csdn.net/GoodShot/article/details/80373372
阅读全文
摘要:dummy variable是用0或1表示某个类别是否出现,常见于分类问题。 为什么要dummy化? 若用数字1-12表示1-12月,那么就潜在表示了12月和1月差的很远,其实离的很近 若用离散数字表示一地域,假如用数字1-23表示23个省,那么数字潜在的意思是,相邻的数字代表的省比较相似,差距的数
阅读全文
摘要:自编码器是一个重构输入的过程:# 实现数据降维,即用较少的数据维度表达数据特征(15维输入-6维输出)。 数据降噪。 参考链接(原理):https://zhuanlan.zhihu.com/p/82415579 参考链接(含代码):https://blog.csdn.net/ccamelliatre
阅读全文
摘要:1. 概念介绍 PAT(Process Analytical Technologies )过程分析技术。 2. 文章目标 利用拉曼光谱装置记录的光谱,开发一种软测量模型,可以在线实时预测苯乙酸、生物量或青霉素的浓度。 3. 原理与工作步骤 3.1拉曼光谱模拟 模拟拉曼光谱分析仪:以9个平均积分时间1
阅读全文
摘要:1. 损失函数 定义: 1.1 MAE与MSE的比较 简单来说,MSE计算简便,但MAE对异常点有更好的鲁棒性。 详细介绍链接:https://www.jianshu.com/p/1ff7ae7ea9ef 2. 评价函数 定义:
阅读全文
摘要:1. 数据降维 1.1 为什么要数据降维 1. 维度灾难: 很难有一个简洁的模型在高维空间中依旧具有鲁棒性,而随着模型复杂度的增加,为保证结果同样的精度和准确性,所需要的数据也需要极大增加,而高维空间的数据本身具备稀疏性,可想而知如果真要这么做,需要的数据是难以估计的。当然并不是所有的高维空间都不好
阅读全文
摘要:简而言之,yield是一个暂停器,包含yield的函数会默认视为generator,generator是一个生成器。 generator,是一个记录了方法的生成器,其并不会将结果输出,而是等调用的时候再算,以此节省内存。 yield是一个暂停器,方法执行到yield a 时会停下,输出值a,再次方法
阅读全文
摘要:1. 多维数组 1.1 二维数组 即数组中的 元素是 一维数组:即[[1.2.3],[4.5.6],[7.8.9]],其表示储存了一批向量,这批向量的组合就是矩阵。 Matrix是典型的二维数组:int[][] matrix = new int[n][n]我们对矩阵的储存与调用都是通过二维数组实现的
阅读全文
摘要:Java宏观总结 Java文件是类(class)的集合,它们以包(package)的形式组织起来。 Java文件运行的实质,是类文件的相互调用,即对象和方法的相互调用。 类包含 实例变量(对象属性)和 方法(对象行为),对象从类中创建。 通过引用变量调用对象(即对象遥控器),当引用变量存在是对象才存
阅读全文
摘要:1. Jupyter启动无法直接跳转到浏览器 https://zhuanlan.zhihu.com/p/409728896 2. Jupyter默认文件夹位置问题 step1:https://blog.csdn.net/limanjihe/article/details/106317245 step
阅读全文
摘要:1.pyplot绘图 1.1 pyplot绘制实时迭代图 代码如下示: import matplotlib.pyplot as plt ax = [] # 定义一个 x 轴的空列表用来接收动态的数据 ay = [] # 定义一个 y 轴的空列表用来接收动态的数据 plt.ion() # 开启一个画图
阅读全文
摘要:1. 工作思路 1.1 总体思路 本项目属于复杂工业过程中的软测量预测问题,目标是用 辅助变量(工业过程变量) 预测 目标变量(如产物浓度) 除预测之前需要解决两个问题:①性能退化问题(运行后基线漂移/过程状态渐变)(如TD算法)②辅助变量精选问题(类似敏感性分析)(PCA/PLS) 辅助变量的精选
阅读全文
摘要:1. pytorch学习 tensor 张量 Tensor是PyTorch中重要的数据结构,可认为是一个高维数组。是深度学习计算的基础。 tensor的介绍链接:https://www.jianshu.com/p/314b6cfce1c3 Pytorch-Geometric 入门教程 torch-G
阅读全文
摘要:0. 数据集来源 算法数据侠公众号,电力负荷数据/故障诊断数据。 1. 预测问题数据集 采样点数 = 采样频率 * 采样时间 eg:(采样频率25.6Khz,采样时间0.1s,则在此时间内,采样25.6k*0.1=2560个点) 1.1 PHM2012数据集 数据文件分为①acc_xxx,为振动数据
阅读全文
摘要:0. RUL问题的通常步骤 其步骤为: 数据处理(预处理与特征提取) 模型搭建 (搭建神经网络) 将处理好的数据送进模型(确保维度一致) 根据预测值与实际值计算评价指标。 需要解决明确的问题: 训练/预测 的对象是什么? 数据选取的方式是什么?分层选取?逐次抽取?随机抽取? 1. 数据处理 原始数据
阅读全文