基于过程控制的产品质量预测问题
1. 工作思路
1.1 总体思路
本项目属于复杂工业过程中的软测量预测问题,目标是用 辅助变量(工业过程变量) 预测 目标变量(如产物浓度)
除预测之前需要解决两个问题:①性能退化问题(运行后基线漂移/过程状态渐变)(如TD算法)②辅助变量精选问题(类似敏感性分析)(PCA/PLS)
辅助变量的精选问题:即确保 辅助变量 对 目标变量 存在预测相关性。
- 确定关注的过程变量,及其特征提取方法。
- 搭建网络模型。
- 计算mse和R2。
1.2 潜在创新点
对原始变量进行处理,特征提取。如非线性高维投影,局部加权学习等。(浙大博士论文)
即时学习 进行动态匹配数据进行局部建模,提升模型精度。(浙大博士论文)
解决 基线漂移 或 模型时变退化问题。(浙大博士论文)
噪声/不确定性问题(极大似然框架下的概率模型)(浙大博士论文)
多阶段工况划分,分别建立局部模型,再将预测值加权得到最终预测值(湖大 张博士论文)
1.3 模型搭建步骤
a. 辅助变量的选择
主成分分析法PCA和偏最小二乘PLA。
b. 数据预处理
- 缺失值处理
- 尺度转换(单位量纲和过程特性不同,从而具有不同尺度大小)
①最小最大标准化,②Z-score规范化 - 异常值处理
线性回归残差分析,PCA,PLS结合Jolliffe参数方法。 - 数据驱动的阶段划分
根据生产数据,划分生产阶段。
发酵过程阶段分割(如:基于移动窗的皮尔逊相关系数结合线性回归的分割方法)(通过不同阶段关键数值的变化识别)
c. 模型建立与判别
- 搭建神经网络预测模型
- 分阶段模型
- 使用RMSE,R^2作为精度评价指标
d. 模型的矫正与维护
- 解决基线变化问题
- 解决模型时变问题
参考资料:
2.《基于即时学习的复杂非线性过程软测量建模及引用》 文章学习
此为浙大博士论文,工业过程软测量建模与预测,与本课题高度相关。
2.1 数据处理
数据的主要挑战:数据高维和变量冗余,即难以特征提取以抓取有效数据。
(由于大量冗余传感器的安装,过程变量之间也呈现出高度互相关性和冗余性。为此,需要对高维数据进行低维特征表示,寻找数据之问的主要因果关系,
并剔除其中的冗余信息和噪声信号。对高维数据进行降维.提取数据的低维特征,也是大多数软测量建模的主要任务。)
2.1.1 特征提取
特征提取的常用手段:①主成分分析法(PCA) ②偏最小二乘回归法(PLS) ③机理分析法
a.主成分分析法
PcA基于数据方羞最大化原则.通过对原始变量的线性组合.寻求一组新的变量基空间,且新变量之间互相正交不相关.从而原始数据即可投投影到该变量空间。
新的变量空间的维度远小于原始变量维度.并且原始数据信息被最大限度地保留在该空问。但是PcA只针对输入数据自身空问进行特征降维。其不能保证所提取的
低维特征与输出有最大的关联性。
b.最小二乘法
此PLs通过同时考虑输入和输出变量空问自身的数据信患,并尽量最大化输入特征空问和输出特征空间之间的关联性.以此对数据进行降维和特征提取。
因此,PLs是一种集主成分分析、典型相关分析和多元线性回归方法于一体的数据降维和特征表示方法。
2.1.2随机噪声数据
模型建立
模型建立:机理模型和数据驱动模型相结合,称为灰箱模型。