大纲


杂谈

  • 基于transformer,目前都在研究什么:爆破块度分析、井下人员or安全帽等穿戴or异物 姿态检测/算法 【图像&视频识别】、“设备”知识图谱 的构建、时间序列(比如压力)预测、······

  • trm到底好在哪里?【所谓自注意力机制】

想象模型处理信息序列的过程,是你去认识一长排陌生人,传统RNN方法 你需要单个逐次去招呼、结识和记忆,当这队人很长时 后期的你会忘记最初几人的信息 即 “梯度消失”,同时这个过程过于缓慢,因为不是 “并行处理”

现在,trm赋予你一副眼镜or anything that allows you to gain the ability to "filter other people's characteristics”,使你仅去获取各人自身的特征 和 各人与其他人的关系,你这时可以一次性查看所有人(input)优先与你最想了解的对象 “交谈”(fetch),且忽略对话时的 “噪音”

所以——我们想把这个思路试着引入到以往朴素传统的CBR方法中

  • 介绍国内外的时候 分段简单展开一下前人手段+成果【传统?】【AI?】;列举完实验数据之后【和谁?】对比模型→强调你的误差更小;

  • 搭建论文之外的平台?例如矿压分析预警 Python设计——可视化 来压、云图等等

  • 在论述某个模型在某领域的已证实的应用价值时,可以举不限于能源行业的例子(金融?医疗?···)以丰富参考文献。


开题报告

一、立论依据

a1、课题来源、选题依据和立论背景

围绕 安全高效 两个煤矿行业的永恒主题展开:

当今采矿业,特别是在设计煤矿巷道支护系统,目前主要依赖工程类比基于经验的方法。此法虽广泛应用,但有时无法确保所选方案的最佳效果,一说因支护力度不够而需二次加固,其次或因支护过度而导致资源的不必要浪费。另外,随着浅部煤层的开采减少、大部分转向深部开采——开采难度和强度的增大,设计有效的巷道支护系统至关重要。

利用机器学习和数据分析技术,分析和预测巷道支护的效果,以提高矿区支护设计的效率;以本方向(巷道支护)发生的煤矿事故为例:

  • 2021年11月10日,贵州六盘水猴子田煤矿顶板事故,造成4人死亡,直接经济损失744.4万元。发生原因:110702回风联络斜巷处于地质构造带,巷道超高不易支护,作业人员空顶维修作业导致顶板失稳、冒落。
  • 2024年11月1日,陕西永寿县碾子沟煤矿,进行超前支架顶梁调架千斤顶连接作业时1人死亡。发生原因:副帮超前支架突然倾斜,地质调查和力学分析不详,致使支护结构不能适应复杂多变的地下环境。
  • 2022年8月4日,山西沁源凤凰台煤业3#煤层31采区3102胶带顺槽掘进工作面发生较大顶板事故,造成5人遇难,直接经济损失1982.28万元。发生原因:支护措施滞后、不足以承受顶板压力。

​ ☞这些事故反映了巷道支护的实施和监测方面的隐患。事故频发及其带来的高额经济损失和人员伤亡表明,传统的巷道支护策略和技术在某些情况下未能有效预防顶板事故——即,基于现有支护技术的地质评估方法在应对复杂地质条件和高风险环境时的局限性。本文通过引入大数据分析、机器学习,尤其是借鉴了Transformer大语言模型构建一套Geo-Attentive Case-Based Reasoning(地质注意力机制的案例基模型,下文简称GeoAttCBR)来提供更精准的地质风险评估和实时的支护效果监测。

a2、研究目的、理论意义和应用价值

☞大语言模型系统地分析和学习历史事故数据、地质数据以及巷道支护的实时数据。以期提高对复杂地质条件的响应能力、实现巷道支护设计的优化,减少人为的决策失误。研究的成果预期会测试、应用于矿业的安全管理实践中,通过改进支护技术和实施新的监控系统,显著提高矿工的安全和矿山的运营效率。首先是救人性命,其次是减少经济损失。

2. 数据收集

b1国内外现状、发展动态

大方向

现今井下智能化建设在AI方向的发展迅速,广泛应用在优化能源使用及分配¹ 、实时收集数据² ³ 、制定或模拟救援方案路径⁴ 、钻探爆破和运输加工的过程控制⁵ 以及智能路由通信网络管理⁷ ⁸ 等一系列领域,

  1. [Wang Yan;Hu Hejuan;Sun Xiaoyan;Zhang Yong;Gong Dunwei.Unified operation optimization model of integrated coal mine energy systems and its solutions based on autonomous intelligence[J].Applied Energy,2022.]
  2. [Tongqiang Xia;Diao Li;Xiaolin Li;Xin Yan;J.G. Wang.A novel in-depth intelligent evaluation approach for the gas drainage effect from point monitoring to surface to volume[J].Applied Energy,2024(PB).]
  3. [程德强;寇旗旗;江鹤;徐飞翔;宋天舒;王晓艺;钱建生;.全矿井智能视频分析关键技术综述[J].工矿自动化,2023(11):4-24.]
  4. [张力文;Hu Haifeng;.基于Arduino的新型智能矿用搜救机器人设计[J].仪表技术,2022(03):23-26.]
  5. [赵振宇;张开加;董宇;.鑫岩煤矿井下煤矸分选与充填开采一体化系统设计[J].煤炭工程,2022(01):19-25.]
  6. [史光亮;王瑞君;孔祥宇;.多网融合下的煤矿应急广播通信系统设计与应用[J].煤炭技术,2023(11):251-254.]
  7. [赵晓明;.基于5G网络的庞庞塔煤矿智能矿山建设[J].江西煤炭科技,2022(01):207-209.]

本方向

巷道支护方面 有哪些应用了大模型的 既往研究?:【后期补全简述

​ 陈万辉等学者 将案例推理(CBR)和深度学习技术引入巷道支护方案设计领域,提出了一种煤矿巷道支护方案智能设计方法,即:···

​ 王佳明 引入信息抽取、机器学习和案例推理技术,对煤矿巷道支护方案自动生成和智能比选进行研究,实现煤矿巷道支护方案的智能设计,即:···

​ 王向前 针对煤矿回采巷道支护参数设计的问题,采用案例推理(CBR)的方法构建了煤矿回采巷道支护智能决策模型,探讨了煤矿回采巷道支护案例的表示、案例检索及案例的修正等问题

[1]陈万辉, et al."煤矿巷道支护方案智能设计研究."工矿自动化 50.08(2024):76-83+90.doi:10.13272/j.issn.1671-251x.2024060044.
[2]王佳明.煤矿巷道支护方案自动生成及智能比选研究. 2023. 中国矿业大学, MA thesis.
[3]王向前,and 孟祥瑞. "基于CBR的煤矿回采巷道支护智能决策系统研究与实现". 第十届全国煤炭工业生产一线青年技术创新文集. Ed.安徽理工大学;, 2016, 132-140.

b2文献查阅范围/手段;参考资料

广泛收集国内外矿区公开发布的巷道描述及其支护参数,包括支护类型、材料、尺寸、地质条件、巷道尺寸、支护效果等;对收集来的数据进行清洗和预处理,确保形成数据库的质量和一致性

其中,考虑到榆林地区、鄂尔多斯等地区煤炭资源丰富,煤层赋存稳定较易开采,形成了以神华集团为代表的现代化开采企业,以大规模高强度开采为特点,煤炭产量持续快速增长,故着重选取该地煤矿数据样本。然而,这些地区煤层埋深情况复杂、部分工作面采掘推进速度较快,矿区形成巨大开采空间。采动应力场使得工作面矿压显现特征明显,频繁发生顶板切落、支架冲击载荷等灾害。

三、研究内容、技术路线、创新点

c1研究内容/解决的关键技术

c2技术路线/可行性分析【重点】

image-20241107222743097

初期构想的技术路线如下: 首先通过尽可能多的文献、现场调研等途径,得到支护规程、地质报告、作业手册、设计图纸等材料,分别列举各案例的支护方式及其对应参数。在参数中确定研究的对象,对这个类别的数据进行预处理。然后结构化这些知识,选取输入、输出参数,通过某种方式得到一种“统一表示”(建库)。再对此时状态下的数据进行一定的优化,可能使用到的方法有“常属性变量滤波”、“高相关性滤波”。接下来建立CBR模型,先是分配权值,并且对案例计算相似度,比选不同的方案。确定好测试集和训练集,在GeoAttCBR架构(暂定,后续实际改动模型另定)网络下验证、推广等。


  • 数据怎么来?现场测量、工程报告或设计图纸等等应收尽收

  • 结构化格式,CSV或Excel表格,其中每列代表一个变量(如锚杆长度L、直径d和支护厚度H),每行代表一个观测实例

  • 数据清洗:缺失值——删除?填充?;异常值——箱型图识别

  • 什么叫“结构化知识”、“统一表示”:就是将所有数据源合并到一个单一的数据库或数据框架中【围岩库】,确保每个参数都遵循相同的命名约定和数据类型

  • 减噪阶段的二次优化意义何在?

    • 再次提升数据质量,减少无关特征和冗余特征,移除无用的常量特征和高度相关的特征,可以减少模型训练和预测时所需的计算资源,加快模型的训练和预测速度;同时,降低过拟合的风险,尤其是在数据量不是特别大时,减少特征数量可以帮助模型泛化到新的数据上。
    • 提到的常属性变量滤波(Constant Attribute Filtering)、高相关性滤波(High Correlation Filtering)什么意思?
      1. 前者CAF涉及识别并移除那些在整个数据集中具有相同值的属性或变量。这些常属性变量对于建模来说没有信息价值,因为它们不提供任何有助于区分数据记录的有效信息。也就是说,移除这些变量可以减少数据的维度,提高计算效率,同时避免模型训练时的过拟合问题。
      2. 后者HCF用于检测并处理高度相关的变量。当两个或多个变量之间的相关性很高时,意味着它们携带相似的信息,并可能导致多重共线性问题。
    • 减噪处理 这一步还可以用什么技术?除了这里提到的CAF、HCF
      • 随机森林(本身对超参数的设置没那么敏感)、递归特征消除RFE(支持向量机SVM)、Lasso回归(正则化惩罚)或者两两集成(计算量太大!)
  • 本文确定要研究的参数是谁?怎么确定?

    • 假设数据集包含以下:

      其中锚杆长度L和直径d、支护厚度H与支护失败率P有较高的相关性则这三者就是要研究的参数

  • CBR(“基于案例的推理”模型,Case-BasedReasoning)是怎么回事?

    • input是那些【将被用来识别和检索相似案例的特征】,比如L、d、H等等,共同构成了案例的描述,使得CBR系统能够根据给定的新场景或问题找到历史数据库中最相似的案例。
    • output是CBR模型【解决问题后提供的结果】,通常是基于历史案例的解决策略。在巷道支护的场景中,本文预期的输出参数包括:
      1. 推荐的支护方案:基于找到的相似案例推荐的支护技术和方法。
      2. 预期的稳定性或风险评估:对所推荐支护方案在当前地质和工况条件下的预期性能的评估。
      3. 成本估算:基于历史数据估算实施推荐支护方案的大致成本。
  • “分配权值”

    • 顾名思义,如果某个参数(如支护厚度H)对支护效果的影响比其他参数(如锚杆的L、d)更为显著,那么支护厚度在相似度计算中应该拥有更高的权重

    • CBR流程中,,权值在什么步骤出现?

    • 分权在CBR中是必需的吗?

      如果所有特征都同等重要,或者数据非常均匀,且没有明显的个别特征对结果影响更显著就不必需;反之,多数实际应用中,特征差异性大就必需

    • 一个加权的CBR例子:

      设现有以下两矿井,其支护:
      
      矿井A
      
      地质条件:软岩,多裂隙
      巷道尺寸:高 3 米,宽 4 米
      支护类型:锚杆支护
      锚杆长度:1.5 米
      锚杆直径:25 毫米
      支护厚度:200 毫米
      支护间距:1 米
      
      矿井B
      
      地质条件:硬岩,少裂隙
      巷道尺寸:高 3 米,宽 4 米
      支护类型:锚杆支护
      锚杆长度:2 米
      锚杆直径:30 毫米
      支护厚度:250 毫米
      支护间距:0.8 米
      

      需要对以上特征进行编码和标准化处理,以便进行数值计算;为不同的特征分配不同的权重反映它们对支护效果的影响程度。假设权重分配如下:

      地质条件(软岩=0, 硬岩=1):权重 0.3

      锚杆长度:权重 0.2

      锚杆直径:权重 0.1

      支护厚度:权重 0.2

      支护间距:权重 0.2

      加权欧氏距离公式计算此处两个案例之间的相似度,公式,w是权重weightx是两例中特征i的各自值:
      $$
      Distance
      =√[∑(⋅(−)2)]
      $$

  • [ ]


具体到本例中,
      
      地质条件差异:0.3×(0−1) 2=0.3
      锚杆长度差异:0.2×(1.5−2) 2=0.02
      锚杆直径差异:0.1×(25−30) 2=2.5
      支护厚度差异:0.2×(200−250) 2=200
      支护间距差异:0.2×(1−0.8) 2=0.008
      
      总相似度距离为:TotalDistance=√(0.3+0.02+2.5+200+0.008) ≈ 14.15

本例的实际意义:较低的距离值表示较高的相似度。在这个例子中,计算得出的距离较大,表明两个案例在支护特性上有较大的差异特别是在支护厚度和锚杆直径上。基于这种计算,如果矿井A的支护方案已知有效,而矿井B的条件相似但具有一些关键差异,则可以考虑调整矿井B的支护设计以适应其特定的地质和结构条件。

特征工程

从原始数据中提取有用的特征,如支护材料的种类、地质硬度、巷道深度等。

语义分析

自然语言处理技术,从巷道的文本描述中提取额外的地质和结构信息。

聚类分析

聚类算法如K-means或层次聚类,对巷道类型进行分类,找出相似的支护案例和巷道特征。

预测建模

机器学习算法(如随机森林、支持向量机或神经网络)来预测支护的效果和可能的风险。

c3论文的创新点【重点】

将transformer的嵌入层自注意力机制的 线性变换思路,引入CBR的传统相似度计算里,提高相似度计算的准确性和模型的解释性。。

四、研究基础

d1实验手段、研究和实验条件

在训练集上训练模型,并在验证集上测试模型的性能,使用交叉验证(包括分类准确率、回归预测的误差等)来评估模型的稳定性和可靠性。

d2经费,来源、开支预算

(工程设备、材料须填写名称、规格、数量)

五、工作计划

序号 阶段及内容 工作量估计(h) 起讫日期 阶段成果/形式
材料收集
建立数据库 “统一表示”
确定研究对象参数
数据预处理
二次优化减噪
CBR建模 分配权值、相似度s
测试集、训练集的验证及推广
合计

附件:评分表、评审小组和意见(略)

开题报告(优先)

以下内容编辑时间较早,不及前文更新及时,故参考意义有限,仅节选学习了部分文献的数据处理手法 等

论文架构(再议)


0.1摘要

0.2目录

0.3附表清单\插图清单


1绪论

1.1研究背景、意义

1.2国内外研究现状

1.3论文研究内容、论文组织结构

2.XX(数据/预/处理)方法

介绍[预处理的必要性]:由于传感器的灵敏度会受到空间环境温度、湿度等因素的影响...这些异常数据会阻碍模型提取时间序列数据的特征, 影响机器学习模型的“学习”能力...

"实验数据来自XX省某煤矿的工作面XX年X月X日至..的监测数据.."

a0xx数据的分布特征

介绍数据产生的地理环境、条件,简要交代数据形成的原理,可附【工作面测站布置图】【数据能否分类?分别作图?】···

a1异常值的修正:

3σ原则

...井下传感器可能会工作异常,导致传感器记录数据出现重大误差。同时,为了保证传感器的正常工作,煤矿工作人员会定期对传感器进行调校...

给数据示例!处理过程

a2缺失值的处理:

1直接delete//2基于统计学的填充(前两者都忽略时间性)//3基于机器学习的K最近邻\RNN\最大期望\矩阵分解 等

...传感器采集出错的现象,导致数据缺失。时间序列数据的缺失会使得缺失值前后的数据时间关联性变弱,数据误差变大,影响模型的训练效果...

给数据示例!处理过程

image-20241101151043052
b特征工程

为什么要搞特征工程?数据挖掘中的数据和特征中包含的信息决定了机器学习获取知识和技能的上限,而各种模型和算法的应用是为了能够更大限度地提高学习性能,从而使得学习能力逼近上限。因此对原始数据中的特征处理是非常必要的。通过获取更多的、更好的特征,可以减少模型寻找最优参数的工作量和时间

检测数据特征衍生:

例子:计算每小时的平均瓦斯浓度、最大值和最小值等来衍生新特征。此外引入滞后特征,例如,将前1小时、前2小时和前3小时的瓦斯浓度作为新的特征,以帮助模型捕捉浓度变化的趋势和模式

时间序列的有监督化:

例子:假设我们有一段时间的瓦斯浓度监测数据,目标是预测未来1小时的瓦斯浓度。选择过去6小时的数据作为输入特征(t-6, t-5,..., t-1的瓦斯浓度),而当前时刻的瓦斯浓度(t)作为输出标签

特征无量纲化:

例子:在训练模型时,瓦斯浓度原始数据范围很大(例如0到1000 ppm),而其他特征(如温度或湿度)的范围则很小(例如0到100),导致模型训练时难以收敛。所以对瓦斯浓度和其他特征进行Z-score标准化或Min-Max归一化,使所有特征在同一范围内,提高训练效果稳定性

以“瓦斯时间序列数据的特征分析”为例:

工程一:衍生
image-20241101154144447 image-20241101153636005
工程二:有监督化
  1. F (Forecasting Period) - 预测期:想要进行预测的未来时间点。
  2. LS (Lag Step) - 滞后期步长:从当前时刻往回看多少时间步长来作为输入特征的基础。
  3. GS (Gap Step) - 空档期步长:向前或向后设置的一个时间间隔,用于定义开始预测的起点。
  4. TS (Time Step) - 时间步长:预测未来多少个时间步长的数据。

image-20241101155734783

在公式 Supervise(F, LS, GS, TS) 中:输入为一系列的历史特征 f(t-LS), f(t-(GS+2))f(t-(GS+1)),和未来的目标数据 f(t), f(t+1)f(t+(TS-1))

这里,t当前时间点。

历史数据从 t-LS 开始,意味着从当前时间往回看 LS 个时间单位。

空档期从 t-(GS+2)t-(GS+1),这是在当前时间点前后(下例中是)的一个时间间隔,用于处理时间序列中的信息间隔问题,确保不会用到未来数据预测未来。

预测目标是从当前时间 tt+(TS-1) 的数据,即从现在开始的未来 TS 个时间步的数据。

image-20241101161502465
c数据集划分:

时间序列数据是按时间顺序排列的,因此在划分数据集时,不能随机分割(比如将数据随意打乱

image-20241101143943340

2.? 本章小结

3.基于___模型的xx预测/xx分析/xx模拟?

3.1介绍模/网原理

3.2参数确定

3.3预测/分析/模拟 自己模型

3.3.1描述

3.3.2算法实现

3.3.3实验验证

3.4本章小结

4.总结与展望

4.1总结

总结研究成果,突出本模型在矿区安全管理中的应用价值。

4.2展望

如扩展数据集、改进模型或探索新的算法?


参考文献

附录

致谢

posted on 2024-11-07 22:35  言行一  阅读(26)  评论(0编辑  收藏  举报