Abstract

【背景】癫痫是一种脑神经元突然异常放电引起的慢性非感染性疾病,可导致间歇性脑功能障碍,它也是世界上最常见的神经系统疾病之一。基于脑电图的机器学习、相关分析和时间频率分析的癫痫自动检测在癫痫早期预警和自动识别中起着重要作用。在本研究中,提出了一种利用TripleGAN实现脑电图癫痫识别的方法。使用CHB-MIT (波士顿儿童医院和麻省理工大学联合采集的公开癫痫脑电数据集)分类准确率、灵敏度和特异性分别超过1.19%、1.36%和0.27%。交叉比率(crossobject ratio)0.53%、2.2%和0.37%【文中第二张表中结果】

Introduction

癫痫性脑电图预测的相关研究仍集中在特征提取和传统的模式识别方法上,然而,传统的方法从单通道或两通道之间提取信息,忽略了多通道之间的隐式spatial-temporal关系,缺乏癫痫脑电同步模式变化特征的提取。
医生常以尖波、尖波、尖慢复波和其他阵发性脑电图异常作为癫痫信号的特征。一些临床研究表明,预测癫痫发作的前兆可以在癫痫前找到。癫痫是癫痫病灶引起其他神经元过度同步放电的过程。因此,异常的同步模式反映了癫痫的演变。许多临床研究发现,癫痫发作前和发作间期的同步和去同步模式存在差异。研究脑内异常放电活动的扩散规律对预测癫痫具有重要意义。
脑电图信号的时间模式在源活动的重建中也起着重要的作用。在此分析的基础上,该工作从癫痫病变引起的脑电信号的振幅与位置的相关性中提取识别特征,并基于双重GAN模型对脑电图癫痫进行深入学习。在特征聚类、强化和端到端分类、癫痫脑电信号识别等方面提出了新的思路,为癫痫的自动诊断提供了新的工具。
创新点和贡献如下:

  1. 根据癫痫性脑电图的尖峰波、尖波、尖峰慢复波等局部信号特征,研究了癫痫性脑电图信号的局部虚拟表示法。本文提出了使用GAN网络学习真实数据的方法来提高数据识别的鲁棒性;【GAN学习真实数据,提高数据识别的鲁棒性】
  2. 脑电信号的局部特征增强可以有效解决癫痫脑电特征聚类的表达,使脑电信号的特征聚类更加准确;【增强EGG局部特征】
  3. 利用GAN在向量空间中进行算术运算,将脑电图聚类特征转换为相应特征空间中的运算。生成的数据与真实的样本没有什么不同。最后,鉴别器不能正确区分生成的数据和真实数据,从而获得更强化的分类特征【训练模型生成脑电数据,获得更强的分类特征】
    【理解】本论文主要使用TripleGAN来增强数据特征,用于EEG脑电数据增强;

Method

损失函数【参考《EEG Signal Reconstruction Using a Generative Adversarial Network With Wasserstein Distance and Temporal-Spatial-Frequency Loss》】设计了具有均方误差(基于TSF-MSE)损失函数的时空频率,该函数通过从时间序列特征、共同空间模式特征和功率谱密度特征计算MSE来重建信号。
在本研究中,参数从原始信号迁移过来,多次重复所需的源激活,生成脑电图癫痫模拟模型。首先,随机选取源数据样本作为初始癫痫预测样本,利用seed-g toolbox快速生成一组具有4s时间窗口的时间序列数据集。然后,利用TripleGAN模型选择性地微调目标数据集中的输入输出配对,使其接近真实目标。
聚类特征提取方法。在癫痫性脑电图信号的分析和处理中,存在许多无监督降维特征提取方法,如PCA 模型、ICA 模型和AR 模型【具体需要了解】。无监督聚类的方法是从数据驱动的角度,根据样本的分布来提取样本的特征。聚类模型主要分为基于分区的聚类、基于密度的聚类和基于信号自编码的聚类。脑电图信号的聚类算法可以挖掘时间序列样本之间的分布规则,找到关键的样本模式。虽然聚类算法提取的特征不能对应于明确的物理意义,但它们可以作为特征提取的关键组成部分,在许多脑电图研究中发挥重要作用。
本文从时间(temporal),频率(frequency)和时间-频率(temporal-frequency)三个维度中提取特征。

  1. 时间特征是脑电图信号处理中最基本的特征,它是通过直接观测和计算原始信号来提取的。提取模型图如下,左侧为是使用的神经网络以及维度变换等,右侧是具体处理张量维度。
    image
  2. 频域特征采用该方法对频域特征进行滤波,可以区分癫痫发作时脑电图能量的明显变化,如下式

\[P(w)=\sum_{-\infty}^{+\infty}r(k)e^{-iwk} \]

  1. 利用时频域将一维信号转换为一个尺度的二维空间,对频带进行更精确的特征分解;

\[W_{\Psi}=f(n), \Psi = \frac{n-b}{a}=\frac{1}{\sqrt{a}}\sum_n \Psi \times \frac{n-b}{a} \]

这三种特征都各司其职。特别是小波包分析【时频域】进一步分解了未细分的多分辨率分析的高频部分,它具有进一步划分和细化谱窗的优良特性,并随着尺度的增大而变宽。因此,它具有更好的时频特性,提高了脑电图信号分析的准确性
在学习过程中,生成模型的优化目标是尽可能多地生成虚假的脑电图癫痫数据,从而得到真实数据的统计分布规律。判别模型用于判断给定的输入数据是来自真实数据还是来自生成的模型。最后,当判别模型不能准确区分生成的模型生成的数据是否伪造,我们认为判别模型和生成的模型已经提高到更高的水平,和生成的模型生成的数据足以模拟现实世界中的数据。

Experiments and Reaults

Experimental Setup

框架:Keras 2.4.3
配置:12代英特尔(R)核心(TM)i9-12900K CPU@3.20GHz,32GB内存,1 TB硬盘,GeForce RTX 3090 GPU在64位Ubuntu操作系统

Dataset

详见:CHB-MIT

Experiment Results

image
image
TripleGAN在平均准确性方面比比较方法高1.19个百分点,在平均敏感性方面高1.36个百分点,在平均特异性方面高0.27个百分点。
image
TripleGAN在平均准确性方面超过比较方法0.53个百分点,在平均敏感性方面超过2.2个百分点,在平均特异性方面超过0.37个百分点。

Discussion

TripleGAN作为一个统一的模型,可以同时获得深度生成模型中最新的分类结果。为了联合估计这些具有分类器网络和分类条件生成器网络特征的条件分布。定义了一个联合鉴别器网络,其唯一的功能是区分样本是来自真实数据分布还是来自模型。此外,为了明确脑电图癫痫聚焦的生成规则,本文将输入平滑地转移到三维空间中,并利用GAN网络的顺序优化进行数据仿真。

Conclusion

本文证明了人工脑电图信号是由生成对抗网络产生的。逐步训练GAN,以稳定地生成人工信号,其信号在时域和频域上与单通道真实脑电图信号非常相似。
总结与理解
模型结构:一个生成器、三个判别器(鉴别时域、频域、时频域)
数据:CHB-MIT公开数据集
神经网络框架:keras

任务:本文使用TripleGAN使用原始EEG数据,生成EEG脑电数据的时域、频域以及时频域数据。

ps

  1. TSF-MSE: 精心设计的基于TSF-MSE的损失函数通过从时间序列特征、共同的空间模式特征和功率谱密度特征中计算MSE来重构信号。从三个不同采样率和灵敏度的运动相关脑电图信号数据集上获得了良好的重建和分类结果
  2. 小波包分解(wavelet packet decomposition)也可称为小波包(wavelet packet)或子带树(subband tree)及最佳子带树结构(optimal subband tree structuring)。其概念是用分析树来表示小波包,即利用多次叠代的小波转换分析输入讯号的细节部分。
    a. 传统的振动信号分析和处理方法一般都是采用傅里叶,它是一个窗口函数固定不变的分析方法,无法反映信号的非平稳、持时短、时域和频域局部化等特性 。
    b. 小波分析是一种窗口面积固定但其形状可改变,即时间和频率窗都可改变的时频局部化分析方法,由于它在分解的过程中只对低频信号再分解,对高频信号不再实施分解,使得它的频率分辨率随频率升高而降低。
    c. 在这种情况下,小波包分解应运而生。
    小波包分析能够为信号提供一种更加精细的分析方法。小波包分析将时频平面划分得更为细致,它对信号的高频部分的分辨率比二进小波要高。而且,它在小波分析理论的基础之上,引入了最优基选择的概念。即,将频带经过多层次的划分之后,根据被分析信号的特征,自适应地选取最佳基函数,使之与信号相匹配,以提高信号的分析能力 。因此,小波包具有广泛的应用价值。
    【参考论文】

Xu, Meiyan et al. “Synthetic Epileptic Brain Activities with TripleGAN.” Computational and mathematical methods in medicine vol. 2022 2841228. 27 Aug. 2022, doi:10.1155/2022/2841228