利用深度循环神经网络对心电图降噪

合集 - 开源的、低成本、低功耗微处理器神经网络模型解决方案(26)

1.使用小波分析和深度学习对心电图 (ECG) 进行分类 mcu-ai低成本方案 mcu-ai低成本方案2024-05-07 2.一种光电容积波PPG 转换到心电图ECG进行房颤检测的神经网络模型2024-05-07 3.一种光电容积波PPG 转换到心电图ECG进行房颤检测的神经网络模型2024-05-08 4.于光电容积波PPG和心电图ECG的连续血压估计深度学习模型2024-05-08 5.基于改进MFCC特征和卷积递归神经网络的心音分类2024-05-08 6.基于深度卷积神经网络的时间序列图像分类，开源、低功耗、低成本的人工智能硬件提供者2024-05-08 7.一种新的基于机器学习的示波法血压估计方法，开源、低功耗、低成本的人工智能软硬件提供者2024-05-09 8.一种基于光电容积波的血压测量神经网络算法,开源、低功耗、低成本的人工智能软硬件提供者2024-05-10 9.助听器降噪神经网络模型2024-05-11 10.一种利用光电容积描记（PPG）信号和深度学习模型对高血压分类的新方法2024-05-11 11.基于毫米波的人体跟踪和识别算法2024-05-14 12.鼾声监测神经网络2024-05-15

13.利用深度循环神经网络对心电图降噪2024-05-15

14.咳嗽检测深度神经网络算法2024-05-15 15.基于深度神经网络的婴儿哭声识别算法2024-05-20 16.轻便高效的音频分类神经网络2024-05-20 17.环境声音分类的深度 CNN 模型2024-05-22 18.关键词识别神经网络2024-05-23 19.基于毫米波雷达的手势识别神经网络2024-05-23 20.基于神经网络的柯氏音血压计2024-05-23 21.基于深度学习的鸟类声音识别系统2024-05-30 22.基于神经网络的呼吸音分类算法2024-05-31 23.实时的语音降噪神经网络算法2024-06-03 24.基于毫米波雷达的手势识别算法2024-06-05 25.基于助听器开发的一种高效的语音增强神经网络2024-06-07 26.基于压电陶瓷传感器的智能枕头非侵入式生命体征监测2024-06-12

具体的软硬件实现点击 http://mcu-ai.com/ MCU-AI技术网页_MCU-AI
我们提出了一种利用由长短期记忆 (LSTM) 单元构建的深度循环神经网络来降噪心电图信号 (ECG) 的新方法。该网络使用动态模型 ECG 生成的合成数据进行预训练，并使用来自 Physionet PDB 心电图信号数据库的真实数据进行微调。结果表明，10层DRNN对于幅值0.2mV白噪声的真实信号去噪均方误差低至0.179，使其成为其他常用方法的可行替代方案。我们还研究了合成数据对真实信号网络性能的影响。我们的结果表明，无论训练集大小如何，使用合成数据预训练的网络比仅使用真实数据训练的网络具有更好的结果。我们建议通过迁移学习框架和人类认知过程的类比来解释这一点。

心电图 (ECG) 是一种记录心脏随时间变化的电活动的过程。测量是通过连接到患者身体的电极和称为心电图仪的医疗设备来完成的。如今，通常使用 10 个电极，放置在胸部和四肢上。对于 10 电极测量，心电图包含 12 个波形，每个测量角度一个波形，称为"导联"。每个心电图波形都是一个准循环时间序列。波形上的每个准周期代表一个心动周期，因此其典型频率在 60 - 100 bpm 之间。周期本身具有称为 P、Q、R、 S、T 的特征组件，对应于心动周期中的特定事件。其中三个：Q、R 和 S 形成所谓的 QRS 复合体。

ECG 信号容易受到各种噪声的影响，具体有：

电源线干扰 - 产生 60 或 50 Hz 的随机分量，具体取决于电源频率。

电极接触噪声 - 由身体和电极之间的不当接触引起。

运动伪影 - 由患者的运动产生，影响电极-皮肤阻抗，导致 100-500 ms 长的失真。

肌肉收缩 - 肌肉活动产生常规峰峰值 ECG 幅度的 10% 的噪声，频率高达 10 kHz。持续时间通常约为 50 毫秒。

基线漂移 - 由呼吸活动引起。此噪声的幅度约为心电图幅度的 15%。

心电图数据去噪是一个已知问题，因此存在多种技术，如下：

滤波技术，IIR 陷波滤波器，FIR 滤波，自适应滤波器。

离散小波变换 (DWT)。

仿生小波变换 ( BWT)。

过滤残差 (FR) 方法。

经验模态分解 (EMD)。

近年来，人们可以观察到利用机器学习方法和神经网络进行信号过滤的新尝试的出现。它们可以作为一种特定类型的自适应方法放置在分类法之上。Moein 研究了用于 ECG 噪声消除的多层感知器网络。为了进行训练，使用了包含 100 个信号样本的相对较小的数据集。预期的输出是通过使用卡尔曼滤波器对输入信号进行降噪而产生的。测试集由 20 个样本组成。网络的错误率全部低于 0.5。然而，值得注意的是，由于数据集的性质，网络学会了模拟卡尔曼滤波。因此，通过这种方式训练网络，无法获得比卡尔曼滤波本身更好的性能。本文介绍了一种利用深度递归神经网络（DRNN）对 ECG 信号进行降噪的新方法。该网络使用两个合成数据集和一个真实数据进行训练。我们还研究了使用合成数据集如何影响网络性能。

我们建议使用深度循环去噪神经网络（DRDNN）对心电图信号进行去噪。它们是一种深度循环神经网络（DRNN），因此具有两个不同的特征。第一个是它们由堆叠在一起的多个 (> 2) 层组成 - 这种方法也称为深度学习。这种深层架构虽然比典型的"浅层"神经网络需要更多的计算能力，但事实证明，它们在各种应用中非常有效，因为它们能够学习数据的分层表示，初始层学习"简单"特征，而下一层学习更复杂的概念。有趣的是，人们仍然不知道为什么深层神经网络比浅层神经网络更有效。 DRNN（以及一般所有递归神经网络）的第二个显着特征是它们随着时间的推移保留其内部状态的能力。它通常是通过在网络中引入循环连接来获得的，该连接将神经元的先前输出返回到其自身和/或同一层中的其他单元。这使得它们成为涉及序列和时间序列的处理或预测的机器学习任务的常见选择。深度 RNN 的流行架构涉及称为长短期记忆（LSTM）单元的特定类型的构建块。顾名思义，它们会长时间或短期地记住其内部状态。LSTM 单元可以通过以下方式连接成更大的结构。第一个是将单元存储器的输出和一个单元的隐藏门连接到遗忘门的输入和输出，从而形成单个 LSTM 层。然后可以通过将一层的输入连接到下一层的输出来堆叠这样的层。这允许构建多层、深度 LSTM 网络。LSTM 网络的输入信号一次应用一个样本。然后将其传播到每一层并在每次迭代中产生一个输出。因此，通过应用相同长度的输入可以获得N长度的输出信号。这对于像我们这样的去噪目的来说非常好，但是对于预测任务的分类来说，信号需要"平坦化"是毫无价值的。因此，许多基于 DRNN 的架构还包含一定数量的前馈层。 LSTM 网络可以使用时间反向传播 (BPPT) 及其变体进行训练。该算法的工作原理与经典反向传播类似，但在循环网络的展开结构上运行。这是有效的，因为每个循环网络都可以"展开"为等效的前馈网络。损失函数计算为序列中所有时间步长的平均成本。在本文中，我们使用深度循环去噪神经网络，它是 DRNN 和去噪自动编码器的特定混合体。具体结构如下图：

为了生成合成训练数据，我们使用Patrick E. McSharry, Gari D. Clifford, LionelTarassenko, and Leonard A. Smith，提出的"生成合成心电图信号的动态模型"。它允许根据信号的统计特性生成真实的心电图信号，例如心率的平均值和偏差或低/高频率功率比。此外，该模型还包含一组可以指定的 P、Q、R、S 和 T 事件的形态参数。最后，可以定义生成信号的测量参数，如信号采样频率和测量噪声。该模型由一组三个微分方程描述：

要在实践中使用模型，需要指定几个参数。这里的主要目标是获得尽可能类似于真实数据的信号。为每个P、Q、R、S和T事件设置形态参数（ai、bi、Qi），除了心率标准偏差-使用值5。此外，使用的采样率为512。信号具有振幅为0.01的加性均匀（白）噪声。它被视为"基本"噪声水平 - 与后来为降噪任务添加的噪声水平不同。生成的合成信号的示例如下图所示。

测试是为了回答两个问题：DRNN对于心电图去噪的有效性如何数据以及使用合成数据进行预训练是否（以及如何）影响网络性能。使用了两个 ECG 信号数据集，第一个包含 4000 个合成序列，第二个包含 4000 个真实序列。真实数据集来自Physionet PTB诊断数据库。数据库中的信号可用于 15 个导联 - 我们决定仅使用 aVL 导联，因为它被认为是诊断方面最多的一个。综合数据集是使用上一节中描述的动态模型生成的。两个数据集中的信号都被分成 300 个样本长的序列，因此总共使用了 240 万个数据样本。通过将信号归一化至零均值来对信号进行预处理。这些预处理的数据集在网络训练和测试期间用作预期输出。网络的输入信号是通过向参考信号添加幅度为0.2 mV 的白噪声来产生的。在第一次测试中，使用合成数据训练了11个RNN，其中75％用作训练集， 25％用作验证集放。该网络由不同数量的隐藏 LSTM 层组成 - 从 0 到 10。训练算法是随时间变化的自适应动量方法 (Adam)，批量大小为 256。训练持续 20 个 epoch。训练集和验证集的损失函数都是均方误差。较深的网络通常比浅层网络表现更好，特别是与没有任何 LSTM 层的网络（最左边的条）相比。表现最好的网络是最深的网络，由 10 个 LSTM 层组成，它获得了最小的训练和验证损失，均等于 0.0033。非常有趣的是，即使没有进一步微调，网络也能够对真实数据进行去噪。例如，最深的网络在真实信号的测试数据集上获得了 0.190 MSE。

结果表明，DRDNN可用于心电信号的有效去噪，均方误差低至0.179。因此，这是深层网络相对于浅层架构表现出优越性的另一个领域。然而，层数的增加会导致网络过度拟合的风险。可以使用深度学习的正则化技术来克服这个问题，调整超参数可能会获得比本文更好的性能。另一个重要的结论来自于合成训练数据对网络性能影响的分析。结果表明，使用人工数据训练的网络比仅使用真实信号训练的网络具有更好的性能。这可以通过"迁移学习"框架解释训练过程来部分解释。它是一种流行的深度学习技术，允许使用与目标数据不同的域、分布和任务的训练数据来训练网络。该网络可以通过相对少量的微调应用于目标任务。迁移学习用人类学习过程的类比来解释：人们可以使用以前获得的知识更快地解决问题，即使这些知识是为了不同的目的而获得的领域。这解释了使用合成心电图数据训练的网络也能够对真实信号进行去噪。

在网络训练方面，合成心电图数据基于某种数学模型。根据定义，模型是更复杂事物的更简单视图。在我们的例子中，心电图信号模型是一个相当简单的模型，不包括许多生物和电物理现象。此外，它假设了一个非常简单的噪声模型。然而，它比真实数据更容易学习。因此，经过合成数据训练的网络能够更快地了解心电图信号的"本质"，并利用这些知识从真实数据中学习。这意味着使用人工训练数据不仅在数据短缺的情况下（医学领域经常出现这种情况）是一种有前途的方法，而且还可以利用数据数学模型中包含的先验知识来提高网络的质量。