人工智能大赛-高糖次数预测
该问题为已知bvp、hr、ibi等数据,预测患者高糖次数,可视为回归问题或分类问题,回归问题即预测血糖值,然后统计血糖大于140的次数
分类问题即预测是否高糖(二分类),由于机器学习进行回归预测效果不佳,因此略过,深度学习二分类预测记录如下。
基于CNN-GRU-LSTM网络的高糖次数预测
整体框架如下图所示
1 food特征提取
注意事项:15和16患者数据没有表头,因此需要定义表头,
而3患者数据仅有11列(正常14列),且无表头。
2 bvp等信号降采样
3 滑动窗口-实现bvp等信号5min维度采集
在采样过程中,统计缺失值如下:
患者 | 缺失情况(仅展示较长的连续缺失时间段) | 连续缺失时长 | 总缺失数据量(以bvp为例) |
001 |
hr数据时间错误(其余数据为2月,hr为7月),导致对应的hr数据全部缺失
|
152373 | |
002 |
2020-02-21 19:34:00 - 2020-02-21 19:43:00 all缺失
2020-02-21 19:43:00 2020-02-21 19:48:00 all缺失 |
7,3242 | |
003 |
2020-02-22 10:46:00 - 2020-02-22 18:06:00 bvp hr eda ibi temp 均缺失
|
6小时
|
24,7348
|
004 |
|
24,3650
|
|
005 |
2020-02-27 13:25:00 2020-02-27 13:30:00 bvp hr eda ibi temp 均缺失
|
5分钟
|
5,2718 |
006 | 36,4190 | ||
007 |
4,4225
|
||
008 | 10,9694 | ||
009 |
6,5115
|
||
010 | 2020-03-30 09:14:00 2020-03-30 09:19:00 ibi缺失 | 3,7747 | |
011 | 20,6319 | ||
012 | 7,0793 | ||
013 | 3,1850 | ||
014 |
2020-06-05 16:23:00 - 2020-06-06 22:33:00 bvp hr eda ibi temp 均缺失
|
24小时+
|
9,8018 |
015 |
2020-07-25 11:08:00 - 2020-07-27 10:38:00 bvp hr eda ibi temp 均缺失
|
48小时
|
26,1966 |
016 |
2020-07-23 22:28:00 - 2020-07-24 10:18:00 bvp hr eda ibi temp 均缺失
|
10小时+
|
9,3555 |
处理办法:缺失值均填充为-1
4 模型搭建及训练
网络结构及参数图:
主要参数如下表:
参数 | 详情 |
epochs | 2000 |
batch_size | 1024 |
earlyStopping | monitor='val_loss', patience=10 |
loss | binary_crossentropy |
5 随机测试
除患者1外,随机选取8个患者为训练数据,其余为测试数据。
5.1 测试1
训练数据
阈值0.5 测试如下:
阈值0.47 测试如下:
以测试集患者15为例:
阈值0.5 测试如下:
阈值0.47 测试如下:
以测试集患者13为例:
阈值0.5 测试如下:
5.2 测试2
随机划分数据,分别查看所有测试集中的患者
5.3 测试3
根据大赛要求,对测试集每个患者每天的的数据进行预测,修改代码,重新预测。
5.3.1