KDD MIMIC-III数据集介绍

MIMIC-III

免费公开的重症监护医学信息数据库。包含2001年至2012年之间进入重症监护病房的成年患者的53423例不同的医院入院数据和2001年至2008年之间收治的7870名新生儿数据。

Home | Github | Doc

数据处理和训练模板Pytorch

字典信息数据

字典信息数据,共包含5个数据表。抽取患者的数据比如说生命体征,心率等,实验室指标(如白细胞红细胞等)等, 需要在相应的字典中找到相应的item,即项目标识符,再对应查找某一个患者对应指标下的数据

d_cpt

操作记录代码索引

Name Postgres data type 说明
ROW_ID INT 行号
CATEGORY SMALLINT CPT code 类别号
SECTIONRANGE VARCHAR(100) 给定的代码范围
SECTIONHEADER VARCHAR(50) 给定的代码说明
SUBSECTIONRANGE VARCHAR(100) 更多有用的信息
SUBSECTIONHEADER VARCHAR(300) 更多有用的信息
CODESUFFIX VARCHAR(5) -
MINCODEINSUBSECTION INT SUBSECTIONRANGE 的最小值
MAXCODEINSUBSECTION INT SUBSECTIONRANGE 的最大值

d_icd_diagnoses

诊断代码索引

Name Postgres data type 说明
ROW_ID INT -
ICD9_CODE VARCHAR(10) ICD-9 编码
SHORT_TITLE VARCHAR(50) 缩写
LONG_TITLE VARCHAR(300) 全称

d_icd_procedures

手术操作代码索引

Name Postgres data type 说明
ROW_ID INT -
ICD9_CODE VARCHAR(10) ICD-9 编码
SHORT_TITLE VARCHAR(50) 缩写
LONG_TITLE VARCHAR(300) 全称

d_items

记录项目代码索引

Name Postgres data type 说明
ROW_ID INT -
ITEMID INT 项目标识符
LABEL VARCHAR(200) 项目标签
ABBREVIATION VARCHAR(100) 标签缩写
DBSOURCE VARCHAR(20) 数据来源
LINKSTO VARCHAR(50) 对应的数据表
CATEGORY VARCHAR(100) 项目种类
UNITNAME VARCHAR(100) 项目测量单位
PARAM_TYPE VARCHAR(30) 记录数据的类型 a date, a number, a text field
CONCEPTID INT -

d_labitems

化验项目代码索引

Name Postgres data type 说明
ROW_ID INT -
ITEMID INT -
LABEL VARCHAR(100) 项目标签
FLUID VARCHAR(100) 测量的物质 ‘blood’ ‘urine’
CATEGORY VARCHAR(100) 测量的种类
LOINC_CODE VARCHAR(100) -

患者基本信息和院内采集信息数据

患者基本信息和院内采集信息数据,共包含21个数据表

admissions

患者入院情况

Name Postgres data type 说明
ROW_ID INT 行号
SUBJECT_ID INT 患者编号
HADM_ID INT 病案号
ADMITTIME TIMESTAMP(0) 入院时间
DISCHTIME TIMESTAMP(0) 出院时间
DEATHTIME TIMESTAMP(0) 死亡时间
ADMISSION_TYPE VARCHAR(50) 入院类型
ADMISSION_LOCATION VARCHAR(50) 入院地点
DISCHARGE_LOCATION VARCHAR(50) 出院地点
INSURANCE VARCHAR(255) 保险类型
LANGUAGE VARCHAR(10) 语种
RELIGION VARCHAR(50) 宗教信仰
MARITAL_STATUS VARCHAR(50) 婚姻状况
ETHNICITY VARCHAR(200) 种族
EDREGTIME TIMESTAMP(0) 急诊留观登记时间
EDOUTTIME TIMESTAMP(0) 急诊留观出观时间
DIAGNOSIS VARCHAR(300) 初步诊断
HOSPITAL_EXPIRE_FLAG TINYINT 院内死亡标记
HAS_CHARTEVENTS_DATA TINYINT 是否有chartevents记录

callout

患者ICU出科的即时信息

Name Postgres data type 说明
ROW_ID INT 行号
SUBJECT_ID INT 患者编号
HADM_ID INT 病案号
SUBMIT_WARDID INT 提交申请的科室代码
SUBMIT_CAREUNIT VARCHAR(15) 提交申请的科室所属的ICU cost类型
CURR_WARDID INT 患者所属科室
CURR_CAREUNIT VARCHAR(15) 患者所属的ICU cost类型
CALLOUT_WARDID INT 申请转移的地方 0 代表 Home / 1 代表转移到可用的的病房
CALLOUT_SERVICE VARCHAR(10) 患者需接受的治疗服务
REQUEST_TELE SMALLINT 预防患者已经感染的疾病
REQUEST_RESP SMALLINT 预防患者已经感染的疾病
REQUEST_CDIFF SMALLINT 预防患者已经感染的疾病
REQUEST_MRSA SMALLINT 预防患者已经感染的疾病
REQUEST_VRE SMALLINT 预防患者已经感染的疾病
CALLOUT_STATUS VARCHAR(20) 申请的状态
CALLOUT_OUTCOME VARCHAR(20) ‘Discharged’ or ‘Cancelled’
DISCHARGE_WARDID INT 实际转移的地方 0 代表 Home / 1 代表转移到可用的的病房
ACKNOWLEDGE_STATUS VARCHAR(20) 申请的反馈结果状态 ‘Acknowledged’, ‘Revised’, ‘Unacknowledged’ or ‘Reactivated’
CREATETIME TIMESTAMP(0) 申请创建时间
UPDATETIME TIMESTAMP(0) 更新时间
ACKNOWLEDGETIME TIMESTAMP(0) 反馈时间
OUTCOMETIME TIMESTAMP(0) callout完成时间
FIRSTRESERVATIONTIME TIMESTAMP(0) 首次病房保留时间
CURRENTRESERVATIONTIME TIMESTAMP(0) 当前病房保留时间

caregivers

护理人员信息

Name Postgres data type 说明
ROW_ID INT 行号
CGID INT 护理人员标志符
LABEL VARCHAR(15) 护理人员的头衔 RN, MD, PharmD
DESCRIPTION VARCHAR(30) 护理人员的结构化数据信息 17 unique values

chartevents

患者观察记录数据

Name Postgres data type In CareVue In Metavision 说明
ROW_ID INT Y Y 行号
SUBJECT_ID NUMBER(7,0) Y Y 患者编号
HADM_ID NUMBER(7,0) Y Y 病案号
ICUSTAY_ID NUMBER(7,0) Y Y ICU病案号
ITEMID NUMBER(7,0) Y Y 项目标识符
CHARTTIME DATE Y Y 记录时间
STORETIME DATE Y Y 存储时间
CGID NUMBER(7,0) Y Y 护理人员标识符
VALUE VARCHAR2(200 BYTE) Y Y 项目测量的值
VALUENUM NUMBER Y Y 项目测量的数字信息
VALUEUOM VARCHAR2(20 BYTE) Y Y 项目测量的值对应的单位
WARNING NUMBER(1,0) Y 测量过程发生的警告 / Metavision specific columns
ERROR NUMBER(1,0) Y 测量过程发生的错误 / Metavision specific columns
RESULTSTATUS VARCHAR2(20 BYTE) Y 测量类型 ‘Manual’ or ‘Automatic’ / CareVue specific columns
STOPPED VARCHAR2(20 BYTE) Y 测量是否停止

cptevents

患者操作记录,记录程序操作是对哪位患者收费,便于知道某种操作是否执行

Name Postgres data type 说明
ROW_ID INT 行号
SUBJECT_ID INT 患者编号
HADM_ID INT 病案号
COSTCENTER VARCHAR(10) 操作部门
CHARTDATE TIMESTAMP(0) 操作时间
CPT_CD VARCHAR(10) 操作的原始编码code
CPT_NUMBER INT CPT_CD 的数字信息
CPT_SUFFIX VARCHAR(5) CPT_CD 的文本后缀
TICKET_ID_SEQ INT CPT_CD 的顺序
SECTIONHEADER VARCHAR(50) CPT_CD 的种类
SUBSECTIONHEADER VARCHAR(300) CPT_CD 的种类
DESCRIPTION VARCHAR(200) CPT_CD 的详细信息

datetimeevents

患者操作时间信息,包括患者在ICU中所有时间的测量。

Name Postgres data type 说明
ROW_ID INT 行号
SUBJECT_ID INT 患者编号
HADM_ID INT 病案号
ICUSTAY_ID INT ICU病案号
ITEMID INT 项目标识符
CHARTTIME TIMESTAMP(0) 记录时间
STORETIME TIMESTAMP(0) 存储时间
CGID INT 护理人员标识符
VALUE TIMESTAMP(0) 同上chartevents
VALUEUOM VARCHAR(50) 同上chartevents
WARNING SMALLINT 同上chartevents
ERROR SMALLINT 同上chartevents
RESULTSTATUS VARCHAR(50) 同上chartevents
STOPPED VARCHAR(50) 同上chartevents

diagnoses_icd

患者诊断ICD-9编码

Name PostgreSQL data type Modifiers 说明
ROW_ID INT not null -
SUBJECT_ID INT not null -
HADM_ID INT not null -
SEQ_NUM INT ICD诊断顺序
ICD9_CODE VARCHAR(10) 实际编码IDC-9

drgcodes

患者诊断类别组,包含诊断所属的种类

Name PostgreSQL data type 说明
ROW_ID INT -
SUBJECT_ID INT -
HADM_ID INT -
DRG_TYPE VARCHAR(20) 诊断类别
DRG_CODE VARCHAR(20) 诊断编码
DESCRIPTION VARCHAR(300) 详细描述
DRG_SEVERITY SMALLINT 严重程度
DRG_MORTALITY SMALLINT 死亡率

icustays

ICU入住信息

Name Postgres data type 说明
ROW_ID INT -
SUBJECT_ID INT -
HADM_ID INT -
ICUSTAY_ID INT ICU病案号
DBSOURCE VARCHAR(20) 来源数据库 ‘carevue’ ‘metavision’ 在某些地方处理上有所不同
FIRST_CAREUNIT VARCHAR(20) 患者入住监护室24小时内的首个ICU监护室种类
LAST_CAREUNIT VARCHAR(20) 患者入住监护室24小时内的最终ICU监护室种类
FIRST_WARDID SMALLINT 监护室编号
LAST_WARDID SMALLINT 监护室编号
INTIME TIMESTAMP(0) 入科时间
OUTTIME TIMESTAMP(0) 出科时间
LOS DOUBLE 入住时长 可能包括单个或多个ICU单位

inputevents_cv

使用carevue监护系统记录的入量信息

Name Postgres data type 说明
ROW_ID INT -
SUBJECT_ID INT -
HADM_ID INT -
ICUSTAY_ID INT -
CHARTTIME TIMESTAMP(0) 记录时间
ITEMID INT 项目标识符
AMOUNT DOUBLE PRECISION 总入量
AMOUNTUOM VARCHAR(30) 入量单位
RATE DOUBLE PRECISION 给药速率
RATEUOM VARCHAR(30) 速率单位
STORETIME TIMESTAMP(0) 存储时间
CGID BIGINT 护理人员编码
ORDERID BIGINT 同一次输入的多个药物进行链接
LINKORDERID BIGINT 同一次的单个药物不同改变进行链接
STOPPED VARCHAR(30) 输入是否暂停
NEWBOTTLE INT 新配制的溶液
ORIGINALAMOUNT DOUBLE PRECISION -
ORIGINALAMOUNTUOM VARCHAR(30) -
ORIGINALROUTE VARCHAR(30) -
ORIGINALRATE DOUBLE PRECISION -
ORIGINALRATEUOM VARCHAR(30) -
ORIGINALSITE VARCHAR(30) -

inputevents_mv

使用metavision系统记录的入量信息

Name Postgres data type 说明
ROW_ID INT -
SUBJECT_ID INT -
HADM_ID INT -
ICUSTAY_ID INT -
STARTTIME TIMESTAMP(0) 入量开始时间
ENDTIME TIMESTAMP(0) 入量结束时间
ITEMID INT 项目标识符
AMOUNT DOUBLE PRECISION 总入量
AMOUNTUOM VARCHAR(30) 入量单位
RATE DOUBLE PRECISION 给药速率
RATEUOM VARCHAR(30) 速率单位
STORETIME TIMESTAMP(0) 存储时间
CGID BIGINT 护理人员编号
ORDERID BIGINT 同上
LINKORDERID BIGINT 同上
ORDERCATEGORYNAME VARCHAR(100) -
SECONDARYORDERCATEGORYNAME VARCHAR(100) -
ORDERCOMPONENTTYPEDESCRIPTION VARCHAR(200) -
ORDERCATEGORYDESCRIPTION VARCHAR(50) -
PATIENTWEIGHT DOUBLE PRECISION 患者体重 (kg)
TOTALAMOUNT DOUBLE PRECISION 溶液液体总量
TOTALAMOUNTUOM VARCHAR(50) 溶液液体总量单位
ISOPENBAG SMALLINT -
CONTINUEINNEXTDEPT SMALLINT 转移是否继续入量
CANCELREASON SMALLINT 取消原因
STATUSDESCRIPTION VARCHAR(30) 项目最终状态 changed paused finishedrunning stopped rewritten flushed
COMMENTS_STATUS VARCHAR(30) -
COMMENTS_TITLE VARCHAR(100) -
COMMENTS_DATE TIMESTAMP(0) -
ORIGINALAMOUNT DOUBLE PRECISION -
ORIGINALRATE DOUBLE PRECISION -

labevents

患者化验项目

Name Postgres data type 说明
ROW_ID INT -
SUBJECT_ID INT -
HADM_ID INT -
ITEMID INT 项目标识符
CHARTTIME TIMESTAMP(0) 测量时间
VALUE VARCHAR(200) 测量项目
VALUENUM DOUBLE PRECISION 测量数值数据
VALUEUOM VARCHAR(20) 测量单位
FLAG VARCHAR(20) 测量值是否异常

microbiologyevents

患者标本微生物病原体检测结果,包括采集的培养物和相关敏感性

Name Postgres data type 说明
ROW_ID INT -
SUBJECT_ID INT -
HADM_ID INT -
CHARTDATE TIMESTAMP(0) 记录日期
CHARTTIME TIMESTAMP(0) 记录时间
SPEC_ITEMID INT 化验项目标识符
SPEC_TYPE_DESC VARCHAR(100) 化验类型 血液 尿液 痰
ORG_ITEMID INT 生成的有机物标识符
ORG_NAME VARCHAR(100) 有机物名称
ISOLATE_NUM SMALLINT 分离菌落数目
AB_ITEMID INT 抗生素敏感性测试标识符
AB_NAME VARCHAR(30) 抗生素名称
DILUTION_TEXT VARCHAR(10) 测试抗生素敏感性
DILUTION_COMPARISON VARCHAR(20) -
DILUTION_VALUE DOUBLE PRECISION 测试抗生素敏感性时的稀释值
INTERPRETATION VARCHAR(5) 解释抗生素的敏感性和试验结果 “S”是敏感的,“R”是抗性的,“I”是中间的,“P”是待定的

noteevents

治疗记录

Name Postgres data type 说明
ROW_ID INT -
SUBJECT_ID INT -
HADM_ID INT -
CHARTDATE TIMESTAMP(0) -
CHARTTIME TIMESTAMP(0) -
STORETIME TIMESTAMP(0) -
CATEGORY VARCHAR(50) 记录类型 ‘Discharge’ :出院
DESCRIPTION VARCHAR(300) 记录类别 ‘Summary’ :总结
CGID INT 护理人员标识符
ISERROR CHAR(1) ‘1’ 代表该记录被标记为错误
TEXT TEXT 医嘱内容

outputevents

患者出量数据

Name Postgres data type 说明
ROW_ID INT -
SUBJECT_ID INT -
HADM_ID INT -
ICUSTAY_ID INT -
CHARTTIME TIMESTAMP(0) -
ITEMID INT 项目标识符
VALUE DOUBLE PRECISION 出量值
VALUEUOM VARCHAR(30) 出量值的单位
STORETIME TIMESTAMP(0) 存储时间
CGID BIGINT 护理人员标识符
STOPPED VARCHAR(30) 是否中断
NEWBOTTLE INT 是否有准备新溶液
ISERROR SMALLINT 是否被标记为错误

patients

患者信息

Name Postgres data type 说明
ROW_ID INT -
SUBJECT_ID INT 患者编号
GENDER VARCHAR(5) 性别
DOB TIMESTAMP(0) 出生日期
DOD TIMESTAMP(0) 死亡日期
DOD_HOSP TIMESTAMP(0) 院内登记死亡日期
DOD_SSN TIMESTAMP(0) 社保局登记死亡日期
EXPIRE_FLAG VARCHAR(5) 死亡标记

prescriptions

病人用药记录

Name Postgres data type 说明
ROW_ID INT -
SUBJECT_ID INT -
HADM_ID INT -
ICUSTAY_ID INT -
STARTDATE TIMESTAMP(0) 用药开始时间
ENDDATE TIMESTAMP(0) 用药结束时间
DRUG_TYPE VARCHAR(100) 药物类型
DRUG VARCHAR(100) 药物名称
DRUG_NAME_POE VARCHAR(100) 药物说明
DRUG_NAME_GENERIC VARCHAR(100) 药物说明
FORMULARY_DRUG_CD VARCHAR(120) 处方药代码
GSN VARCHAR(200) Generic Sequence Number
NDC VARCHAR(120) National Drug Code
PROD_STRENGTH VARCHAR(120) -
DOSE_VAL_RX VARCHAR(120) -
DOSE_UNIT_RX VARCHAR(120) -
FORM_VAL_DISP VARCHAR(120) -
FORM_UNIT_DISP VARCHAR(120) -
ROUTE VARCHAR(120) -

procedureevents_mv

metavision系统操作信息

Name Postgres data type 说明
ROW_ID INT NOT NULL -
SUBJECT_ID INT NOT NULL -
HADM_ID INT NOT NULL -
ICUSTAY_ID INT -
STARTTIME TIMESTAMP(0) -
ENDTIME TIMESTAMP(0) -
ITEMID INT -
VALUE DOUBLE PRECISION -
VALUEUOM VARCHAR(30) -
LOCATION VARCHAR(30) -
LOCATIONCATEGORY VARCHAR(30) -
STORETIME TIMESTAMP(0) -
CGID INT -
ORDERID INT -
LINKORDERID INT -
ORDERCATEGORYNAME VARCHAR(100) 药物一级分类名称
SECONDARYORDERCATEGORYNAME VARCHAR(100) 药物二级分类名称
ORDERCATEGORYDESCRIPTION VARCHAR(50) 药物分类描述
ISOPENBAG SMALLINT -
CONTINUEINNEXTDEPT SMALLINT -
CANCELREASON SMALLINT 取消原因
STATUSDESCRIPTION VARCHAR(30) 状态描述
COMMENTS_EDITEDBY VARCHAR(30)
COMMENTS_CANCELEDBY VARCHAR(30)
COMMENTS_DATE TIMESTAMP(0)

procedures_icd

病人手术记录ICD-9编码

Name PostgreSQL data type Modifiers 说明
ROW_ID INT not null -
SUBJECT_ID INT not null -
HADM_ID INT not null -
SEQ_NUM INT 操作顺序
ICD9_CODE VARCHAR(10) ICD-9 编码

services

患者需要接受的医疗服务

Name Postgres data type 说明
ROW_ID INT -
SUBJECT_ID INT -
HADM_ID INT -
TRANSFERTIME TIMESTAMP(0) 服务种类更改时间
PREV_SERVICE VARCHAR(20) 前次服务种类
CURR_SERVICE VARCHAR(20) 当前服务种类

服务的名称缩写及其详细说明

Service Description
CMED Cardiac Medical - for non-surgical cardiac related admissions
CSURG Cardiac Surgery - for surgical cardiac admissions
DENT Dental - for dental/jaw related admissions
ENT Ear, nose, and throat - conditions primarily affecting these areas
GU Genitourinary - reproductive organs/urinary system
GYN Gynecological - female reproductive systems and breasts
MED Medical - general service for internal medicine
NB Newborn - infants born at the hospital
NBB Newborn baby - infants born at the hospital
NMED Neurologic Medical - non-surgical, relating to the brain
NSURG Neurologic Surgical - surgical, relating to the brain
OBS Obstetrics - conerned with childbirth and the care of women giving birth
ORTHO Orthopaedic - surgical, relating to the musculoskeletal system
OMED Orthopaedic medicine - non-surgical, relating to musculoskeletal system
PSURG Plastic - restortation/reconstruction of the human body (including cosmetic or aesthetic)
PSYCH Psychiatric - mental disorders relating to mood, behaviour, cognition, or perceptions
SURG Surgical - general surgical service not classified elsewhere
TRAUM Trauma - injury or damage caused by physical harm from an external source
TSURG Thoracic Surgical - surgery on the thorax, located between the neck and the abdomen
VSURG Vascular Surgical - surgery relating to the circulatory system

transfers

患者周转信息

Name Postgres data type 说明
ROW_ID INT -
SUBJECT_ID INT -
HADM_ID INT -
ICUSTAY_ID INT -
DBSOURCE VARCHAR(20) 数据来源 ‘carevue’ ‘metavision’
EVENTTYPE VARCHAR(20) 转移的类型 ‘admit’ ‘transfer’ ‘discharge’
PREV_CAREUNIT VARCHAR(20) 前次所在监护室
CURR_CAREUNIT VARCHAR(20) 当前所在监护室
PREV_WARDID SMALLINT 前次所在科室代码
CURR_WARDID SMALLINT 当前所在科室代码
INTIME TIMESTAMP(0) 入科时间
OUTTIME TIMESTAMP(0) 出科时间
LOS INT 住院时长
posted @ 2020-06-29 10:55  林震宇  阅读(4327)  评论(0编辑  收藏  举报