https://blog.csdn.net/shx13141/article/details/137734949
7G多,解压后65G多,导入数据库占用空间快70G!
1 2 3 4 5 6 7 8 9 10 |
|
https://blog.csdn.net/idata01/article/details/141034352
1.MIMIC IV 3.0数据库变化情况
2024年7月19日,知名医疗数据库MIMIC-IV发布了最新的3.0版本,此次更新为数据库带来了诸多重要改进和新增数据。此次更新最显著的变化是新增了2020年至2022年期间的住院数据。新增数据的具体情况如下:
患者数:从v2.2的299,712增加至364,627。
住院次数:从v2.2的431,231增加至546,028。
ICU停留次数:从v2.2的73,181增加至94,458。
此外,数据库中还包含了住院或急诊出院后最长1年的院外死亡率数据。这一改进将极大地提升研究人员对于患者长期预后的研究能力。(MIMIC-IV v3.0 重磅发布:新增2020-2022年住院数据及多项改进)
这里需要说明一点,经常有人说MIMIC 3、MIMIC 4等等名词,本身没有错,但是如果把MIMIC IV 3.0说成MIMIC 3是错误的表达,因为MIMIC 3实际指的是MIMIC iii。
2.MIMIC IV 3.0安装准备
首先需要到MIMIC的官方网站(https://physionet.org/content/mimiciv/3.0/%EF%BC%89%E4%B8%8B%E8%BD%BD%E5%8E%9F%E5%A7%8B%E6%95%B0%E6%8D%AE%E5%8C%85%EF%BC%8C%E5%8E%9F%E5%A7%8B%E6%95%B0%E6%8D%AE%E5%8C%85%E6%98%AFcsv.gz%E5%8E%8B%E7%BC%A9%E5%8C%85%EF%BC%8C%E5%A4%A7%E6%A6%829.8GB%E3%80%82%E5%A6%82%E6%9E%9C%E4%B9%8B%E5%89%8D%E5%B7%B2%E7%BB%8F%E6%9C%89MIMIC IV 2.2版本的权限,那么无需申请,可以直接下载。如果没有权限访问是无法下载的,需要进行申请。不过申请MIMIC数据库可不是件容易的事情,可以找专业人士帮忙协助,省时省力。
如果您的账号有权限那么可以直接通过浏览器下载,但由于国内网络条件情况以及9.8GB的数据包,下载过程很容易中断。这里需要说明的是任何有权限的人下载得到的数据库都是完全一样的,就是A医生下载的MIMIC IV 3.0和B医生下载的并没有区别,只要版本一样文件大小一样,那么就是一样的。
安装MIMIC IV 3.0数据库其实是不需要physionet网站访问权限,很多以为现申请后才能安装,其实不然。申请citiprogram和physionet权限,本质上是为了在发表论文时符合学术要求,因为MIMIC、eICU等数据库是受限访问和使用的,所以您发文章必须要证明您有资格使用这些数据进行研究,否则您的研究成功违反学术要求,会有很大的风险。所以才发论文之前必须要申请到citiprogram和physionet权限,需要特别说明的是仅仅有citiprogram权限是不符合要求的,因为citiprogram权限只是申请physionet权限的一个前置条件。目前国内很多人在这方面投机取巧,虽然文章也发表了,但是后患无穷。
3.MIMIC IV 3.0软件环境准备
MIMIC数据库的安装环境主要是Postgresql数据库软件和7z解压软件。官方建议把MIMIC IV数据库安装到Postgresql数据库,虽然国内目前也有人安装到SQL Server数据库,但是实在是非常非常小众,不建议这样做。否则到时拿到其他人代码来执行提取,都不能保证通用。毕竟全世界国内外大都是用Postgresql来安装的。对于广大医学生和医务工作者来说,安装MIMIC也是一件痛苦的事情,平时看书、做实验、上班、做手术已经够累了,对计算机技术方面还要深入学习的话就难上加累,因此建议可以找专人人士来安装,一般Windows电脑安装10多分钟安装好,自己折腾要几个小时甚至几天都搞不定。
4.MIMIC IV 3.0导入数据方法
目前MIMIC的code还没有更新,在安装MIMIC IV 3.0的时候会直接报错,也不知道官方何时能够更新。这些报错对于懂数据库的人来说很简单,但是对于没搞过这方面的人简直是噩梦,一头雾水,因此建议可以找专人人士(idata01)来安装。
另外就是构建concept(即视图、衍生表、派生表的概念)也是十分费事,官方其实没有说的很明确,导致有些人把concept生成到Public表,有些人生成到mimiciv_derived的表。其实concept是用来生成派生或者衍生数据的代码,它是从hosp和ICU模块通过官方提供的代码提取出来的数据,可以直接理解为官方给大家提前提取的数据,方便研究人员进行参考和开展研究。国外会把concept数据生成到实体化视图(物化视图)中,而不是表,而国内很多MIMIC培训班讲师大都说这样做不对,认为安装到表才对,我认为这里其实是很大的误区。从技术上讲太深可能很难理解,但是实体化视图(物化视图)其实是一直更优的做法,视图可以通过简单的代码就能够自动或手动更新数据,而表不行,假设对Hosp和ICU数据进行了清洗处理,那么对应的视图可以快速进行自动或者手动更新。
5.MIMIC IV 3.0提取数据
提取数据是大家安装MIMIC IV 3.0数据库的终极需求,这里我给大家一点建议。我看很多人还是使用pgadmin来提取数据,我知道造成情况的原因是视频教程里用了pgadmin来做演示数据提取,但是实际上这个pgadmin使用体验上比较槽糕,界面也不太友好。我建议大家使用Navicat来提取,Navicat是一款商业数据库可视化工具,目前个人版已经免费了,旗舰版也有很多方法可以使用。Navicat在界面友好,代码运行性能,操作功能等等方面都值得大家去用。当然无论是用pgadmin还是Navicat,SQL代码是通用的,不会因为使用的SQL工具不一样,代码就会不同。
关于提取代码的备份问题:如果用SQL提取数据,我建议大家写SQL的时候要注意备份好代码。有些人会把SQL保存在查询的对话里,虽然这是一种便利的操作,但是容易丢失无法恢复,千五别把自己辛苦研究的代码交给一个软件去给你保管。无论是SQL代码、R代码、python代码,我们建议都进行备份,例如备份到有道云笔记、OneNote或者邮箱等云产品中,这样的话即使电脑坏掉了或者被偷了,自己也能够找回来代码。
6.MIMIC IV 3.0安装总结
MIMIC IV 3.0数据库安装方法或者思路如上,其实和MIMIC IV 2.2没有区别。常规的安装方法,会安装且电脑也比较快的话一般需要2-4小时,慢的也有七八小时的情况。idata01全网首创了一种极速安装技术,安装好的数据和官网是完全一样的,但是安装时间只需要10-20分钟,极大的节省了科研人员的时间。
https://baijiahao.baidu.com/s?id=1782794027321717654&wfr=spider&for=pc
三、HOSP
admissions.csv:患者入院记录数据,包含有关患者入院的信息,如入院时间、出院时间、诊断等。
subject_id:患者的唯一标识符。
hadm_id:每次住院的唯一标识符。
admittime:入院时间,表示患者被接收为住院患者的日期和时间。
dischtime:出院时间,表示患者从医院出院的日期和时间。
deathtime:死亡时间,如果患者在医院内死亡,则记录死亡日期和时间。
admission_type:入院类型,示患者被接收到医院的方式,如急诊、计划手术等。
admit_provider_id:接收患者的医生或提供护理的医疗专业人员的唯一标识符。
admission_location:入院地点,表示患者被接收到医院的具体位置,如急诊室。
discharge_location:出院地点,表示患者离开医院后的具体位置,如家庭、养老院等。
insurance:患者的医疗保险类型,如医保、商业保险等。
language:患者的语言。
marital_status:患者的婚姻状况。
race:患者的种族或民族。
edregtime:急诊室接收时间,表示患者进入急诊室的日期和时间。
edouttime:急诊室出院时间,表示患者离开急诊室的日期和时间。
hospital_expire_flag:住院期间是否死亡的标志,1表示患者在住院期间死亡,0表示未死亡。
drgcodes.csv:诊断相关组(Diagnosis Related Group)代码数据,用于医疗费用计算和统计分析。
subject_id:患者的唯一标识符。
hadm_id:每次住院的唯一标识符。
drg_type:诊断相关组(Diagnosis Related Group,简称DRG)的类型。DRG是根据患者入院诊断、手术情况、年龄、性别等因素进行分类的一种方法,用于决定医院住院费用的支付。
drg_code:诊断相关组代码,用于标识具体的DRG类别。
description:诊断相关组的描述,提供对DRG类别的文字说明。
drg_severity:诊断相关组的严重程度。通常使用数字表示,较高的数字表示更严重的疾病或手术。
drg_mortality:诊断相关组的死亡率指数。通常使用数字表示,较高的数字表示更高的死亡风险。
emar_detail.csv:电子药物管理记录详细数据,包含关于患者药物治疗的详细信息。
subject_id:患者的唯一标识符。
emar_id:电子药物管理记录的唯一标识符。
emar_seq:电子药物管理记录的顺序号。
parent_field_ordinal:父字段顺序号,用于标识具有父-子关系的字段之间的层次结构。
administration_type:给药类型,指示药物给予的方式,如口服、静脉注射等。
pharmacy_id:药房的唯一标识符。
barcode_type:条形码类型,用于扫描和识别药物。
reason_for_no_barcode:未使用条形码的原因。
complete_dose_not_given:完整剂量是否已给予的标志。
dose_due:应给剂量的数量。
dose_due_unit:应给剂量的单位。
dose_given:实际给予剂量的数量。
dose_given_unit:实际给予剂量的单位。
will_remainder_of_dose_be_given:剩余剂量是否会继续给予的标志。
product_amount_given:实际给予的产品(药物)数量。
product_unit:产品(药物)数量的单位。
product_code:产品(药物)的代码。
product_description:产品(药物)的描述。
product_description_other:产品(药物)的其他描述。
prior_infusion_rate:之前的输液速率。
infusion_rate:当前的输液速率。
infusion_rate_adjustment:输液速率调整方式。
infusion_rate_adjustment_amount:输液速率调整量。
infusion_rate_unit:输液速率的单位。
route:给药途径/路径。
infusion_complete:输液是否完成的标志。
completion_interval:完成间隔时间。
new_iv_bag_hung:是否换了新的输液袋。
continued_infusion_in_other_location:输液是否在其他位置继续进行的标志。
restart_interval:重新开始输液的间隔时间。
side:给药侧面。
site:给药部位。
non_formulary_visual_verification:非法定目视核对的标志。
microbiologyevents.csv:微生物学检测事件数据,记
microevent_id:微生物学事件的唯一标识符。
subject_id:患者的唯一标识符。
hadm_id:入院号,指患者的住院标识符。
micro_specimen_id:微生物标本的唯一标识符。
order_provider_id:开单医生的唯一标识符。
chartdate:记录日期。
charttime:记录时间。
spec_itemid:标本项目的唯一标识符。
spec_type_desc:标本类型的描述。
test_seq:测试顺序号。
storedate:存储日期,指标本的收集或储存日期。
storetime:存储时间,指标本的收集或储存时间。
test_itemid:测试项目的唯一标识符。
test_name:测试项目的名称。
org_itemid:微生物组织的唯一标识符。
org_name:微生物组织的名称。
isolate_num:分离编号,指不同微生物分离的编号。
quantity:数量,表示微生物的数量。
ab_itemid:抗生素项目的唯一标识符。
ab_name:抗生素的名称。
dilution_text:稀释文本,用于描述抗生素的稀释程度。
dilution_comparison:稀释比较,用于比较抗生素的稀释程度。
dilution_value:稀释值,表示抗生素的稀释倍数。
interpretation:解释,表示对测试结果的解释或诊断。
comments:备注,用于记录其他相关信息。
poe.csv:医嘱输入数据,记录了医生对患者的医嘱,如药物、检查等。
poe_seq: 医嘱序列号,指医嘱在医嘱组中的序列号。
poe_id: 医嘱唯一标识符,表示医嘱的唯一ID。
subject_id: 患者的唯一标识符。
hadm_id: 入院号,表示患者的住院标识符。
ordertime: 医嘱时间,指医嘱被下达的时间。
order_type: 医嘱类型,表示医嘱的类型。
order_subtype: 医嘱子类型,表示医嘱的子类型。
transaction_type: 交易类型,指与医嘱相关的交易类型。
discontinue_of_poe_id: 终止医嘱的医嘱ID,表示终止医嘱所属的原始医嘱ID。
discontinued_by_poe_id: 终止医嘱的医嘱ID,表示执行终止操作的医嘱ID。
order_provider_id: 医嘱提供者标识符,表示下达医嘱的提供者。
order_status: 医嘱状态,表示医嘱的当前状态。
prescriptions.csv:处方数据,记录了对患者开具的处方药物信息。
subject_id:患者的唯一标识符。
hadm_id:入院号,指患者的住院标识符。
pharmacy_id:药房的唯一标识符。
poe_id:医嘱输入/录入(Prescription Order Entry)的唯一标识符。
poe_seq:医嘱输入/录入的顺序号。
order_provider_id:开单医生的唯一标识符。
starttime:药物使用的开始时间。
stoptime:药物使用的停止时间。
drug_type:药物类型,如处方药、非处方药等。
drug:药物的名称。
formulary_drug_cd:药物在药物目录中的代码。
gsn:全球服务网络码(Global Service Network Code),用于标识药物。
ndc:国家药物编码(National Drug Code),用于唯一标识药物。
prod_strength:药物的剂量强度。
form_rx:处方剂型,表示药物的制剂形式。
dose_val_rx:处方剂量的数值。
dose_unit_rx:处方剂量的单位。
form_val_disp:实际发放的剂量的数值。
form_unit_disp:实际发放的剂量的单位。
doses_per_24_hrs:每24小时给药的次数。
route:给药途径/路径。
services.csv:医疗服务数据,记录了患者接受的医疗服务,如手术、检查等。
subject_id:患者的唯一标识符。
hadm_id:入院号,指患者的住院标识符。
transfertime:转诊时间,指患者从一个服务部门转到另一个服务部门的时间。
prev_service:之前的服务部门,指患者转诊前所在的服务部门。
curr_service:当前的服务部门,指患者转诊后所在的服务部门。
diagnoses_icd.csv:ICD诊断码数据,记录了与患者诊断相关的国际疾病分类(ICD)编码和描述。
subject_id:患者的唯一标识符。
hadm_id:入院号,指患者的住院标识符。
seq_num:诊断顺序号,表示该诊断在所有诊断中的顺序。
icd_code:诊断编码,指诊断的疾病或症状在国际疾病分类(ICD)中的编码。
icd_version:ICD版本,指使用的ICD编码标准版本号。
emar.csv:电子药物管理记录数据,与emar_detail.csv相似,可能包含更高层次的概要信息。
subject_id:患者的唯一标识符。
hadm_id:入院号,指患者的住院标识符。
emar_id:电子药物管理记录的唯一标识符。
emar_seq:电子药物管理记录的顺序号。
poe_id:医嘱输入/录入(Prescription Order Entry)的唯一标识符。
pharmacy_id:药房的唯一标识符。
enter_provider_id:录入提供者的唯一标识符。
charttime:记录时间,指药物管理记录的时间。
medication:药物名称。
event_txt:事件描述,指药物管理的具体情况。
scheduletime:计划时间,指计划给药的时间。
storetime:存储时间,指药物管理记录被存储的时间。
labevents.csv:实验室检测事件数据,记录了与患者实验室检测结果相关的信息,如检测时间、检验指标、结果值等。
labevent_id:实验室检查记录的唯一标识符。
subject_id:患者的唯一标识符。
hadm_id:入院号,指患者的住院标识符。
specimen_id:样本的唯一标识符。
itemid:检查项目的唯一标识符。
order_provider_id:检查申请提供者的唯一标识符。
charttime:记录时间,指实验室检查记录的时间。
storetime:存储时间,指实验室检查记录被存储的时间。
value:检查结果值。
valuenum:检查结果数值。
valueuom:检查结果单位。
ref_range_lower:参考范围下限。
ref_range_upper:参考范围上限。
flag:检查结果标记,指示该结果是否异常。
priority:检查优先级。
comments:注释,包含有关实验室检查结果的其他信息
pharmacy.csv:药房数据,可能包含有关药品配送、管理和库存方面的信息。
subject_id:患者的唯一标识符。
hadm_id:入院号,指患者的住院标识符。
pharmacy_id:药房的唯一标识符。
poe_id:医嘱输入/录入(Prescription Order Entry)的唯一标识符。
starttime:开药时间,指医生开始发药的时间。
stoptime:停药时间,指医生停止发药的时间。
medication:药物名称。
proc_type:处理类型,指医生的处理方式。
status:状态,指药物发放/管理员授权的状态。
entertime:进入时间,指药物进入药房的时间。
verifiedtime:验证时间,指验证药物信息的时间。
route:给药途径,指药物的给药方式。
frequency:给药频率,指药物的给药频率。
disp_sched:分配计划,指药物的分配计划。
infusion_type:静脉注射类型,指静脉注射药物的类型。
sliding_scale:滑动比例,指血糖和胰岛素之间的滑动比例。
lockout_interval:锁定间隔,指注射药物的锁定时间间隔。
basal_rate:基础速率,指注射药物的基础速率。
one_hr_max:一小时最大值,指药物的一小时最大剂量。
doses_per_24_hrs:每24小时次数,指药物的每24小时的使用次数。
duration:持续时间,指药物的持续使用时间。
duration_interval:持续时间间隔,指药物的持续使用时间间隔。
expiration_value:过期时间值,指药物过期时间的值。
expiration_unit:过期时间单位,指药物过期时间的单位。
expirationdate:过期日期,指药物的过期日期。
dispensation:配药,指药房完成配药的记录。
fill_quantity:填充数量,指药房填充药物的数量。
poe_detail.csv:医嘱输入详细数据,可能包含更详细的医嘱信息,如剂量、频率等:其中包含字段
poe_id:医嘱事件的唯一标识符。
poe_seq:医嘱事件在患者住院期间的顺序号,按时间排序。
subject_id:患者的唯一标识符。
field_name:医嘱属性的名称,如药品名称、剂量、给药路径等。
field_value:医嘱属性的值,如药品的具体名称、剂量数值、给药路径描述等。
procedures_icd.csv:ICD手术/过程码数据,记录了与患者手术或医疗过程相关的ICD编码和描述。
subject_id:患者的唯一标识符。
hadm_id:入院号,指患者的住院标识符。
seq_num:诊断序号,指该诊断在该患者所有诊断中的序号。
chartdate:记录时间,指诊断记录的时间。
icd_code:ICD编码,指诊断类别编码。
icd_version:ICD版本,指使用的ICD版本。
transfers.csv:患者转院记录数据,包含有关患者转院的信息,如转出科室、转入科室等。
subject_id:患者的唯一标识符。
hadm_id:入院号,指患者的住院标识符。
transfer_id:转归ID,指该转归记录在该患者所有转归中的序号。
eventtype:事件类型,指该转归是入住、转科、出院还是其他事件。
careunit:病房名称,指患者所在病房的名称。
intime:入住时间,指患者入住病房的时间。
outtime:出院时间,指患者出院的时间。
四、ICU
ICU 模块包含来自 BIDMC 临床信息系统的数据: MetaVision (iMDSoft)。MetaVision 表被反规范化,以创建一个星型模式,其中 icustays 和 d _ item 表链接到一组数据表,所有表的后缀都是“ events”。ICU 模块中记录的数据包括静脉和液体输入(输入事件) ,上述输入的成分(成分事件) ,患者输出(输出事件) ,程序(程序事件) ,记录为日期或时间的信息(日期时间事件)和其他图表信息(图表事件)。所有事件表都包含 stay _ id 列,允许标识 ICUU 中的相关患者,以及一个 itemid 列,允许标识 d _ item 中记录的概念。此外,护理人员表包含 caregiver _ id,这是一个未标识的整数,表示将数据记录到系统中的护理提供者。所有事件表(chartevents、 (chartevents, datetimeevents, ingredientevents, inputevents,outputevents, procedureevents都有一个 caregiver _ id 列,该列链接到 caregiver 表。
datetimeevents.csv:该文件记录了与日期和时间相关的事件,例如护理措施、检查和药物管理等。
subject_id:患者的唯一标识符。
hadm_id:入院号,表示患者的住院标识符。
stay_id:留观号,指患者在医院中的留观期间的唯一标识符。
caregiver_id:护理人员标识符,表示执行该记录的护理人员。
charttime:记录时间,指事件发生的时间。
storetime:存储时间,表示记录被存储的时间。
itemid:项目ID,指记录的特定项目或测量。
value:数值,表示与该项目相关的测量值。
valueuom:数值单位,表示测量值的单位。
warning:警告标志,表示是否存在与该记录相关的警告。
icustays.csv:该文件记录了患者在重症监护室(ICU)的留观信息。
subject_id:患者的唯一标识符。
hadm_id:入院号,表示患者的住院标识符。
stay_id:留观号,指患者在医院中的留观期间的唯一标识符。
first_careunit:首次护理单元,表示患者在住院期间所在的第一个护理单元。
last_careunit:最后护理单元,表示患者在住院期间所在的最后一个护理单元。
intime:入院时间,指患者入院的时间。
outtime:出院时间,表示患者出院的时间。
los:住院天数,表示患者在医院中的住院天数。
ingredientevents.csv:包含有关药物成分的数据,可能包括使用的药物成分、剂量、途径和给药时间等相关信息。
subject_id: 患者的唯一标识符。
hadm_id: 入院号,表示患者的住院标识符。
stay_id: 留观号,指患者在医院中的留观期间的唯一标识符。
caregiver_id: 护理人员标识符,表示执行该记录的护理人员。
starttime: 开始时间,指记录事件或处理开始的时间。
endtime: 结束时间,表示记录事件或处理结束的时间。
storetime: 存储时间,表示记录被存储的时间。
itemid: 项目ID,指记录的特定项目或测量。
amount: 数量,表示与该项目相关的数值量。
amountuom: 数量单位,表示数值的单位。
rate: 速率,指与该项目相关的速率值。
rateuom: 速率单位,表示速率的单位。
orderid: 医嘱ID,表示与记录相关联的医嘱标识符。
linkorderid: 链接医嘱ID,指连接到当前记录的其他医嘱的标识符。
statusdescription: 状态描述,表示记录的状态描述。
originalamount: 原始数量,表示原始数值量。
originalrate: 原始速率,指原始速率值。
inputevents.csv:包含有关液体或药物输入的数据,如给药途径、剂量、速率、开始时间和结束时间等相关信息。
subject_id: 患者的唯一标识符。
hadm_id: 入院号,表示患者的住院标识符。
stay_id: 留观号,指患者在医院中的留观期间的唯一标识符。
caregiver_id: 护理人员标识符,表示执行该记录的护理人员。
starttime: 开始时间,指记录事件或处理开始的时间。
endtime: 结束时间,表示记录事件或处理结束的时间。
storetime: 存储时间,表示记录被存储的时间。
itemid: 项目ID,指记录的特定项目或测量。
amount: 数量,表示与该项目相关的数值量。
amountuom: 数量单位,表示数值的单位。
rate: 速率,指与该项目相关的速率值。
rateuom: 速率单位,表示速率的单位。
orderid: 医嘱ID,表示与记录相关联的医嘱标识符。
linkorderid: 链接医嘱ID,指连接到当前记录的其他医嘱的标识符。
ordercategoryname: 医嘱类别名称,表示医嘱的类别名称。
secondaryordercategoryname: 辅助医嘱类别名称,指医嘱的辅助类别名称。
ordercomponenttypedescription: 医嘱组件类型描述,表示医嘱组件的类型描述。
ordercategorydescription: 医嘱类别描述,表示医嘱的类别描述。
patientweight: 患者体重,表示患者的体重值。
totalamount: 总数量,表示与该项目相关的总数量。
totalamountuom: 总数量单位,表示总数量的单位。
isopenbag: 是否为开袋状态,指示医嘱是否处于开袋状态。
continueinnextdept: 是否延续至下一科室,指示医嘱是否需要延续至下一个科室。
statusdescription: 状态描述,表示记录的状态描述。
originalamount: 原始数量,表示原始数值量。
originalrate: 原始速率,指原始速率值。
outputevents.csv:包含有关液体或药物输出的数据,如排尿量、引流量等相关信息。
subject_id: 患者的唯一标识符。
hadm_id: 入院号,表示患者的住院标识符。
stay_id: 留观号,指患者在医院中的留观期间的唯一标识符。
caregiver_id: 护理人员标识符,表示执行该记录的护理人员。
charttime: 图表时间,指记录事件或测量的时间。
storetime: 存储时间,表示记录被存储的时间。
itemid: 项目ID,指记录的特定项目或测量。
value: 值,表示与该项目相关的数值。
valueuom: 值的单位,表示数值的单位。
procedureevents.csv:包含有关医疗过程或手术的数据,如手术类型、开始时间和结束时间等相关信息。
subject_id: 患者的唯一标识符。
hadm_id: 入院号,表示患者的住院标识符。
stay_id: 留观号,指患者在医院中的留观期间的唯一标识符。
caregiver_id: 护理人员标识符,表示执行该记录的护理人员。
starttime: 开始时间,指记录事件或处理开始的时间。
endtime: 结束时间,表示记录事件或处理结束的时间。
storetime: 存储时间,表示记录被存储的时间。
itemid: 项目ID,指记录的特定项目或测量。
value: 值,表示与该项目相关的数值。
valueuom: 值的单位,表示数值的单位。
location: 位置,指记录事件或处理发生的位置。
locationcategory: 位置类别,表示位置的类别。
orderid: 医嘱ID,表示与记录相关联的医嘱标识符。
linkorderid: 链接医嘱ID,指连接到当前记录的其他医嘱的标识符。
ordercategoryname: 医嘱类别名称,表示医嘱的类别名称。
ordercategorydescription: 医嘱类别描述,表示医嘱的类别描述。
patientweight: 患者体重,表示患者的体重值。
isopenbag: 是否为开袋状态,指示医嘱是否处于开袋状态。
continueinnextdept: 是否延续至下一科室,指示医嘱是否需要延续至下一个科室。
statusdescription: 状态描述,表示记录的状态描述。
originalamount: 原始数量,表示原始数值量。
originalrate: 原始速率,指原始速率值。