SDTM - Assumption

1. timing变量可以被加到DOMAIN中,但有些DOMAIN不行

对于三个基本domain,必须有一个timing变量。按ISO8601格式。

2. EPOCH变量基于--DTC,--STDTC,如果样本是持续一段时间,则基于--ENDTC

  EPOCH不能被derive,只能assign,根据crf assign。如果时间不能判断EPOCH,则留空。

  Interventions or Events , Findings performed before their participation in the study,EPOCH都是空?

  计划内访视根据VISITNUM指定EPOCH。计划外访视根据--DTC/--STDTC指定EPOCH,需要和SESTDTC,SEENDTC比较。

2.1 PHASE

PHASE(只出现在TS域,PARAMCD=TPHASE):用于说明临床试验是几期。例如,PHASE III Trial

3. 变量顺序

三类基本domain :Identifiers,Topic, Qualifier, and Timing。具体顺序参考SDTM model。

define中的变量顺序和SDTM数据集中要一致。

4. Req, expected, permissible

Req:识别记录,或使得记录有意义。必须不能为空,包含在SDTM中;

Exp:对记录的补充。可以为空,包含在SDTM中;

Per:可以为空,包含在SDTM中;

  即使全为空,如果有必要,也包含在SDTM中。

5. 数据集的拆分

基于--CAT --SCAT。FA基于--OBJ

数据集命名,前两个字母一致。

SUPP--数据集如何拆?

6. Origin

变量是怎么来的,数据是怎么来的。

7. nature key

方便了解数据结构。优先使用收集的。如果用supplenmetal,要QNAM.VAR;

不推荐--TEST --TESTCD包含所有测量信息,应尽可能简单。用其它qualifier变量去存信息。

8.  --CD和Label说明

--TESTCD限制8个字符

ARMCD最多20个

ETCD和TSPARMCD限制8个字符,但没有符号限制。

label不超40个字符。

9. 变量注意整个study一致。像type CT format等

10. --前缀

A-Z第一个字母,A-Z 0-9第二个字母。

不适用--前缀的。identifier变量,VISIT变量,DM变量。SUPPQUAL变量等

11. USUBJID and SUBJID

subject就是patient;

USUBJID是用来唯一区分一个人,不能有两个及以上的人有相同USUBJID。

如果一个人参加多个试验,USUBJID相同,SUBJID不同。

 

12. 文本推荐大写,但一些文本,test等可以首字母大写,方便阅读。来自字典的则和字典一致。

13. 空值

--STAT --REASND

14. grouping variables

14.1

 

14.2 --CAT --SCAT

一般来说,其值都是在单个DOMAIN中有意义。但:

MHCAT中某个值和AECAT某个值相同

AECAT和FACAT值相同。例如AE某个不良反应,其某个参数存在了FA中

RELREC用来说明收集数据时的复杂关系,例如,吸氧同时测量VS,PR。其--CAT相同,如压力测试。

15. --ID

--GRPID是同一USUBJID内同一DOMAIN内;

--SPID --REFID有时也用做group。

----LNKID是一对多;--LNKGRP是多对一

--CAT和--GRPID不同:

--CAT有CT,实验前已知,across subjects;    不同subject间值一致,例如某个伴随用药;

--GRPID没CT,实验前未知,同一subject内;不同subject间值不一致,如SAE,AETERM不同。

--RESCAT是收集数据后分组;

16. 变量长度

label最长200,变量需要trim,设置成所需要的最大长度。

17. CT值

包含在define中。应该是可读的,而不是编码。

具体放coding哪些变量?

18. topic变量默认按verbatim排序,也就是--TRT --TERM --TESTCD;

19. YN CT值

空值不能被指定为N;像--LOBXFL等只是识别最后一条观测记录,没必要非最后一条记录标记N

YN CT是可扩展的,例如NA U

 20. date and time format

 

对于缺失值,仅一个-代表缺失值,日期间的三个-不能少

 例子:

  

 

 

 

intervel period:

 

 

 

 21. study day

以RFSTDTC为参考时间;如果不以RFSTDTC为参考时间,则需要把参考时间存SUPP--中。

22.  VISIT VISITNUM

VISIT就是些临床遭遇

VISIT和VISITNUM是一 一maping,按时间排序

VISITDY:

  如果VISIT持续大于一天,则VISITDY按开始日期算

  对于unplanned visit,VISITNUM不为空,VISITDY为空。因为VISITDY就是按planned算的

  VISIT为unplanned,可以直接存为unplanned。

  VISITDY来自TV域

23. --STRF --ENRF

是相对于RFSTDTC RFENDTC定义的Period

--STRF:相对于参考period观测开始。--STRF are "BEFORE", "DURING", "DURING/AFTER", "AFTER", and "U"

--ENRF:相对于参考period观测结束。--ENRF are "BEFORE", "DURING", "DURING/AFTER", "AFTER" and "U"

24. --STRTPT --STTPT --ENRTPT --ENTPT

--STTPT --ENTPT都是某个时间点

BEFORE COINCIDENT ONGOING;

after不是一个有效CT,因为表示在时间点后收集。

25. 流逝时间

 

 

 

--ELTM是计划流失时间,实际流逝时间=--DTC-RFTDTC 

--TPT是一个时间点,--ELTM是描述一段时间。

 26. 使用TPT时,--TPT --TPTNUM成对出现,--TPTREF|VISIT可能出现。

例如只有一个VISIT只有一个评估点,没必要--TPT --TPTREF。

例如只每个VISIT只有一个评估点,所有参考时点都相似,可以只用--TPTREF。

例如当一个试验的数据收集和任何参考时点无关,只是单纯记录第一次、第二次采集等,使用--TPT --TPTNUM;不用--TPTREF

--TPTREF可能和任意VISIT无关,例如居家吃药。--TPTREF是吃药。

否则,一般来讲VISIT --TPTREF --TPT用来唯一识别记录。

当protocol规定了参考干预和评估,使用--TPTREF

 VISIT可以用来只表示PERIOD,--TPTREF具体表示天;

 

 

 

27.  "4-6 hours after dose" or "12 hours +/- 2 hours after dose"

 这种情况,--TPT就是那段文本,--ELTM可以是PT4,这由sponsor决定;

28. Disease Milestone

某个感兴趣的疾病事件或活动发生事件不固定,一旦发生,会启动相应的数据收集程序。

MIDS和--TPTREF类似

RELMIDS和--TPT --RELTM类似

MIDSDTC和--RFTDTC类似

29.  Finding domain中NOT DONE

--ORRES必须为空。--STAT为Not Done

如果一条记录不是收集的,而是衍生的。--DRVFL必须为Y,如果衍生自多个VISIT,sponsor必须指定VISITNUM的值

30. --ORRES --STRESC --STRESN

--ORRES是原始值,也可能来自原始CT值。这样,这三个变量值相同。

--ORRES带有大于小于号,--STRESN为空

如果某个VISIT,所有--TEST都没被测量,直接TESTCD=--ALL,--STAT为Not Done

或者某组TEST都没测,直接TESTCD=--ALL,--STAT为Not Done。

如果某个VISIT内,某个TEST没做,--TEST正常存,--STAT为Not Done。

31. 长度限制

--TEST限制在40字符内,因为TRANSPOSE后,可能会作为某一列的Label;

IETEST TITEST不超200,意味着不能拆分,可以在metadata描述,或在define加个acrf的连接;

其它变量超200字符,前200存DOMAIN中,后面的存SUPP--中:
拆分时注意可读性,拆分后变量名字加数值后缀,拆分后Label不变

如果变量名字正好是8个,则去掉末尾字符,变成数字。

如果一个变量正好是Supplemental变量,则都存SUPP--中,第一个变量不加数字

 

 32. Evaluator

intervention和events不需要,因为不需要评估;当数据是可挂数据时,也不需要评估;

如果有多个评估,primary评估放domain,其余放SUPP--,变量后缀加数字

33. Clinical Significance for finding

加--TESTCD='INTP', 结果是Normal或Abnormal,也可能SUPP--在加--CLSIG表明是否显著

直接在SUPP--加--CLSIG,表明某个TEST是否显著

34. --REASND

general domain中都有,a result in a findings class or an --OCCUR value in an events or interventions variable

一定是非mediacal indication. 否则,一般存--INDC(给药的医学条件), --ADJ

35. 事件类和干预类 --PRESP --OCCUR

这两个domain有两种收集方法,一是自由文本,而是pre-specified list勾选;

 

 36. long-term follow-up 

via telephone calls rather than clinic visits, Regardless of the method of contact

37. Baseline 

-- LOBXFL:  Last non-missing value prior to RFXSTDTC (Operationally derived)

--BLFL:  A baseline defined by the sponsor (Could be derived in the same manner as --LOBXFL or ABLFL, but is not required to be)

posted @ 2022-11-05 11:36  Iving  阅读(415)  评论(0编辑  收藏  举报