SDTM - Assumption
1. timing变量可以被加到DOMAIN中,但有些DOMAIN不行
对于三个基本domain,必须有一个timing变量。按ISO8601格式。
2. EPOCH变量基于--DTC,--STDTC,如果样本是持续一段时间,则基于--ENDTC
EPOCH不能被derive,只能assign,根据crf assign。如果时间不能判断EPOCH,则留空。
Interventions or Events , Findings performed before their participation in the study,EPOCH都是空?
计划内访视根据VISITNUM指定EPOCH。计划外访视根据--DTC/--STDTC指定EPOCH,需要和SESTDTC,SEENDTC比较。
2.1 PHASE
PHASE(只出现在TS域,PARAMCD=TPHASE):用于说明临床试验是几期。例如,PHASE III Trial
3. 变量顺序
三类基本domain :Identifiers,Topic, Qualifier, and Timing。具体顺序参考SDTM model。
define中的变量顺序和SDTM数据集中要一致。
4. Req, expected, permissible
Req:识别记录,或使得记录有意义。必须不能为空,包含在SDTM中;
Exp:对记录的补充。可以为空,包含在SDTM中;
Per:可以为空,包含在SDTM中;
即使全为空,如果有必要,也包含在SDTM中。
5. 数据集的拆分
基于--CAT --SCAT。FA基于--OBJ
数据集命名,前两个字母一致。
SUPP--数据集如何拆?
6. Origin
变量是怎么来的,数据是怎么来的。
7. nature key
方便了解数据结构。优先使用收集的。如果用supplenmetal,要QNAM.VAR;
不推荐--TEST --TESTCD包含所有测量信息,应尽可能简单。用其它qualifier变量去存信息。
8. --CD和Label说明
--TESTCD限制8个字符
ARMCD最多20个
ETCD和TSPARMCD限制8个字符,但没有符号限制。
label不超40个字符。
9. 变量注意整个study一致。像type CT format等
10. --前缀
A-Z第一个字母,A-Z 0-9第二个字母。
不适用--前缀的。identifier变量,VISIT变量,DM变量。SUPPQUAL变量等
11. USUBJID and SUBJID
subject就是patient;
USUBJID是用来唯一区分一个人,不能有两个及以上的人有相同USUBJID。
如果一个人参加多个试验,USUBJID相同,SUBJID不同。
12. 文本推荐大写,但一些文本,test等可以首字母大写,方便阅读。来自字典的则和字典一致。
13. 空值
--STAT --REASND
14. grouping variables
14.1
14.2 --CAT --SCAT
一般来说,其值都是在单个DOMAIN中有意义。但:
MHCAT中某个值和AECAT某个值相同
AECAT和FACAT值相同。例如AE某个不良反应,其某个参数存在了FA中
RELREC用来说明收集数据时的复杂关系,例如,吸氧同时测量VS,PR。其--CAT相同,如压力测试。
15. --ID
--GRPID是同一USUBJID内同一DOMAIN内;
--SPID --REFID有时也用做group。
----LNKID是一对多;--LNKGRP是多对一
--CAT和--GRPID不同:
--CAT有CT,实验前已知,across subjects; 不同subject间值一致,例如某个伴随用药;
--GRPID没CT,实验前未知,同一subject内;不同subject间值不一致,如SAE,AETERM不同。
--RESCAT是收集数据后分组;
16. 变量长度
label最长200,变量需要trim,设置成所需要的最大长度。
17. CT值
包含在define中。应该是可读的,而不是编码。
具体放coding哪些变量?
18. topic变量默认按verbatim排序,也就是--TRT --TERM --TESTCD;
19. YN CT值
空值不能被指定为N;像--LOBXFL等只是识别最后一条观测记录,没必要非最后一条记录标记N
YN CT是可扩展的,例如NA U
20. date and time format
对于缺失值,仅一个-代表缺失值,日期间的三个-不能少
例子:
intervel period:
21. study day
以RFSTDTC为参考时间;如果不以RFSTDTC为参考时间,则需要把参考时间存SUPP--中。
22. VISIT VISITNUM
VISIT就是些临床遭遇
VISIT和VISITNUM是一 一maping,按时间排序
VISITDY:
如果VISIT持续大于一天,则VISITDY按开始日期算
对于unplanned visit,VISITNUM不为空,VISITDY为空。因为VISITDY就是按planned算的
VISIT为unplanned,可以直接存为unplanned。
VISITDY来自TV域
23. --STRF --ENRF
是相对于RFSTDTC RFENDTC定义的Period
--STRF:相对于参考period观测开始。--STRF are "BEFORE", "DURING", "DURING/AFTER", "AFTER", and "U"
--ENRF:相对于参考period观测结束。--ENRF are "BEFORE", "DURING", "DURING/AFTER", "AFTER" and "U"
24. --STRTPT --STTPT --ENRTPT --ENTPT
--STTPT --ENTPT都是某个时间点
BEFORE COINCIDENT ONGOING;
after不是一个有效CT,因为表示在时间点后收集。
25. 流逝时间
--ELTM是计划流失时间,实际流逝时间=--DTC-RFTDTC
--TPT是一个时间点,--ELTM是描述一段时间。
26. 使用TPT时,--TPT --TPTNUM成对出现,--TPTREF|VISIT可能出现。
例如只有一个VISIT只有一个评估点,没必要--TPT --TPTREF。
例如只每个VISIT只有一个评估点,所有参考时点都相似,可以只用--TPTREF。
例如当一个试验的数据收集和任何参考时点无关,只是单纯记录第一次、第二次采集等,使用--TPT --TPTNUM;不用--TPTREF
--TPTREF可能和任意VISIT无关,例如居家吃药。--TPTREF是吃药。
否则,一般来讲VISIT --TPTREF --TPT用来唯一识别记录。
当protocol规定了参考干预和评估,使用--TPTREF
VISIT可以用来只表示PERIOD,--TPTREF具体表示天;
27. "4-6 hours after dose" or "12 hours +/- 2 hours after dose"
这种情况,--TPT就是那段文本,--ELTM可以是PT4,这由sponsor决定;
28. Disease Milestone
某个感兴趣的疾病事件或活动发生事件不固定,一旦发生,会启动相应的数据收集程序。
MIDS和--TPTREF类似
RELMIDS和--TPT --RELTM类似
MIDSDTC和--RFTDTC类似
29. Finding domain中NOT DONE
--ORRES必须为空。--STAT为Not Done
如果一条记录不是收集的,而是衍生的。--DRVFL必须为Y,如果衍生自多个VISIT,sponsor必须指定VISITNUM的值
30. --ORRES --STRESC --STRESN
--ORRES是原始值,也可能来自原始CT值。这样,这三个变量值相同。
--ORRES带有大于小于号,--STRESN为空
如果某个VISIT,所有--TEST都没被测量,直接TESTCD=--ALL,--STAT为Not Done
或者某组TEST都没测,直接TESTCD=--ALL,--STAT为Not Done。
如果某个VISIT内,某个TEST没做,--TEST正常存,--STAT为Not Done。
31. 长度限制
--TEST限制在40字符内,因为TRANSPOSE后,可能会作为某一列的Label;
IETEST TITEST不超200,意味着不能拆分,可以在metadata描述,或在define加个acrf的连接;
其它变量超200字符,前200存DOMAIN中,后面的存SUPP--中:
拆分时注意可读性,拆分后变量名字加数值后缀,拆分后Label不变
如果变量名字正好是8个,则去掉末尾字符,变成数字。
如果一个变量正好是Supplemental变量,则都存SUPP--中,第一个变量不加数字
32. Evaluator
intervention和events不需要,因为不需要评估;当数据是可挂数据时,也不需要评估;
如果有多个评估,primary评估放domain,其余放SUPP--,变量后缀加数字
33. Clinical Significance for finding
加--TESTCD='INTP', 结果是Normal或Abnormal,也可能SUPP--在加--CLSIG表明是否显著
直接在SUPP--加--CLSIG,表明某个TEST是否显著
34. --REASND
general domain中都有,a result in a findings class or an --OCCUR value in an events or interventions variable
一定是非mediacal indication. 否则,一般存--INDC(给药的医学条件), --ADJ
35. 事件类和干预类 --PRESP --OCCUR
这两个domain有两种收集方法,一是自由文本,而是pre-specified list勾选;
36. long-term follow-up
via telephone calls rather than clinic visits, Regardless of the method of contact
37. Baseline
-- LOBXFL: Last non-missing value prior to RFXSTDTC (Operationally derived)
--BLFL: A baseline defined by the sponsor (Could be derived in the same manner as --LOBXFL or ABLFL, but is not required to be)
本文来自博客园,作者:Iving,转载请注明原文链接:https://www.cnblogs.com/SAS-T/p/16845288.html