CDISC SDTM IG 学习笔记 学习心得: SDTM 数据集与一般数据集的区别: 1. 数据集个数不同 按照数据变量的不同来源分为不同的域,而一般的临床试验只有一个或少量几个数据集。 也就是数据不是按照在CRF 表中的位置来收集的,而是按不同topic。 2. 个人记录与事件记录 一般数据集每个人一条记录,SDTM 数据集每个人的每个事件、每次用药或每次不良反应一条记录。变量的数量减少,记录的条数增多。也就意味着每个受试者每次访视每个时间点可能有许多条观测记录。 3. 由于变量之间存在关联,所以 SDTM 有关联数据集 4. CDISC 的重点是如何确定记录的唯一性,比如多阶段多时间多剂量的试验,就需要有三个变量来区别。 5. 元数据:关于数据的数据,按照一定的标准,从信息资源中抽取出相应的特征,组成一个特征元素集合。包括描述一个具体对象所需要的数据项集合、各项数据语义定义、规则和语法定义。元数据标准的制定为提高数据库建库质量,使诗句加工达到规范化、标准化,促进科学数据标准化,加强数据交流。 6. 作用:变量名标准化,变量取值标准化 7. 并不是所有的域和变量都要使用,根据研究内容来选择 This model describes the contents and structure of data collected during a clinical trial The purpose is to provide regulatory authority reviewers (FDA) a clear description of the structure, attributes and contents of each dataset and variables submitted as part of a product application 1 . 域 1.1 定义:一组具有共同主题并在逻辑上相关的观测结果集合。A domain is defined as a collection of observations that share a common topic. 每个域采用唯一的两字符(英文缩写)代码加以区别,如不良时间域(AE, Adverse Event) 域是SDTM 的核心,所有变量按不同的来源被分类到相关的域。比如下图中展示提交的SAS 数据集。CM(concomitant and prior medication)伴随用药域、DA(Drug Accountability)药物发放回收记录域和 DM(DEMOGRAPHICS)人口学资料域等。 域名和变量名是固定不能变的。在所有域中使用SDTM 规定的变量标签 研究中只需提交实际采集的域,具体采集哪些数据由研究内容决定,而不是基于 SDTM。 扩展内容:如果现有的域不能满足要求,可以创建自定义域(相关内容未包括) 1.2 ...