2021年6月18日,北京大学大数据国家工程实验室的周晓华教授团队在《中国疾病预防控制中心周报》(China CDC Weekly)上发表了题为《注意临床试验统计分析中的死亡截断:瑞德西韦的教训》的文章
原文标题:《Caution about Truncation-by-death in Clinical Trial Statistical Analysis: A Lesson from Remdesivir》
文章第一作者:北京大学数学科学学院博士生邓宇昊
通讯作者:北京大学大数据分析与应用技术国家工程实验室数据预处理及统计分析中心主任周晓华教授
文章指出,临床试验经常会遇到被死亡截断的问题,即被纳入试验的受试者在其结局被收集到之前死亡。值得注意的是,被死亡截断与删失是完全不同的概念。删失是指受试者确实会发生结局事件,但这一结局被失访所掩盖,而死亡截断则使结局无定义。在这篇文章中,作者回顾了用瑞德西韦治疗COVID-19的两个临床试验,这两个试验都涉及到死亡截断问题,随后作者提供了一些处理死亡截断问题的建议。
首先,瑞德西韦在实验组和对照组表现出了不同的存活率,这可能是实验组和对照组的协变量(如基础疾病)未完全平衡所致的。尽管这两项试验都是随机化的,但随机化并不能保证协变量平衡,在协变量不平衡的情况下,协变量成为了估计治疗效应的混杂因素。如果样本量不够大,则估计值可能离真实值很远。
与治疗不平衡相关的另一个问题是死亡截断,不能排除死亡率与协变量(如基础疾病)有关。死亡截断与删失不同,删失使结局缺失,而死亡截断使结局无定义。例如,当以病情恢复时间为结局,则在恢复前被死亡截断的个体没有结局定义。如果死亡率与基础疾病存在正相关性,则把死亡个体当作在终点处删失的做法低估了真实的治疗效应。处理死亡截断问题,需要使用与处理删失数据不同的统计方法。
事实上,估计治疗效应是一个因果推断问题。在潜在结果模型框架下,可以假想每个个体在每种治疗方案下都有一个潜在结果,然后利用主分层方法,把整个人群划分为四层,其中一层是“永远存活组”,即在任何治疗方案下都能存活的个体。我们只能在这一组中定义因果参数,因为其他组存在无定义的潜在结果。
随后,作者通过模拟实验表明,把死亡当作删失的方法以及存活案例分析方法(无论是否按协变量分层)都会导致有偏的治疗效应估计,而对存活个体按存活概率加权的方法(可以按协变量分层)能得到与真实治疗效应相近的估计。
最后,作者给出了在试验设计阶段的建议,以避免在统计分析中遭遇死亡阶段问题的复杂分析。作者建议,不仅要实施随机化试验,而且要通过不断的再随机化使协变量达到足够平衡。协变量平衡可以降低混杂的影响,在再随机化下,对治疗效应进行推断的统计方法仍然存在。
周晓华
北京大学讲席教授、北京大学大数据分析与应用技术国家工程实验室数据预处理及统计分析中心主任、北京大学生物统计系主任,北京大学国家药品医疗器械监管科学研究院副院长,北京大学北京国际数学研究中心生物统计及生物信息实验室主任,北京大数据研究院中医大数据中心主任。先后担任美国印第安纳大学生物统计助理教授,副教授,美国华盛顿大学生物统计系教授,美国国家阿尔茨海默病协调中心副主任,国际生物统计学会中国分会(IBS-China)理事长,中国现场统计研究会生物医学统计学会会长,美国科学促进会会士(Fellow),美国统计学会会士(Fellow),数理统计研究院会士(Fellow)。美国联邦政府食品和药物管理局(FDA)医疗器械和放射健康顾问委员会委员。荣获美国联邦政府授予的研究生涯科学家奖、中国国家自然科学基金委海外杰青,中国教育部高层次文教专家、中国教育部海外名师等荣誉称号,获美国统计学会贝叶斯分析科学分会及国际贝叶斯统计科学学会Mitchell奖,中国产学研合作创新奖,SCIENCE CHINA-Mathematics评选的年度优秀论文奖。研究方向主要集中于医学诊断学的统计方法,随机临床试验中的设计及统计方法,因果推断分析方法,医疗大数据,缺失数据,新兴传染病的数学和统计建模,脑科学,卫生经济,卫生服务,中医药研究等领域发展新的统计方法,做出了许多重要贡献,在国际顶尖的统计和生物统计期刊J.R.Statist.Soc.B、JASA、Biometrika、Annals of Statistics、Biometrics、Statistics in Medicine等发表SCI学术论文260余篇,其中130余篇是第一或通信作者。先后任生物统计学顶尖期刊Biometrics, Statistics in Medicine, Journal of American Statistical Association - Theory and Method副编辑,也是国际生物统计学会中国分会会刊Biostatistics & Epidemiology主编。
转载本网文章请注明出处