发布时间:2023-11-08 11:50:08作者:李宾来源:医药经济报
10月30日,国家药品监督管理局药品审评中心(CDE)颁布了关于《药物临床试验样本量估计指导原则(征求意见稿)》(以下简称“指导原则”)公开征求意见的通知。虽然为征求意见稿,但统计专家已经从“对样本量估算的影响因素、样本量调整和试验实施过程中的考虑”等方面对药物临床试验样本量的估算给出了指导性意见。在相关部门的不断努力下,我国的临床研究越来越规范,也越来越有章可循。
本次指导原则融入了ICH E9 R1中的一些新概念和方法。例如,针对伴发事件可以采取的五种策略,包括疗法策略、在治策略、复合变量策略、假想策略、主层策略对样本量估算的影响。指导原则指出了主要估计目标和关键次要估计目标在样本量估算中的作用,同时明确了什么是关键次要估计目标。所采用的术语也与ICH E9 R1一致,让人耳目一新。
样本量计算适用范围
样本量计算的本质是一种估算,这意味着样本量计算有很大的不确定性。其计算方法虽然已经很成熟,但所有的方法都基于一些假设,这些假设不一定都有可靠的基础。采用计算后得到的样本量,并不能保证临床研究的成功。很多临床研究人员将样本量的计算看得太“神圣”,如果一项研究没有经过统计专家计算样本量,会被认为缺乏依据,其实这是不准确的。
在临床研究中,药理研究、探索性研究都不需要进行样本量计算。对于单臂临床研究,CDE在2020年12月3日颁布了《单臂试验支持上市的抗肿瘤药进入关键试验前临床方面沟通交流技术指导原则》,对不同产品的关键性研究的样本量给出了建议,其样本量也不是通过计算得到的。在该指导原则中,也有鉴于对产品安全性的考虑,对最低暴露例数的要求。
事实上,样本量的计算主要用于关键性的随机对照研究。
常用计算方法举隅
样本量可用公式进行计算,也可将公式做入EXCEL表中,简便地计算出结果。但由于EXCEL表对于t分布的t值(=TINV)没有自动调节自由度的功能,所以在初步计算得到样本量以后,需要返回将结果代入自由度中,获得新的t值。在新的t值下,再计算出新的样本量。这样反复几次,就可以得到比较精确的样本量计算值。
现在各种统计软件已经非常发达。常用的计算样本量的软件是PASS。SAS也有估算样本量的功能,但PASS更为简便,不但可以计算两组人数相等的样本量,也可以计算出两组分布不等、成一定比例的样本量。下面简单介绍PASS的使用方法。
用PASS估计样本量,主要应用在优效性试验和非劣效试验中。优效性试验和非劣效性试验又主要分为率的比较、方差的比较和生存时间的比较三种。只要代入相应的参数,就可以获得估算的样本量。
优效性试验
对于率的优效性试验,一般α取0.05,把握度取0.8或0.9,相应的β为0.2和0.1。根据指导原则,把握度可以取0.8,但临床研究中,很多人倾向于取0.9,这样更有把握得出有统计学差异的结果。同时需要提供对照组的有效率和试验组估计的有效率。对照组的有效率可以从Meta分析或既往临床研究中获得,试验组估计的有效率可以从早期临床研究中获得。以此代入软件中运行,得到估计的样本量。
对于均值的优效性检验,α和β取值相同,需要对照组在既往临床研究中的均值和方差,这些数据可以通过Meta分析计算得到。试验组的均值和方差可以来自早期的研究,也有将方差估计为与对照组一样的值。
对于生存分析的优效性试验,α和β取值与上述情况相同,同时需要试验组的中位生存时间,并估计试验组的入组时间、研究持续时间等参数。
所以,从样本量的计算过程可以看出,样本量计算的结果是基于一些不确定的因素。
非劣效研究
非劣效研究计算方法也类似。只是由于非劣效研究属于单侧的研究,α值取0.025。同时需要确定非劣效界值,即试验组和对照组的差异。非劣效界值的确定可以参照CDE于2020年7月24日颁发的《药物临床试验非劣效性设计指导原则》。
样本量大小需平衡
如前所述,样本量的计算仅仅是一种估计。申办方开展临床研究,一方面希望临床研究能够得到有统计学差异的临床研究结果,另一方面又不希望样本量太大,造成临床研究的花费过高。
所以,一些决策者常常将压力转嫁给统计专家。由于样本量计算结果是由一些参数决定的,参数值的不同,计算得到的样本量就不同。例如,α值是比较固定的,双侧研究是0.05,单侧研究是0.025,这是不能变的。但β可以取0.1,也可以取0.2。取0.1时计算得到的样本量就大,取0.2则计算得到的样本量就小。
对于非劣效研究而言,非劣效界值的取值也会显著改变样本量的大小。根据《药物临床试验非劣效性设计指导原则》,非劣效界值的取值没有特别的规定,在安慰剂和对照组的疗效之间即可。但在临床研究的实际操作上,常确定为10%~20%。取10%时计算得到的样本量较大,取20%则计算得到的样本量就小一些。
国内统计专家往往对非劣效界值的取值要求比较严格。但临床上患者千差万别,如果非劣效界值取值过小,在样本量已经很大的情况下,也可能得到假阴性的结果。所以申办方在关键性研究开始前,一定要与CDE进行良好的沟通,确定相对合理的非劣效界值。
在关键性研究中,申办方也往往采用N∶1的设计,即试验组的人数是对照组的几倍。这种方法可以保证试验组较多的人数,有利于安全性的评估,但这种做法也会增加一定的风险。因为对照组人数较少,有效率的潜在变化就较大。如果由于抽样误差导致得到一个特别高的有效率,则对试验药相当不利;如果同时非劣效界值也定得比较小,风险就更大了。
总而言之,样本量的计算只是一个估计,研究的成败取决于研究的结果。申办方不可为了节省研究成本,而将临床研究置于风险之中。
此内容为《医药经济报》融媒体平台原创。未经《医药经济报》授权,不得以任何方式加以使用, 包括转载、摘编、复制或建立镜像。如需获得授权请事前主动联系:020-37886610或020-37886753;yyjjb@21cn.com。
粤ICP备17121623号 国内统一刊号:CN44-0098 邮发代号:45-18 广告热线:020-37886663 订报热线:020-37886650
Copyright www.yyjjb.com.cn All Rights Reserved
医药经济报公众号
肿瘤学术号免疫时间
医药经济报头条号