在進(jìn)行分層分析時(shí),所分層的因素一般分為兩類(lèi),包括“混雜因素”和“感興趣因素”。這兩類(lèi)因素雖然都可以作為分層的依據,但因素的來(lái)源及意義完全不同。本文將對這兩類(lèi)分層分析進(jìn)行歸納總結,以供參考。
對體外診斷試劑臨床試驗數據進(jìn)行分析時(shí),一般會(huì )對數據進(jìn)行整體的統計分析,得到總受試人群中試劑的臨床性能。此外,我們還會(huì )根據某些因素將總的受試人群分成若干“層”以進(jìn)行分層分析,表明在具有某一特征人群中的試劑性能,有時(shí)也稱(chēng)其為亞組分析。在進(jìn)行分層分析時(shí),所分層的因素一般分為兩類(lèi),包括“混雜因素”和“感興趣因素”。這兩類(lèi)因素雖然都可以作為分層的依據,但因素的來(lái)源及意義完全不同。本文將對這兩類(lèi)分層分析進(jìn)行歸納總結,以供參考。
一、基于混雜因素的分層分析
在了解基于混雜因素的分層分析之前,首先應了解“混雜因素”的定義?!盎祀s因素”來(lái)源于流行病學(xué),又稱(chēng)干擾因子、干擾變量,是指與研究因素和研究疾病均有關(guān)的因素,若在比較的人群組中分布不勻,可以歪曲(掩蓋或夸大)因素與疾病之間真正聯(lián)系。也就是說(shuō)混雜因素的存在,可以直接導致整體臨床數據出現波動(dòng),使所得到的統計結果無(wú)法反映真實(shí)的臨床性能。因此通常通過(guò)分層分析的方法對混雜因素的每個(gè)分類(lèi)進(jìn)行單獨統計,從而消除該因素各分類(lèi)的之間的比例不平衡對整體性能評價(jià)的影響?;祀s因素一般通過(guò)科研結果、小范圍試驗、文獻檢索、臨床經(jīng)驗等方面獲得。體外診斷試劑臨床試驗中,常見(jiàn)的混雜因素一般包括來(lái)自于受試者年齡、病程、疾病分型、病毒載量、樣本等。
例如,在新型冠狀病毒抗原檢測試劑臨床試驗中,試劑的整體臨床性能并不是很好,即使跟核酸結果去比,性能也不是很理想,同時(shí),各家數據也沒(méi)有可比性。通過(guò)對檢測原理的分析及閱讀文獻,抗原檢測試劑的檢測結果會(huì )受到樣本的病毒載量的影響。病毒載量既與受試者的疾病狀態(tài)相關(guān),同時(shí)也影響著(zhù)檢測結果。因此,我們將病毒載量作為混雜因素,以核酸結果的CT值作為病毒載量的分層依據進(jìn)行分層分析。當進(jìn)行高、低載量分層后,試劑顯示出了與高載量核酸檢測結果很好的一致性,同時(shí)各家數據也顯示出了相同的模式。據此,我們對抗原試劑的預期用途進(jìn)行了合理的限定。
以上這個(gè)例子是在整體臨床性能結果不好的情況下,為了解釋結果所進(jìn)行的混雜因素的分層分析。除此之外,在臨床性能可接受時(shí)也需要進(jìn)行分層分析,使臨床試驗的結果更加穩定。例如,在進(jìn)行新冠抗體檢測試劑臨床性能評價(jià)時(shí)需根據受試者病程進(jìn)行分層分析,其中發(fā)病0至7天為疾病早期,8到14天為疾病的中期,15天以后進(jìn)入疾病的后期。在這個(gè)過(guò)程中,抗體水平會(huì )根據病程呈現相對固定的變化趨勢。IgG抗體的水平會(huì )持續升高,IgM抗體水平會(huì )呈現疾病早期低、中期高、后期逐漸降低的趨勢(如圖A)。我們在對于一個(gè)試劑的臨床試驗數據進(jìn)行審評時(shí)發(fā)現,這個(gè)試劑所展現的抗體水平與所認知的一般性能完全不符,兩種抗體水平均呈現早、晚高,中期低(如圖B)。但這個(gè)試劑整體臨床性能卻相當不錯。這是因為它入組了較多的早期和后期受試者,從而提高了整體臨床性能數據。如果僅進(jìn)行整體入組人群的靈敏度、特異度分析是很難發(fā)現這樣的問(wèn)題的。
從以上兩例子可以看出,進(jìn)行混雜因素的分層分析的目的就是要對試劑的檢測性能以現有的認知進(jìn)行全面、準確的評價(jià)。
二、基于感興趣因素的分層分析
在進(jìn)行體外診斷試劑的臨床性能評價(jià)時(shí),還需要對于臨床實(shí)踐中關(guān)心的特定人群的分析。所感興趣的因素與檢測結果在臨床診療、患者管理中的應用有關(guān)。一般這類(lèi)因素包括年齡、性別、病程、基因型等。這類(lèi)因素在進(jìn)行分析時(shí)通常需要與臨床醫生進(jìn)行充分的溝通,同時(shí)也可以通過(guò)臨床閱讀診療指南、文獻總結得到。
比如對于新冠抗體試劑來(lái)說(shuō),在疫情初期我們就是要準確地找到新發(fā)的新冠患者,因此對于早期病例,也就是發(fā)病后0-7天的患者進(jìn)行單獨的性能分析,以證明試劑在新發(fā)病例中的檢測性能。另外,對于新發(fā)病原體,我們要了解標志物的變化模式。因此在新冠抗體試劑審評要點(diǎn)中要求了納入連續病例,通過(guò)圖示法對標志物檢測結果進(jìn)行展示、分析,了解試劑檢測結果的變化,并將其與該標志物的一般認知以及不同產(chǎn)品間所顯示的變化趨勢進(jìn)行比較和評價(jià)。
有時(shí)所關(guān)心的亞組性能不理想也并不能說(shuō)明試劑在這個(gè)亞組中的性能出現了問(wèn)題,而應該分析具體原因。在一個(gè)基于熒光PCR法的乙型肝炎病毒核酸定量檢測試劑盒的臨床評價(jià)中,針對乙肝病毒的基因型這一感興趣的因素進(jìn)行了分層分析。對于臨床較罕見(jiàn)的乙肝病毒D基因型的核酸定量性能進(jìn)行評價(jià)時(shí)發(fā)現,考核試劑對D基因型的定量水平與對比試劑出現了嚴重的偏差(大于2個(gè)數量級)。經(jīng)過(guò)實(shí)驗室驗證、臨床試驗數據及操作記錄重新核驗后發(fā)現,并不是試劑對于D基因型的定量性能出現了問(wèn)題,而是由于D基因型屬于稀缺的基因型,在臨床試驗中采用了富集研究,針對這部分樣本進(jìn)行了較為集中的檢測。而在試驗操作中此部分檢測由于熒光閾值調整出現了批次間不一致導致。通過(guò)對熒光閾值進(jìn)行標準化標定后,D基因型的定量水平與對比試劑之間不存在顯著(zhù)的差異。同時(shí),也根據臨床試驗中出現的問(wèn)題在說(shuō)明書(shū)中加入了對熒光閾值設定的標準化標定步驟及注意事項內容。
分層分析的本質(zhì)就是對特定的亞組進(jìn)行分析,但亞組需要科學(xué)的設置和選擇。這里面包括為準確評價(jià)試劑檢測性能的基于混雜因素的分層分析,以及為準確評價(jià)試劑臨床應用性能的基于感興趣因素的分層分析。在進(jìn)行試劑的臨床性能評價(jià)時(shí),要將兩種分層分析的方式有機的結合,才能對試劑的臨床性能進(jìn)行全面、準確的評價(jià)。