附件:真實(shí)世界數據用于醫療器械臨床評價(jià)技術(shù)指導原則(征求意見(jiàn)稿)
為有效解決影響和制約醫療器械創(chuàng )新、質(zhì)量、效率的突出性問(wèn)題,加快實(shí)現醫療器械治理體系和治理能力現代化,立足我國監管工作實(shí)際,圍繞審評審批制度改革創(chuàng )新,國家藥品監督管理局啟動(dòng)中國藥品監管科學(xué)行動(dòng)計劃?;谛袆?dòng)計劃首批項目“真實(shí)世界數據用于醫療器械臨床評價(jià)的方法學(xué)研究”的研究成果,制定本指導原則。
本指導原則旨在初步規范和合理引導真實(shí)世界數據在醫療器械臨床評價(jià)中的應用,為申請人使用醫療器械真實(shí)世界數據申報注冊以及監管部門(mén)對該類(lèi)臨床數據的審評提供技術(shù)指導。
本指導原則是供申請人和審查人員使用的技術(shù)指導文件,不涉及注冊審批等行政事項,亦不作為法規強制執行,如有能夠滿(mǎn)足法規要求的其他方法,也可采用,應在遵循相關(guān)法規的前提下使用本指導原則。本指導原則基于現有科學(xué)發(fā)展和認知水平制定,隨著(zhù)真實(shí)世界數據研究的發(fā)展、提高和相關(guān)法規政策、標準制定等情況的變化,本指導原則還會(huì )不斷地完善和修訂。
一、概述
(一)真實(shí)世界數據與證據
本指導原則所述真實(shí)世界數據是指來(lái)自現實(shí)醫療環(huán)境的、傳統臨床試驗以外的數據,反映實(shí)際診療中患者健康狀況和醫療服務(wù)過(guò)程。
圍繞相關(guān)科學(xué)問(wèn)題,綜合運用流行病學(xué)、生物統計學(xué)、循證醫學(xué)等多學(xué)科方法技術(shù),利用真實(shí)世界數據開(kāi)展的研究統稱(chēng)為真實(shí)世界研究。它通過(guò)對臨床常規產(chǎn)生的真實(shí)世界數據進(jìn)行系統性收集,并在預先設定的研究假設下,運用合理的流行病學(xué)設計和統計分析方法,可為前瞻或回顧性研究,與傳統臨床試驗互為補充。信息技術(shù)支持的臨床實(shí)踐所產(chǎn)生的大量臨床數據為進(jìn)行真實(shí)世界研究奠定了基礎。
真實(shí)世界證據指的是,通過(guò)分析真實(shí)世界數據,形成產(chǎn)品使用、潛在風(fēng)險/收益相關(guān)的臨床證據。但是,由于真實(shí)世界數據來(lái)源和類(lèi)型不同,數據質(zhì)量和涵蓋的信息差異較大,并非所有的真實(shí)世界數據都適用于支持醫療器械臨床評價(jià)。在符合要求的前提下,基于真實(shí)世界數據形成的真實(shí)世界證據可顯示醫療器械在全生命周期的風(fēng)險獲益特征,可能構成有效科學(xué)證據并用于監管決策。
(二)真實(shí)世界研究的優(yōu)勢與局限性
相比于傳統臨床試驗,真實(shí)世界研究是在現實(shí)的健康醫療環(huán)境下開(kāi)展,對納入患者病情限定更少,覆蓋人群更廣,樣本量可能較大,研究結果的外推性可能較好。真實(shí)世界研究強調綜合利用多種數據,如醫院電子病歷、登記數據、區域健康醫療數據、醫療保險數據等,使獲得長(cháng)期臨床結局數據成為可能。真實(shí)世界研究還可用于觀(guān)察罕見(jiàn)嚴重不良事件,回答罕見(jiàn)疾病的相關(guān)問(wèn)題,評價(jià)臨床結局在不同人群之間的差異。
真實(shí)世界研究的局限性來(lái)自?xún)煞矫?。第一,真?shí)世界數據來(lái)源眾多,在數據收集、存儲過(guò)程中,常會(huì )出現測量/分類(lèi)錯誤或數據缺失等情況;數據未實(shí)現結構化,數據質(zhì)量有待評價(jià);不同數據源之間的鏈接存在挑戰。第二,基于真實(shí)世界數據開(kāi)展的研究通常存在多種偏倚和混雜,研究結果在實(shí)現因果推斷方面存在較大挑戰。
常見(jiàn)的真實(shí)世界數據來(lái)源包括登記數據庫、醫院電子病歷、區域健康醫療數據、醫保數據、健康檔案、常規公共監測數據、患者自報數據(包括居家環(huán)境)、其它健康檢測(如移動(dòng)設備)產(chǎn)生的數據等。適用于醫療器械的真實(shí)世界數據除上述情形外,還可包括在醫療器械生命周期中生產(chǎn)、銷(xiāo)售、運輸、存儲、安裝、使用、維護、退役、處置等過(guò)程中產(chǎn)生的數據(如驗收報告、維修報告、使用者反饋、使用環(huán)境、校準記錄、運行日志、影像原始數據等)。
從特定器械臨床評價(jià)的角度出發(fā),上述數據來(lái)源按數據形成時(shí)間與研究開(kāi)展時(shí)間的關(guān)系,可分為兩大類(lèi)。第一大類(lèi)是既有的數據資源,即在開(kāi)展當前研究時(shí),數據資源已經(jīng)存在。根據數據產(chǎn)生過(guò)程的差異,該類(lèi)數據資源又分為兩種情況:
(一)產(chǎn)生于醫療服務(wù)的提供和付費過(guò)程,基于管理目的生成,如醫院電子病歷數據、醫保數據、健康檔案等。
(二)基于數據庫建立時(shí)的研究目的,設立統一的數據標準和數據收集模式,在常規健康醫療環(huán)境下形成并建立的數據資源,如登記數據、基于實(shí)效性臨床試驗形成的數據庫。
第二大類(lèi)是以特定器械的臨床評價(jià)為目的,設立明確的數據標準和數據收集模式,在常規健康醫療環(huán)境下形成的數據資源。典型數據包括以器械為對象產(chǎn)生的登記數據、實(shí)效性臨床試驗數據等。
真實(shí)世界數據質(zhì)量直接影響真實(shí)世界研究結果的證據強度。真實(shí)世界數據的質(zhì)量評價(jià)是開(kāi)展真實(shí)世界研究的基礎,需建立和實(shí)施相應的質(zhì)量保障和評估措施。真實(shí)世界數據質(zhì)量評價(jià),需綜合考慮源數據質(zhì)量以及研究過(guò)程的質(zhì)量控制。
使用既有數據資源的數據進(jìn)行臨床評價(jià)時(shí),需針對具體研究問(wèn)題,評估既有數據是否涵蓋研究所需人群、關(guān)鍵變量及隨訪(fǎng)時(shí)長(cháng),是否能獲得醫療器械識別信息、使用信息等,以及這些變量的準確性及完整性。其次,需基于具體的研究設計對既有數據進(jìn)行規范化的清理及提取,形成真實(shí)世界研究數據集。
對于主動(dòng)收集數據的情形,首先需考慮研究設計的科學(xué)性和可行性。真實(shí)世界研究的納入和排除標準通常較為寬泛,需保證核心隨訪(fǎng)時(shí)間點(diǎn)的隨訪(fǎng)質(zhì)量。其次,需確保數據的真實(shí)性、準確性、可追溯性,建立系統的隨訪(fǎng)規范,對研究人員進(jìn)行培訓與監管。需在研究開(kāi)始前充分識別可能的研究偏倚和混雜因素,并在制定研究計劃和編制病例報告表時(shí)包含相關(guān)混雜因素的測量和記錄,并在數據分析階段采用分層分析、多因素分析以及傾向性評分等統計方法來(lái)控制、校正這些混雜因素造成的影響。
評價(jià)數據管理的規范性,可從管理流程、人員、信息系統、數據標準化等方面進(jìn)行全面考慮。關(guān)于數據標準化,需有標準化的文檔格式及數據結構,使用標準化的變量字典等。
評價(jià)數據質(zhì)量,需考慮數據的相關(guān)性和可靠性。數據的相關(guān)性主要考慮其是否可充分回答與研究目的相關(guān)的臨床問(wèn)題,個(gè)體水平特定結局變量的充分性,并從回答臨床問(wèn)題的角度對各相關(guān)變量進(jìn)行評估。在數據的可靠性方面,需重點(diǎn)考慮數據采集的準確性,包括在采集前確定采集范圍、采集變量,制定數據詞典、規定采集方式(如數據提取表)等,以確保誤差最小化,并充分保障數據的真實(shí)性和完整性等。
從醫療器械臨床評價(jià)角度,當真實(shí)世界數據用于醫療器械臨床評價(jià)的具體研究時(shí),應基于具體研究目的,進(jìn)行研究的總體策劃和設計。研究總體策劃包括明確研究問(wèn)題、確定數據來(lái)源、確定數據的生成方式或者數據的清洗及提取規范以及組建研究團隊等。研究總體設計包括確定設計類(lèi)型、明確研究對象和研究變量、識別混雜及偏倚的來(lái)源并進(jìn)行合理控制以及制定統計分析計劃等步驟。在策劃、設計及實(shí)施真實(shí)世界研究的過(guò)程中,倫理與數據安全問(wèn)題亦需得到充分的重視。
無(wú)論選擇何種真實(shí)世界數據,需注意的是真實(shí)世界研究存在的偏倚。這些偏倚可能限制了研究結果在因果關(guān)系上的推斷和解讀。為盡量減少潛在的偏倚,研究者需要在研究的策劃、設計、實(shí)施以及分析階段進(jìn)行識別,并預先制定相應措施,在獲取及分析數據前謹慎而周密的形成研究方案及分析計劃。申請人可以根據數據與研究問(wèn)題的匹配程度,選擇不同的研究設計,必要時(shí)也可以同時(shí)選擇多種研究設計。
真實(shí)世界研究設計類(lèi)型主要分為實(shí)效性試驗研究設計和觀(guān)察性研究設計及其他設計。
1.實(shí)效性試驗
在實(shí)效性試驗中,以實(shí)效性隨機對照試驗(pRCT)為代表的干預性研究是重要組成部分。實(shí)效性隨機對照試驗,又稱(chēng)為實(shí)用性隨機對照試驗,是指在真實(shí)或接近真實(shí)的臨床醫療環(huán)境下,采用隨機、對照的設計比較臨床實(shí)踐中不同干預措施的治療效果。與傳統隨機對照試驗不同,pRCT通常是在實(shí)際臨床醫療環(huán)境中開(kāi)展,研究對象可能存在多種合并癥,干預過(guò)程與臨床醫療實(shí)踐保持較好一致,但同時(shí)受干預者技巧和經(jīng)驗的影響等。因此,在研究策劃和設計上需要多方考慮。
依據隨機分組單元選擇的不同,實(shí)效性隨機對照試驗可包括:
(1)個(gè)體隨機實(shí)效性對照試驗,即以個(gè)體作為隨機分組單位進(jìn)行干預和觀(guān)測。對于器械臨床評價(jià)而言,通常隨機單元是患者個(gè)體。
(2)整群隨機實(shí)效性對照試驗,指以群組(如醫院、診所、小區或學(xué)校等)作為干預單元,在分析此類(lèi)研究設計的數據時(shí),除考慮群組效應外,也應以個(gè)體為單位進(jìn)行效應評價(jià)。
(3) 階梯楔形隨機對照試驗,是一種特殊的群組隨機對照試驗,群組在不同的開(kāi)始時(shí)間(階梯式的)被隨機分配接受干預措施。
pRCT中的結局指標需根據研究的具體目的選擇,可包括安全性、有效性、治療依從性、衛生經(jīng)濟等方面。結局指標通常選擇對患者(或研究結果的運用者)有重要臨床意義的指標,一般不采用生物學(xué)或影像學(xué)等中間指標。在干預措施無(wú)法做到盲法時(shí),建議選擇不易因干預分配開(kāi)放而受影響的結局指標如腦卒中、腫瘤大小等。通常情況下,應根據具體的研究設計進(jìn)行樣本量的計算。
pRCT通常選用常規治療、標準治療或公認有效的治療措施作為對照,一般不采用安慰效應為對照。因注重評價(jià)遠期結局,pRCT一般需進(jìn)行結局的多時(shí)點(diǎn)測量,隨訪(fǎng)時(shí)間較長(cháng),隨訪(fǎng)頻率常低于常規隨機對照試驗。
pRCT主要關(guān)注干預措施在實(shí)際臨床環(huán)境下的效果,但研究場(chǎng)所和環(huán)境仍需結合疾病特征和臨床實(shí)際來(lái)判斷,其研究對象應盡可能反應真實(shí)診療中應用研究干預措施的患者群體。
2.觀(guān)察性研究
基于真實(shí)世界數據開(kāi)展觀(guān)察性研究時(shí),不同來(lái)源的數據質(zhì)量不同,暴露與結局的測量可能與研究本身的定義存在不一致,治療分配通常根據醫生的判斷,而非隨機分配,如何識別和控制可能的混雜和偏倚,是觀(guān)察性研究在設計和分析階段的重要考量。如設計時(shí)不進(jìn)行全面考慮,將引入較高的偏倚,限制因果推斷。當擬用真實(shí)世界觀(guān)察性研究確認暴露與結局的因果關(guān)系時(shí),建議對研究的關(guān)鍵要素與環(huán)節進(jìn)行審慎思考,根據研究目的事先制定研究計劃以及統計分析計劃。
在設計真實(shí)世界觀(guān)察性研究時(shí),首先應確定研究目的,提出在醫療器械臨床評價(jià)中擬解決的問(wèn)題,并闡明研究假設。建立研究假設時(shí),建議重點(diǎn)考慮構建研究問(wèn)題的關(guān)鍵要素,即P(Population, 人群)、I(Intervention, 干預)、C(Control, 對照)、O(Outcome, 結局)、T(Timing, 時(shí)間)是否可基于真實(shí)世界數據產(chǎn)生,包括真實(shí)世界數據中是否可提取出滿(mǎn)足要求的研究人群數據,是否能形成相對統一或標化的干預方案,是否可設置可比的對照,是否包含研究所需的結局評價(jià)指標及測量結果。
觀(guān)察性研究包括隊列研究(前瞻性、回顧性與雙向隊列)、病例-對照研究及衍生設計(如巢式病例-對照研究)、自身對照的病例系列等設計類(lèi)型。申請人可根據研究目的以及可獲得的真實(shí)世界數據特征,選擇恰當的研究設計,也可以同時(shí)選擇多種研究設計。申請者需要對整個(gè)過(guò)程當中存在的可能的偏倚進(jìn)行全面識別(如選擇偏倚、測量偏倚等),并建立有效的措施盡可能控制措施。
3. 其他設計類(lèi)型
采用真實(shí)世界數據作為外部對照的單組試驗設計,是形成臨床證據的一種設計類(lèi)型。其中,歷史對照因臨床實(shí)踐的差異性、隨訪(fǎng)時(shí)間的變化性,以及診斷和結局測量標準缺乏一致性等原因,通??杀刃暂^差。選擇同期對照而非歷史對照,收集研究相關(guān)變量的詳細、準確信息,是改善這些局限的有效方法。
在真實(shí)世界研究中,研究者需要根據研究目的、數據類(lèi)型以及研究設計類(lèi)型酌情應用合理的統計學(xué)方法,常見(jiàn)的統計分析方法見(jiàn)附錄2。
真實(shí)世界研究中常見(jiàn)的研究設計主要包括試驗性研究及觀(guān)察性研究?jì)纱箢?lèi)型。其中,試驗性研究中具有代表性的為實(shí)效性隨機對照試驗(pRCT),融合了隨機化和真實(shí)世界數據的優(yōu)勢,可相對較好地控制混雜和偏倚的影響。這類(lèi)研究中的統計分析方法與傳統臨床試驗沒(méi)有本質(zhì)差別,其統計分析計劃包括數據集定義、分析原則與策略、缺失數據處理、分析指標與分析方法、亞組或分層分析、敏感性分析、補充分析和結果報告等方面。統計分析的基本原則亦為意向性治療分析原則。常用的分析方法包括參數檢驗、非參數檢驗、分層分析、回歸分析等多種方法。
基于真實(shí)世界數據的觀(guān)察性研究由于更容易產(chǎn)生混雜和偏倚,數據分析的關(guān)鍵是采用統計分析技術(shù)對最大限度的控制混雜因素造成的偏倚。在真實(shí)世界數據的觀(guān)察性研究中,同樣推薦在統計分析之前預先制定統計分析計劃,以降低研究結果為假陽(yáng)性的概率。常用的分析方法除傳統的分層分析、多變量分析方法外,還包括傾向性評分等方法。
基于真實(shí)世界數據形成的真實(shí)世界證據可支持醫療器械全生命周期臨床評價(jià),涵蓋上市前臨床評價(jià)及上市后臨床評價(jià)。真實(shí)世界證據用于醫療器械臨床評價(jià)的常見(jiàn)情形如下:
(一)在同品種臨床評價(jià)路徑中提供臨床證據
同品種臨床評價(jià)路徑是基于同品種醫療器械的臨床數據開(kāi)展臨床評價(jià),需要的臨床數據包括同品種產(chǎn)品的臨床數據和/或申報產(chǎn)品的臨床數據。
對于同品種產(chǎn)品的臨床數據,真實(shí)世界數據是其重要來(lái)源,其有助于確認產(chǎn)品在現實(shí)醫療環(huán)境中的安全有效性,識別產(chǎn)品的潛在風(fēng)險(如罕見(jiàn)的嚴重不良事件),甚至通過(guò)獲知同類(lèi)產(chǎn)品在不同人群中的實(shí)際療效,明確最佳使用人群;通過(guò)知曉同類(lèi)產(chǎn)品的行業(yè)水平,為申報產(chǎn)品的上市前風(fēng)險/收益評價(jià)提供信息。合法獲得的申報產(chǎn)品真實(shí)世界數據,可用于確認申報產(chǎn)品與同品種器械間的差異,不對申報產(chǎn)品的安全性有效性產(chǎn)生不利影響。
(二)用于支持產(chǎn)品注冊,作為已有證據的補充
由于全球法規尚待進(jìn)一步協(xié)調以及受產(chǎn)品上市策略等因素影響,多數醫療器械尚未實(shí)現全球同步上市。注冊申請人可綜合考慮產(chǎn)品設計特點(diǎn)及適用范圍,已有的臨床數據,各監管區域對于臨床證據要求的差異等情況,在已上市監管區域收集真實(shí)世界數據并形成真實(shí)世界證據,支持在中國的注冊申報,以避免在中國境內額外開(kāi)展臨床試驗。
(三)臨床急需進(jìn)口器械在國內特許使用中產(chǎn)生的真實(shí)世界數據,可用于支持產(chǎn)品注冊,作為已有證據的補充
根據國家統一部署,在部分區域指定醫療機構內,特許使用臨床急需且在我國尚無(wú)同品種產(chǎn)品獲準注冊的醫療器械,按照相關(guān)管理制度和臨床技術(shù)規范使用產(chǎn)生的真實(shí)世界數據,經(jīng)過(guò)嚴格的數據采集和系統處理、科學(xué)的統計分析以及多維度的結果評價(jià),可用于支持產(chǎn)品注冊,作為已有證據的補充。特別是通過(guò)境外臨床試驗進(jìn)行臨床評價(jià),有證據表明/提示將境外臨床試驗數據外推至中國人群可能受到境內外差異的影響時(shí),可考慮使用該類(lèi)數據進(jìn)行橋接研究。
(四)作為單組試驗的外部對照
在單組臨床試驗設計中,可從質(zhì)量可控的真實(shí)世界數據庫中提取與試驗組具有可比性的病例及其臨床數據,作為外部對照。外部對照通常來(lái)源于具有良好質(zhì)量管理體系的登記數據庫,其可接受申辦者和監管方等的評估,以確認其數據的相關(guān)性和可靠性。建議采用同期外部對照,如使用歷史數據進(jìn)行對照,將因為時(shí)間差異引入多種偏倚,降低臨床試驗的證據強度。
(五)為單組目標值的構建提供臨床數據
目標值是專(zhuān)業(yè)領(lǐng)域內公認的某類(lèi)醫療器械有效性/安全性評價(jià)指標所應達到的最低標準,包括客觀(guān)性能標準和性能目標,是在既往臨床數據的基礎上分析得出,用于試驗器械主要評價(jià)指標的比較和評價(jià)。真實(shí)世界數據可作為構建或更新目標值的數據來(lái)源。
(六)支持適用范圍和適應癥的修改
醫療器械上市后,基于所在監管區域的相關(guān)法規,在合法使用的前提下,獲得的真實(shí)世界數據可用于支持適用范圍和適應癥的修改??赡艿那樾伟ㄔ诤戏ㄊ褂眠^(guò)程中發(fā)現額外的療效,或者某些境外監管區域法規許可的批準范圍外使用等。
(七)支持在說(shuō)明書(shū)中修改臨床聲稱(chēng)
醫療器械上市后的真實(shí)世界證據,可用于支持修改說(shuō)明書(shū)中的臨床聲稱(chēng)。例如,對于測量、計算患者生理參數和功能指標的醫療器械,部分生理參數和功能指標在上市前評價(jià)時(shí)主要關(guān)注窮測量和計算的準確性,未充分發(fā)掘其臨床價(jià)值。真實(shí)世界數據可用于構建生理參數和功能指標、或者基于其做出的臨床治療決定,與臨床結局之間的因果推斷,從而修改說(shuō)明書(shū)中產(chǎn)品的臨床聲稱(chēng)。
(八)支持附帶條件批準產(chǎn)品的上市后研究
對用于治療罕見(jiàn)病、嚴重危及生命且尚無(wú)有效治療手段的疾病和應對公共衛生事件等急需的醫療器械,附帶條件批準上市后,可利用真實(shí)世界數據開(kāi)展上市后研究,以支持注冊證載明事項的完成。
(九)用于高風(fēng)險植入物等醫療器械的遠期安全有效性評價(jià)
高風(fēng)險植入物等醫療器械,特別是市場(chǎng)上首次出現的高風(fēng)險植入物,在上市前臨床評價(jià)中,難以確認產(chǎn)品的遠期療效和風(fēng)險,識別罕見(jiàn)嚴重不良事件??衫谜鎸?shí)世界數據進(jìn)行該類(lèi)產(chǎn)品的上市后研究,確認產(chǎn)品的遠期安全有效性,完成產(chǎn)品的全生命周期臨床評價(jià)。
(十)用于治療罕見(jiàn)病的醫療器械全生命周期臨床評價(jià),加快其上市進(jìn)程,滿(mǎn)足患者需求
真實(shí)世界數據可在多維度支持治療罕見(jiàn)病的醫療器械快速上市。如擬開(kāi)展上市前臨床試驗,真實(shí)世界數據可作為單組試驗的外部對照,或者用于構建目標值;附帶條件批準后,真實(shí)世界數據可用于確認產(chǎn)品的有效性,識別產(chǎn)品風(fēng)險,進(jìn)行產(chǎn)品風(fēng)險/收益的再評價(jià)。
(十一)上市后監測
產(chǎn)品的上市后監測,涉及不良事件監測、產(chǎn)品安全有效性再評價(jià)等方面,是醫療器械全生命周期臨床評價(jià)的重要組成部分。真實(shí)世界數據在上市后監測中應當發(fā)揮重要作用,如通過(guò)收集、提取風(fēng)險信號,開(kāi)展不良事件歸因分析,及時(shí)發(fā)現和控制已上市醫療器械的使用風(fēng)險,分析同時(shí)促進(jìn)生產(chǎn)企業(yè)對已上市產(chǎn)品的設計改進(jìn),推動(dòng)新產(chǎn)品研發(fā)。
附錄1:常見(jiàn)的統計分析方法
一、實(shí)效性隨機對照試驗的統計方法
實(shí)效性隨機對照試驗(pRCT)統計分析思想與傳統隨機對照試驗的統計分析思想類(lèi)似,包括需按照統計分析計劃執行,比如考慮調整協(xié)變量、控制中心效應和群組效應構建統計模型、亞組分析、敏感性分析等。不同的是,pRCT由于在實(shí)際臨床醫療環(huán)境中開(kāi)展,患者接受干預的標準化程度降低,依從性也可能低于傳統試驗環(huán)境,同時(shí)失訪(fǎng)可能增加。意向性分析是常用的分析方法,但應重視對患者失訪(fǎng)的結局處理,需要預先明確失訪(fǎng)患者的處理辦法并說(shuō)明原因。相比傳統隨機對照試驗,pRCT的研究結果更容易趨向于無(wú)效假設。因此,在設計非劣效試驗時(shí)應謹慎使用pRCT的設計。
此外,由于pRCT在隨機后可能根據個(gè)體差異或臨床專(zhuān)業(yè)人員的選擇,患者接受的干預會(huì )發(fā)生變化,從而產(chǎn)生新的混雜(常稱(chēng)為隨機后混雜),這些情況需進(jìn)行協(xié)變量的調整。常采用相應的統計學(xué)模型進(jìn)行調整,如多重線(xiàn)性回歸、Logistic 回歸、Cox 回歸、Poisson 回歸等。由于pRCT可能會(huì )來(lái)自于多個(gè)中心,需要對中心效應進(jìn)行控制,當主要結局變量是連續性指標時(shí),可采用協(xié)方差分析方法;當主要結局變量是分類(lèi)指標時(shí),可采用考慮中心效應的Cochran-Mantel-Haenszel方法;當有其他協(xié)變量需要考慮時(shí),可采用隨機效應模型。
對于個(gè)體pRCT無(wú)需考慮群組效應,而群組隨機對照試驗(cRCT)和階梯楔形隨機對照試驗(swRCT),由于干預、隨機分配單位為群組和干預的階段性引入,分析內容和方法有別于個(gè)體pRCT。cRCT分析可采用混合效應模型、多水平/層次建模技術(shù),同時(shí)考慮群組、個(gè)體水平和組間特征的影響,還可采用貝葉斯層次建模方法獲得干預效應合理的區間估計。swRCT分析多采用調整時(shí)間效應影響的群組隨機效應模型進(jìn)行干預效果分析。在pRCT統計分析中,建議重視敏感性分析,以評估統計推斷的穩健性。
二、觀(guān)察性研究常用的統計分析方法
在真實(shí)世界數據的觀(guān)察性研究中,數據分析的關(guān)鍵是采用統計分析技術(shù)最大限度的控制混雜因素造成的偏倚。常見(jiàn)的分析方法如下:
(一)分層分析
分層分析是指將數據按可能的混雜因素分為多層,每層內部的數據之間有較好的同質(zhì)性,是最常用的識別和控制混雜偏倚的方法之一。Mantel- Haenszel法是常用的分層分析方法,來(lái)評估混雜因素對結果的影響。該分析可判斷外來(lái)因素是混雜還是效應修飾作用,或以哪種作用為主,以及確定混雜的大小和方向或效應修飾的大小。但是分層分析只能控制少數混雜因素,若混雜因素數過(guò)多可能導致過(guò)度分層,使層內樣本量少;對連續性變量只能用等級分層法,常引起不合理的分組。
(二)多元回歸模型
多元回歸模型是最常見(jiàn)的控制混雜因素的統計分析方法,常用于觀(guān)察性研究,根據結局變量的特點(diǎn)選擇logistic回歸、線(xiàn)性回歸、Poisson回歸和Cox比例風(fēng)險回歸,根據數據是否存在層次結構考慮是否選擇多水平模型,針對存在重復測量的數據可以考慮廣義線(xiàn)性混合效應模型和廣義估計方程。但在應用這些模型的時(shí)候,仍需要考慮其模型的模型假設以及模型適用性。
(三)傾向性評分分析方法
傾向性評分分析是目前觀(guān)察性研究中用于因果推斷最為常見(jiàn)的分析方法,是一種針對較多混雜因素的調整方法,尤其適用于暴露因素常見(jiàn)而結局事件罕見(jiàn)的研究,或者有多個(gè)結局變量的研究。常見(jiàn)的傾向性評分應用方法包括傾向性評分匹配法,傾向性評分分層法,逆概率加權法,以及將傾向性評分作為唯一協(xié)變量納入統計模型進(jìn)行調整分析的方法。特別值得注意的是,研究者若在治療結局評價(jià)中考慮使用傾向評分方法。應首先在研究方案或分析計劃中,預先指明用于建立傾向評分模型的變量,以及對模型擬合優(yōu)度和預測效果進(jìn)行判斷的標準;更為重要的是,在對基線(xiàn)指標建立傾向評分模型時(shí),應保持對結局指標的“盲態(tài)”,直到傾向評分模型建立完畢并確定后,才將結局指標引入,直接評價(jià)結果。避免根據療效結局的對比結果重新調整傾向評分模型,從而獲得“理想”或“預期”結果的情況。
在應用傾向評分進(jìn)行分析時(shí),需同時(shí)報告使用傾向評分之前和之后的結果,并需要考慮傾向評分處理后分析方法可能對最終結果造成的影響,例如,用傾向評分匹配后可能導致的估計精度降低(因樣本量下降);或使用傾向評分加權時(shí),個(gè)別的極大權重的樣本可能對分析結果造成較大影響等。特別需要強調的是,傾向評分方法僅能處理可觀(guān)測到的混雜因素,不能控制研究中未采集的混雜因素可能帶來(lái)的潛在影響,建議研究中針對評價(jià)結果進(jìn)行合理的解讀和討論,并開(kāi)展可能的定量分析。
(四)工具變量分析方法
采用上述分層分析、多變量回歸模型和傾向評分法控制混雜的局限性在于:只能控制已測量的混雜因素的影響,但對于未測量的混雜因素無(wú)法調整。而采用工具變量的因果效應分析方法不涉及具體地對混雜因素/協(xié)變量的調整,能夠控制未知的混雜因素的影響,進(jìn)而估計出干預/暴露因素與結局的因果效應。如果某變量與干預因素(暴露)水平相關(guān),并且對結局變量的影響只能通過(guò)影響干預/暴露因素實(shí)現,同時(shí)與暴露和結局的混雜因素不相關(guān),那么該變量可以稱(chēng)為其暴露因素的一個(gè)工具變量。確定工具變量后,即使存在未知未測的混雜因素,通過(guò)分別估計工具變量對暴露和工具變量對結局的影響效果,即可以估計出暴露對結局的因果效應。利用工具變量估計因果效應的方法,最大的難點(diǎn)在于找到符合上述假設條件的合適的工具變量。在可能的情況下,建議遴選和使用多個(gè)工具變量,并說(shuō)明選擇這些工具變量的原因。通過(guò)敏感性分析,檢驗結果的穩健性。