為規范人工智能醫療器械相關(guān)產(chǎn)品的管理,2023年9月15日,國家藥監局器審中心組織制定并發(fā)布了《磁共振成像系統人工智能軟件功能審評要點(diǎn)》,本審評要點(diǎn)是對磁共振成像系統人工智能軟件功能的一般要求,醫療器械注冊申請人應依據產(chǎn)品的具體特性確定其中的內容是否適用。若不適用,需具體闡述其理由及相應的科學(xué)依據,并依據具體的產(chǎn)品特性對注冊申報資料的內容進(jìn)行充實(shí)和細化。
為規范人工智能醫療器械相關(guān)產(chǎn)品的管理,2023年9月15日,國家藥監局器審中心組織制定并發(fā)布了《磁共振成像系統人工智能軟件功能審評要點(diǎn)》,本審評要點(diǎn)是對磁共振成像系統人工智能軟件功能的一般要求,醫療器械注冊申請人應依據產(chǎn)品的具體特性確定其中的內容是否適用。若不適用,需具體闡述其理由及相應的科學(xué)依據,并依據具體的產(chǎn)品特性對注冊申報資料的內容進(jìn)行充實(shí)和細化。

磁共振成像系統人工智能軟件功能審評要點(diǎn)
本審評要點(diǎn)是對磁共振成像系統人工智能軟件功能的一般要求,申請人應依據產(chǎn)品的具體特性確定其中的內容是否適用。若不適用,需具體闡述其理由及相應的科學(xué)依據,并依據具體的產(chǎn)品特性對注冊申報資料的內容進(jìn)行充實(shí)和細化。
本審評要點(diǎn)是供注冊申請人和技術(shù)審評人員使用的指導性文件,但不包括注冊審批所涉及的行政事項,亦不作為法規強制執行,應在遵循相關(guān)法規的前提下使用本審評要點(diǎn)。如果有能夠滿(mǎn)足相關(guān)法規要求的其他方法,也可以采用,但是需要提供詳細的研究資料和驗證資料。
本審評要點(diǎn)是在現行法規和標準體系以及當前認知水平下制定的,隨著(zhù)法規和標準的不斷完善,以及科學(xué)技術(shù)的不斷發(fā)展,相關(guān)內容也將適時(shí)進(jìn)行調整。
本審評要點(diǎn)不包含臨床評價(jià)的要求,也不包含人工智能倫理、數據產(chǎn)權等法律法規層面要求。
一、適用范圍
本審評要點(diǎn)適用于采用人工智能技術(shù)(artificial intelligence, AI)的磁共振(magnetic resonance, MR)成像系統。按照現行有效的《醫療器械分類(lèi)目錄》,該類(lèi)產(chǎn)品分類(lèi)編碼為06-09,管理類(lèi)別為III類(lèi)。
本審評要點(diǎn)所指的AI軟件功能,必須運行于MR系統,且作為軟件組件隨MR系統進(jìn)行注冊。某些AI軟件功能以專(zhuān)用型獨立軟件形式呈現,運行于MR系統的通用計算平臺(工作站等),如其作為附件隨MR系統進(jìn)行注冊,可以視為MR系統的軟件組件。
二、產(chǎn)品簡(jiǎn)介
MR成像無(wú)電離輻射危害,具有良好的圖像對比度,是臨床常見(jiàn)的影像學(xué)檢查方法。近年來(lái),MR系統的磁場(chǎng)強度和成像分辨率不斷提升,多參數和定量化的成像序列不斷涌現,移動(dòng)式、超低場(chǎng)的產(chǎn)品也逐漸用于臨床?;诖髷祿腁I技術(shù)進(jìn)一步推動(dòng)了相關(guān)行業(yè)發(fā)展,除了利用AI技術(shù)進(jìn)行MR圖像處理的獨立軟件產(chǎn)品,MR系統本身也開(kāi)始通過(guò)AI技術(shù)實(shí)現產(chǎn)品賦能。
(一)成像優(yōu)化
利用AI技術(shù)對MR成像進(jìn)行功能完善和性能提升,常見(jiàn)應用場(chǎng)景包括:① 改善圖像質(zhì)量(例如:圖像降噪、運動(dòng)偽影去除等);② 優(yōu)化圖像重建(例如:欠采樣重建、超分辨率重建、多參數定量圖像重建等);③ 提升成像速度(例如:減少掃描時(shí)間,優(yōu)化動(dòng)態(tài)成像、實(shí)時(shí)成像的性能等)。
(二)工作流程優(yōu)化
利用AI技術(shù)提升MR系統的工作流程的質(zhì)量和效率,例如:在磁共振定位像中智能規劃掃描區域和層面,減少人工操作時(shí)間,提高掃描定位的準確性和可重復性。
(三)定量計算
利用AI技術(shù)在MR圖像中對器官、組織、病灶等進(jìn)行定量分析(例如:體積、圖像紋理、生理參數等),輸出結果用于診斷、治療及療效評估。定量計算軟件功能一般用于處理圖像或其他類(lèi)型數據,其臨床應用場(chǎng)景可能涉及輔助分診、輔助檢測、輔助評估、輔助診斷、輔助治療等,通常不控制成像硬件、不干預掃描操作。
從MR系統掃描和輸出圖像的角度,AI軟件功能也可以按照涉及的產(chǎn)品模塊或成像過(guò)程進(jìn)行劃分,例如:準備、掃描、前處理[1]、后處理等。由于MR系統復雜度較高,各種劃分方法在一定程度上存在交叉和重疊,某個(gè)軟件功能可能同時(shí)對前處理、后處理等多個(gè)環(huán)節產(chǎn)生較大影響,需要依據工作原理、預期用途、產(chǎn)品功能、臨床使用場(chǎng)景等進(jìn)行綜合評價(jià)。
四、審評主要關(guān)注點(diǎn)
在參照適用的法規、規章、指導原則和標準的前提下,請結合下列關(guān)注點(diǎn)開(kāi)展技術(shù)審評。
(一)綜述資料
參考《醫療器械通用名稱(chēng)命名規則》的要求,具有AI軟件功能的MR系統宜采用通用名稱(chēng),即“磁共振成像系統”或“磁共振成像設備”,醫療器械注冊證載明的產(chǎn)品名稱(chēng)中不宜增加“智能”等修飾詞。此外,產(chǎn)品結構組成和適用范圍一般與常規MR系統的注冊證載明信息保持一致,例如:“該產(chǎn)品由3.0T超導磁體、射頻線(xiàn)圈、......組成”、“該產(chǎn)品適用于臨床磁共振成像診斷或檢查”。
申請人可以在產(chǎn)品技術(shù)要求或產(chǎn)品說(shuō)明書(shū)中體現AI軟件功能。
由于MR系統已經(jīng)按照第三類(lèi)醫療器械進(jìn)行管理,即風(fēng)險最高的管理類(lèi)別,所以是否采用AI技術(shù)不會(huì )導致其調增產(chǎn)品管理類(lèi)別。
采用AI技術(shù)的MR系統在注冊申報時(shí),需要針對具體的AI軟件功能,逐項描述工作原理、處理對象、適用疾?。ㄈ暨m用)、適用人群、適用人體部位、臨床用途、使用限制、禁忌證等內容。若適用,請提供AI軟件功能關(guān)于兒童應用的必要說(shuō)明和評價(jià)資料。對于某些僅適用于兒童或成人的軟件功能,建議在產(chǎn)品技術(shù)要求和說(shuō)明書(shū)中進(jìn)行提示和說(shuō)明。
以AI降噪功能為例,需要說(shuō)明兼容的成像序列(類(lèi)型、2D/3D、是否加速采集等)、射頻線(xiàn)圈(類(lèi)型、部位、發(fā)射/接收等)的要求,以及輸出圖像類(lèi)型(定量或非定量等)、適用人群和人體部位、使用限制等信息。
(二)非臨床資料
1. 產(chǎn)品風(fēng)險管理資料
目前,AI技術(shù)已融入臨床MR檢查的各個(gè)環(huán)節,需要采用基于風(fēng)險的全生命周期管理方法進(jìn)行科學(xué)監管,風(fēng)險管理活動(dòng)應依據預期用途(用途類(lèi)型、目標部位和疾病、重要程度、緊急程度等)、使用場(chǎng)景(適用人群、疾病特征、目標用戶(hù)、使用場(chǎng)合、臨床流程等)、核心功能(核心算法、處理對象、數據兼容性、功能類(lèi)型等)予以實(shí)施。
成像優(yōu)化的主要風(fēng)險是AI技術(shù)導致圖像質(zhì)量下降或損失關(guān)鍵診斷信息,例如:快速成像的加速倍數過(guò)高、掃描時(shí)間過(guò)短,導致圖像質(zhì)量下降的風(fēng)險;圖像降噪、運動(dòng)偽影去除等軟件功能導致圖像失真的風(fēng)險。
工作流程優(yōu)化同樣需要考慮是否引入了類(lèi)似的風(fēng)險。以?huà)呙鑼用孀詣?dòng)定位功能為例,如果出現定位錯誤,可能導致無(wú)法獲得預期目標圖像、成像質(zhì)量下降的風(fēng)險,相應的風(fēng)險緩解措施包括改進(jìn)層面位置和方向的顯示方式、提示操作者確認自動(dòng)定位結果、允許操作者手工調整等。
涉及定量計算的軟件功能,定量結果錯誤或偏差可能對患者診療方案造成較大影響,是影響風(fēng)險分析結果的關(guān)鍵因素,需要對其危害程度進(jìn)行詳細分析。在輸出定量指標時(shí),宜提供與定量指標相關(guān)的其他輔助信息,盡可能降低定量結果錯誤或偏差導致的診療決策錯誤的風(fēng)險(詳見(jiàn)附件1)。
已上市的MR系統通過(guò)變更注冊申請新增AI軟件功能,可能會(huì )導致原有產(chǎn)品或功能的預設參數、掃描方式、用戶(hù)操作習慣等發(fā)生較大變化,申請人應對相關(guān)風(fēng)險予以識別并采取必要措施。
2. 產(chǎn)品技術(shù)要求及檢驗報告
依據AI軟件功能的臨床用途,預期對產(chǎn)品安全有效性產(chǎn)生重要影響的項目,宜在產(chǎn)品技術(shù)要求中制定相應的、具體的性能指標條款,且條款內容需要準確、簡(jiǎn)要、客觀(guān)的描述其所實(shí)現的產(chǎn)品功能。
以圖像降噪功能為例,宜按照用戶(hù)可選的圖像降噪級別,分別驗證各級輸出的圖像質(zhì)量。其他宣稱(chēng)具有改善圖像質(zhì)量或提升成像速度等相似用途的軟件功能,均建議參考以上示例,制定適宜的性能指標條款。若軟件功能的運行時(shí)間是影響產(chǎn)品臨床使用的重要因素,則建議選取典型應用場(chǎng)景并規定相應的性能效率要求。
此外,申請人需要說(shuō)明AI軟件功能的使用條件或限制條件,以及檢驗用線(xiàn)圈、適用部位、成像序列及掃描參數等重要內容,并提供檢驗典型性的必要說(shuō)明,具體示例詳見(jiàn)附件2。
3. 研究資料
3.1 軟件研究
3.1.1 軟件
軟件研究報告需要列表描述采用AI技術(shù)的產(chǎn)品核心功能和核心算法,宜提供專(zhuān)題研究資料。申請人應依據AI軟件功能的技術(shù)特點(diǎn)、風(fēng)險程度和應用場(chǎng)景,開(kāi)展相應的軟件測試,并保證軟件驗證和確認的質(zhì)量。
若AI軟件功能已在境外獲批上市,建議提供相關(guān)產(chǎn)品功能的境外上市批件,以及境外上市申報提交的軟件研究資料。
涉及定量計算的軟件功能,需要提供其輸出結果的準確性、一致性等方面的評價(jià)資料(詳見(jiàn)附件1)。
3.1.2 網(wǎng)絡(luò )安全
若AI軟件功能具有遠程訪(fǎng)問(wèn)與控制接口,或采用了云計算、移動(dòng)計算等《醫療器械軟件注冊審查指導原則(2022年修訂版)》第七章中提及的其他相關(guān)功能,需要結合產(chǎn)品預期用途、使用場(chǎng)景和核心功能,基于保密性、完整性、可得性等網(wǎng)絡(luò )安全特性,對相關(guān)風(fēng)險予以重點(diǎn)關(guān)注。
4. 其他資料
申請人在開(kāi)展MR系統AI軟件功能的評價(jià)研究時(shí),宜參考《人工智能醫療器械注冊審查指導原則》的適用內容,重點(diǎn)關(guān)注訓練數據質(zhì)量控制、算法泛化能力、臨床使用風(fēng)險等關(guān)鍵因素,并結合《醫療器械軟件注冊審查指導原則》、《醫療器械網(wǎng)絡(luò )安全注冊審查指導原則》、《醫療器械生產(chǎn)質(zhì)量管理規范獨立軟件附錄》等規范性文件的要求,提供專(zhuān)題研究資料。
除上述通用要求之外,基于MR成像原理及其圖像固有特征,建議申請人參考下文內容對AI軟件功能進(jìn)行充分評價(jià)。
4.1 算法原理和實(shí)現過(guò)程
申請人應針對具體軟件功能描述所用AI技術(shù)和涉及的產(chǎn)品模塊。一般而言,僅用于前處理或后處理的AI軟件功能的算法原理和實(shí)現過(guò)程存在較大差異。
考慮到可追溯性、可解釋性等AI技術(shù)難點(diǎn)尚未完全解決,申請人需要重點(diǎn)關(guān)注算法原理,以及所用算法與MR成像物理過(guò)程的相關(guān)性(若適用),避免AI算法產(chǎn)生非預期的圖像失真等類(lèi)型的錯誤(例如:信號丟失、圖像分辨率劣化、病灶及周?chē)M織形態(tài)改變等)。
4.2 訓練數據和歸一化、泛化能力
MR圖像的像素值通常反映的是人體組織間相對變化程度,并不直觀(guān)對應于某個(gè)明確的物理量(例如:CT圖像的HU值),難以直接用于定量分析。除了人群因素影響(地域、年齡、性別等),即使是對相同患者和部位進(jìn)行掃描,MR設備的型號、場(chǎng)強、操作者等諸多因素均會(huì )導致圖像產(chǎn)生較大差異,不同序列采集圖像之間直接比較像素值也缺乏實(shí)際意義。上述問(wèn)題源于MR成像技術(shù)本身,也源于臨床缺乏標準化掃描協(xié)議,進(jìn)而影響AI軟件功能的泛化能力。
運行于MR系統計算平臺的AI軟件功能,一般與MR系統源自同一制造商,可以在多個(gè)MR系統上進(jìn)行部署,同時(shí)也存在集成第三方現成軟件實(shí)現AI賦能的情況。針對復雜應用環(huán)境,AI軟件功能的訓練數據除了滿(mǎn)足一定的規模要求之外,還需要充分考慮數據的多樣性,包括掃描方式(2D/3D、平掃/增強、擴散加權、MRA等)、掃描參數(場(chǎng)強、層數、層厚、層間距、成像矩陣等)和圖像質(zhì)量(偽影、噪聲等)等因素,以及不同MR系統和制造商的影響,以保證AI軟件功能面對臨床實(shí)際圖像具有良好的歸一化能力。若適用,歸一化能力可以采用定量指標進(jìn)行評價(jià),例如:選取不同來(lái)源的圖像進(jìn)行歸一化處理,并對所得圖像的像素均值、方差、極值、直方圖形態(tài)等進(jìn)行測試分析。
對于某些圖像處理算法,可能采用自然照片等其他模態(tài)圖像進(jìn)行預訓練,通過(guò)遷移學(xué)習等方式,生成適合MR圖像的最終模型。受限于MR圖像獲取難度較大,采用類(lèi)似策略可以快速擴大訓練數據集規模,提升模型性能,但是需要關(guān)注其輸出圖像是否符合預期質(zhì)量要求,以及驗證方法的合理性。若適用,需要重點(diǎn)關(guān)注數據擴增方法的合理性,以及數據擴增對模型訓練造成的潛在不良影響,對數據偏倚等風(fēng)險采取有效控制措施,具體內容詳見(jiàn)《人工智能醫療器械注冊審查指導原則》。
4.3 驗證與確認
4.3.1 軟件功能驗證
AI軟件功能應按照設計需求及功能定義,參考典型應用場(chǎng)景開(kāi)展驗證工作。建議關(guān)注AI算法導致的變化(產(chǎn)品功能、工作流程等),結合輸入輸出特征,合理規定測試條件,完成軟件功能的整體驗證,確認相關(guān)變化符合設計需求。一般而言,與傳統方法或非AI賦能的其他方法相比,AI軟件功能的綜合評價(jià)結果應至少是非劣效的。
4.3.2 軟件功能確認
一般需要客觀(guān)證據證明AI軟件功能可以滿(mǎn)足用戶(hù)需求和預期目的,包括軟件確認測試、臨床使用、設計評審等系列活動(dòng)。建議按照具體設計需求,在真實(shí)或模擬臨床應用場(chǎng)景下實(shí)施軟件功能確認。
4.4 關(guān)鍵技術(shù)特征
4.4.1 定量計算
按照難易程度,定量計算可大致分為兩類(lèi):簡(jiǎn)單定量計算功能,常用于直接客觀(guān)測量的物理量(長(cháng)度、角度、面積等),宜明確測量范圍、誤差等指標要求;復雜定量計算功能,常用于涉及間接測量的對象和場(chǎng)景,包括病灶分割、物質(zhì)分解和量化等。具體內容詳見(jiàn)附件1。
以MR圖像數據的定量計算為例,輸入圖像質(zhì)量及掃描參數(層厚、層間距、層內分辨率等)可能對輸出結果產(chǎn)生較大影響[2],需要采取相應措施(例如:增加圖像歸一化等預處理環(huán)節;對測量結果及偏差給予必要的用戶(hù)提示等)。此外,建議結合應用場(chǎng)景和目標用戶(hù),合理選用計量單位,例如:相對于物理長(cháng)度單位,采用像素數量作為計量單位,在某些情況下可能更易于理解和使用。
4.4.2 多參數成像
采用多參數成像序列,以及特定的圖像重建和處理方法,一次掃描可以獲得多個(gè)具有診斷意義的參數指標。AI技術(shù)結合多參數成像,除了優(yōu)化掃描過(guò)程,也可以最大化利用各個(gè)參數之間的互信息,進(jìn)一步提升輸出結果的準確性。
若適用,需要明確AI軟件功能兼容的多參數成像序列,詳細描述標準操作流程和具體要求,并全面評估其魯棒性。例如:圖像降噪功能是否適合多參數成像輸出的所有圖像類(lèi)型;如果部分圖像或參數缺失而導致輸入數據不完整,基于多參數成像的定量分析功能是否具有防止輸出錯誤結果的相應措施。
4.4.3 擬合其他模態(tài)圖像數據
通過(guò)特殊采集和處理的MR圖像,可以用于擬合生成CT圖像(以下簡(jiǎn)稱(chēng)合成CT),類(lèi)似應用還包括擬合生成DR圖像等。
MR圖像的軟組織對比度較好,適合放療靶區勾畫(huà)以及圖像引導,但是存在像素值絕對定量困難等問(wèn)題。采用AI技術(shù)對MR圖像進(jìn)行HU值預測,獲得的合成CT圖像保留了軟組織對比度優(yōu)勢,預期可以替代真實(shí)CT圖像用于放療計劃和模擬。合成CT圖像一般需要特定的掃描序列和處理方法,例如:水脂分離成像等。
AI軟件功能用于擬合其他模態(tài)圖像時(shí),需要詳細說(shuō)明輸入數據和輸出數據的具體要求,以及輸出數據的具體臨床用途。輸入數據一般是MR圖像和必要的成像參數(掃描序列、采集方式等)。輸出數據一般是擬合生成的其他模態(tài)圖像及其輔助信息,并需要符合預期的質(zhì)量要求。
(三)產(chǎn)品說(shuō)明書(shū)和標簽樣稿
產(chǎn)品說(shuō)明書(shū)需要詳細描述AI軟件功能,包括臨床使用的注意事項、局限性、警示或提示等重要內容,必要時(shí)可以通過(guò)專(zhuān)題章節進(jìn)行講解,以最大程度緩解AI技術(shù)的已知風(fēng)險,也可參考附件1的適用內容和要求。
(四)體系考核關(guān)注點(diǎn)
對采用AI技術(shù)的MR系統開(kāi)展生產(chǎn)質(zhì)量體系核查時(shí),建議核查人員結合本審評要點(diǎn)第三章節內容,逐項梳理AI軟件功能的清單,并重點(diǎn)關(guān)注設計開(kāi)發(fā)資料。
五、《醫療器械安全和性能基本原則清單》各項內容的適用性
略