腸癌篩查突破 首次AI相關(guān)臨床隨機(jī)對照試驗(yàn)成果公布
2月28日,由四川省醫(yī)院王璞醫(yī)生、劉曉崗主任、哈佛醫(yī)學(xué)院Tyler Berzin教授等合著的論文《Real-time automatic detection system increases colonoscopic polyp and adenoma detection rates: a prospective randomised controlled study》發(fā)布于《GUT》雜志,這一雜志在2018年影響因子為17.016。
本篇文章率先使用了隨機(jī)對照實(shí)驗(yàn)的方式測定AI在結(jié)腸鏡檢查中對于息肉、腺瘤的檢查率,目的在于探索AI對于腺瘤檢出率(ADR)的提升結(jié)果。
ADR被稱為結(jié)腸鏡檢查的黃金指標(biāo),曾有研究指出,ADR每增高1%,大腸間期癌的風(fēng)險(xiǎn)降低3%,致命性大腸間期癌風(fēng)險(xiǎn)降低5%。相關(guān)指南對50歲以上無癥狀人群腸鏡篩查時(shí)的ADR提出了要求,即男性應(yīng)不低于30%,女性不低于20%。如今,通過增加ADR來降低腺瘤漏診率已成為許多關(guān)注成像技術(shù)和醫(yī)療器械設(shè)計(jì)的研究的目標(biāo)。
人工智能最近被引入用于息肉和腺瘤檢測以及分類,這項(xiàng)技術(shù)已在初步研究中顯示出令人振奮的結(jié)果,而本次論文更是從真實(shí)世界的研究出發(fā)給出有力的支撐證據(jù)。
這是全球首次隨機(jī)對照臨床試驗(yàn)研究人工智能在腸癌輔助診斷中發(fā)揮的作用成果在期刊中發(fā)表,過去發(fā)布的腸癌AI相關(guān)研究成果均以回顧性研究或觀察性研究為主。
相比于回顧性研究或觀察性研究,本次實(shí)驗(yàn)是前瞻性隨機(jī)對照研究,2017年9月-2018年2月隨機(jī)納入患者,同時(shí)控制了諸多可能影響實(shí)驗(yàn)結(jié)果的變量,該實(shí)驗(yàn)可清晰的對單一因素進(jìn)行比較,以尋求人工智能技術(shù)對ADR的影響。
論文第一作者王璞告訴動脈網(wǎng)記者:“由于該實(shí)驗(yàn)的嚴(yán)謹(jǐn)性和創(chuàng)新性,這是第一個(gè)被國際權(quán)威醫(yī)學(xué)期刊認(rèn)可及發(fā)表的研究AI輔助診斷是否能提高核心臨床指標(biāo)的前瞻性隨機(jī)對照試驗(yàn)。隨機(jī)對照試驗(yàn)是最為嚴(yán)謹(jǐn)?shù)尼t(yī)學(xué)實(shí)驗(yàn)方法之一,也是最常用的用于檢驗(yàn)新藥品的臨床效果的主要手段。該項(xiàng)實(shí)驗(yàn)最大的意義在于,首次證明了AI輔助診斷設(shè)備的使用,確實(shí)可以提高核心臨床指標(biāo)。目前大多數(shù)運(yùn)用AI技術(shù)的研究還停留在用回顧性的數(shù)據(jù)驗(yàn)證AI技術(shù)的準(zhǔn)確性。這是遠(yuǎn)遠(yuǎn)不夠的。臨床醫(yī)學(xué)真正期待的AI技術(shù),是必須能夠在大規(guī)模前瞻性隨機(jī)臨床實(shí)驗(yàn)中顯著提高核心臨床指標(biāo)的設(shè)備。”
基于人工智能的結(jié)腸鏡檢查有望大幅提高ADR
本次研究以高性能實(shí)時(shí)自動息肉檢測系統(tǒng)是否可以在真實(shí)臨床環(huán)境中提高息肉和腺瘤檢出率為目的展開實(shí)驗(yàn),具體將探索自動息肉檢測系統(tǒng)作為內(nèi)鏡醫(yī)生助手時(shí)對醫(yī)生ADR的的影響。
整個(gè)研究全程均在中國四川省人民醫(yī)院內(nèi)窺鏡檢查中心進(jìn)行。研究組與對照組均使用高清內(nèi)窺鏡鏡(Olympus CF-290和CF-260)和高清監(jiān)視器對患者結(jié)腸進(jìn)行檢查。在受試者篩選過程中,實(shí)驗(yàn)人員排除了患有炎癥性腸病(IBD)、遺傳的結(jié)直腸癌(CRC),擁有結(jié)直腸手術(shù)史和活檢禁忌癥的患者。
在結(jié)腸鏡檢查之前,連續(xù)就診的1130位患者按照預(yù)先生成的隨機(jī)序列納入兩組。對照組將進(jìn)行常規(guī)結(jié)腸鏡檢查,而研究組(計(jì)算機(jī)輔助檢測(CADe)組)將采用實(shí)時(shí)自動息肉檢測系統(tǒng)用于輔助內(nèi)部檢測。檢測系統(tǒng)連接到內(nèi)窺鏡處理器,同步捕獲視頻流。
研究組中的內(nèi)窺鏡醫(yī)生主要關(guān)注主監(jiān)視器,并通過聲音警報(bào)提示檢查系統(tǒng)檢測到的每個(gè)息肉位置,整個(gè)過程沒有護(hù)士,受訓(xùn)人員或工作人員助理輔助決策。
在對照組中,工作人員助手記錄了所使用的結(jié)腸鏡類型(CF-H290 / CF-Q260)、進(jìn)鏡時(shí)間、退鏡時(shí)間和波士頓腸道準(zhǔn)備量表(BBPS)。當(dāng)檢測到息肉時(shí),護(hù)士協(xié)助進(jìn)行組織學(xué)活檢,并記錄位置、大小和形態(tài)特征。
而在CADe組中,實(shí)驗(yàn)以外的工作人員將額外記錄系統(tǒng)漏識別和誤識別的息肉。漏識別的息肉被定義為由內(nèi)窺鏡醫(yī)師確認(rèn)但未被系統(tǒng)檢測到的息肉;誤識別被定義系統(tǒng)判定為病變,而內(nèi)窺鏡醫(yī)師經(jīng)觀察后否認(rèn)。
最終結(jié)果顯示:相比于對照組,研究組腺瘤檢出率數(shù)量提升72%,息肉檢出數(shù)量提升89%。具體而言,CADe組的ADR、PDR及結(jié)腸鏡檢查的息肉和腺瘤平均數(shù)顯著增加,從形態(tài)上看,整體腺瘤檢測量的增加主要?dú)w結(jié)于小腺瘤的增加。
由CADe系統(tǒng)檢測到的大多數(shù)小腺瘤較小,這支持了傳統(tǒng)觀點(diǎn),即在內(nèi)窺鏡視野內(nèi)醫(yī)生更容易遺漏小息肉而非更大或更突出的息肉。盡管與較大的腺瘤相比,小腺瘤的惡性風(fēng)險(xiǎn)較小,但總體腺瘤檢出率的增加最終可能會降低CRC漏診風(fēng)險(xiǎn)。
結(jié)果還顯示,小型增生性息肉的檢出率有了顯著增加,這一類息肉常常導(dǎo)致醫(yī)生采取不必要的息肉切除術(shù),增加了醫(yī)生的工作量。未來,CADe系統(tǒng)可與CADx系統(tǒng)結(jié)合使用,以支持檢測、診斷和忽略策略,避免過多的工作量。
從以上數(shù)據(jù)可以看到,在P value小于0.001,置信區(qū)間合理的情況下,人工智能輔助下的PDR從0.291提升至0.4502,提升了61%;ADR從0.2034提升至0.2912,提升了95%。因此,相比與人為識別病灶,CADe系統(tǒng)的高性能、穩(wěn)定性和持續(xù)性能夠促進(jìn)臨床診斷水平極大提高,而自動息肉檢測系統(tǒng)與不同經(jīng)驗(yàn)水平的醫(yī)務(wù)人員協(xié)助之間的直接比較也值得進(jìn)一步研究。
這個(gè)實(shí)驗(yàn)做了哪些細(xì)節(jié)準(zhǔn)備
1.深度學(xué)習(xí)采用系統(tǒng)
本次實(shí)驗(yàn)采用的實(shí)時(shí)自動息肉檢測系統(tǒng)由上海忤合醫(yī)療科技有限公司(Wision AI)開發(fā)。在研究小組的前期研究發(fā)表在Nature生物醫(yī)學(xué)工程2018年10月刊上,對于回顧性數(shù)據(jù)庫,算法的每幀敏感度為94.38%,每幀特異度為95.92%,ROC曲線下面積為0.984。通過部署多線程處理系統(tǒng),系統(tǒng)在實(shí)時(shí)視頻分析中處理速度為25幀/秒,延遲為76.80±5.60 ms。這一延遲對于內(nèi)窺鏡醫(yī)師而言可以忽略。系統(tǒng)監(jiān)視器與原始內(nèi)窺鏡監(jiān)視器相鄰并平行固定。
王璞表示:“在算法開發(fā)過程中,我們對息肉的表面特征做出了特殊的考慮,而不僅是只依賴于息肉的完整形態(tài)。論文中的算法與之前這個(gè)領(lǐng)域十年來的研究相比有明顯特點(diǎn):這個(gè)算法主要依賴病灶的局部特征,所以哪怕息肉只是部分出現(xiàn)在內(nèi)窺鏡的邊緣角落,或者只是從腸皺壁后面漏出一點(diǎn)點(diǎn),或者被腸液或者糞便覆蓋只漏出一個(gè)部分,這個(gè)算法也能夠有效預(yù)警。而這些恰恰就是最容易被醫(yī)生漏掉的息肉。”
2.實(shí)驗(yàn)人員、樣本選擇
8名來消化內(nèi)科醫(yī)生參與了這項(xiàng)研究,包括兩名高級內(nèi)鏡醫(yī)師(20000次以上結(jié)腸鏡檢查),兩名中級內(nèi)鏡醫(yī)師(3000至10000次以上結(jié)腸鏡檢查)和四名初級內(nèi)鏡醫(yī)師(100至500次以上結(jié)腸鏡檢查)。
本次實(shí)驗(yàn)共給予了1130名患者入組資格。在這些患者中,排除了部分符合排除標(biāo)準(zhǔn)大的患者,總計(jì)72名(常規(guī)組31名,CADe組41名)。最終有1058名符合條件的患者參與了實(shí)驗(yàn),其中536名患者隨機(jī)分入對照組,522名患者隨機(jī)分入CADe組。
3.統(tǒng)計(jì)分析
論文中的后續(xù)統(tǒng)計(jì)指出,整個(gè)實(shí)驗(yàn)過程共檢測到767個(gè)息肉。腺瘤有422例(55.02%),無柄鋸齒狀腺瘤有31例(4.04%)。總體而言,對照組中有269個(gè)息肉(35.07%),CADe組中有498個(gè)(64.93%)。
對照組和CADe組中每次結(jié)腸鏡檢查檢測到的息肉平均數(shù)分別為0.51和0.97(p <0.001),對照組和CADe組的PDR分別為0.29和0.45(OR = 1.995,95%CI,1.532-2.544,p <0.001)。在基線臨床和人口統(tǒng)計(jì)學(xué)變量方面,兩組之間沒有統(tǒng)計(jì)學(xué)上的顯著差異。因此,不考慮潛在的混雜效應(yīng)。
本次實(shí)驗(yàn)共檢測到422個(gè)腺瘤。對照組和CADe組每次結(jié)腸鏡檢查檢測到的腺瘤平均數(shù)分別為0.31和0.53(p <0.001)。對照組和CADe組的ADR分別為0.20和0.29(OR = 1.61,95%CI 1.213至2.135,p <0.001)
與對照組相比,CADe組檢測到的息肉數(shù)量顯著高于考慮非帶蒂息肉。當(dāng)考慮非帶蒂息肉,小于0.5cm的息肉和結(jié)腸的所有節(jié)段中的息肉時(shí),除了盲腸和升結(jié)腸外,CADe組中檢測到的腺瘤數(shù)量也顯著增加。
優(yōu)良腸道準(zhǔn)備的結(jié)果(BBPS≥7):在優(yōu)秀的腸道準(zhǔn)備情況下,CADe組的ADR顯示出比常規(guī)組高6%的趨勢。然而,由于亞組分析的樣本量不足,它未能顯示出統(tǒng)計(jì)學(xué)上的顯著差異。在CADe組中,其他結(jié)果,包括檢測到的腺瘤的平均數(shù),檢測到的息肉的平均數(shù)和PDR均顯著增加。
自動息肉檢測系統(tǒng)誤報(bào):CADe組共有39個(gè)誤報(bào),每個(gè)結(jié)腸鏡檢查平均誤報(bào)0.075。在研究組中檢測到的所有息肉中,沒有一個(gè)被CADe系統(tǒng)遺漏。
本次實(shí)驗(yàn)的局限性
論文在結(jié)尾部分談到了此次研究的局限性。首先,由于無法使內(nèi)窺鏡醫(yī)生和病人采用雙盲設(shè)計(jì),系統(tǒng)的確切貢獻(xiàn)可能難以評估。醫(yī)生的“競爭精神”及“被觀察時(shí)的行為”可能影響實(shí)驗(yàn)組的ADR結(jié)果。這種機(jī)制可能解釋了CADe組中潛在的混淆因素,即內(nèi)鏡醫(yī)師可能在已知觀察的設(shè)置中更加專注。
在這項(xiàng)研究中,研究人員從每個(gè)相應(yīng)的檢測時(shí)間中減去活組織檢查程序的時(shí)間,獲得的結(jié)果相似但不相關(guān)(6.07分鐘vs 6.18分鐘,p = 0.15),這一定程度上能反應(yīng)兩組相似的觀察注意力。
在未來,研究人員可以設(shè)計(jì)雙盲研究來探索該系統(tǒng)在增加的ADR中的確切貢獻(xiàn)。這樣的研究還可以幫助確定內(nèi)窺鏡檢查者和系統(tǒng)是否同時(shí)檢測到息肉,或者內(nèi)窺鏡檢查員最初是否錯(cuò)過了息肉,這個(gè)問題目前的研究并非旨在解決。
第二個(gè)限制是缺乏外部有效性。本研究以中國的患者群體選擇樣本,基線腺瘤和息肉檢出率與西方國家報(bào)道相比較低。中西方人群的遺傳,飲食,生活方式和習(xí)慣差異等因素或許是這一問題的大難。所以,本研究的結(jié)果可能不適用于基線ADR較高的世界范圍,未來仍需要進(jìn)一步研究以研究該系統(tǒng)在這些領(lǐng)域的適應(yīng)性和有效性。
第三,盡管假陽性率低,但系統(tǒng)的設(shè)計(jì)者出乎意料地出現(xiàn)了一些假陽性,并且由于檢測到藥物膠囊,局部出血部位或未消化的食物殘?jiān)l(fā)生,導(dǎo)致在手術(shù)過程中可能分散注意力。這可以通過向當(dāng)前系統(tǒng)添加足夠的訓(xùn)練數(shù)據(jù)來糾正。
第四,這項(xiàng)研究沒有控制參與內(nèi)鏡醫(yī)師的疲勞程度,這可能是影響ADR的獨(dú)立因素,需要進(jìn)一步的研究來研究這種CADe系統(tǒng)對醫(yī)生的不同疲勞水平的有效性。
第五,由于初級內(nèi)鏡醫(yī)師對結(jié)腸鏡檢查的樣本量不足,需要進(jìn)一步研究以顯示該CADe系統(tǒng)在不同培訓(xùn)水平中的作用和有效性。
最后,該研究僅使用奧林巴斯結(jié)腸鏡檢查設(shè)備進(jìn)行。因此,還應(yīng)探索該系統(tǒng)對其他公司制造設(shè)備的適應(yīng)性。
研究結(jié)果對結(jié)腸檢測的后續(xù)影響
論文指出,在過去的十年中,高性能和高穩(wěn)定性的自動結(jié)腸息肉檢測一直是一個(gè)有吸引力的研究課題,其目的是增加ADR。然而,目前的技術(shù)尚未產(chǎn)生足夠的診斷性能,以便考慮用于臨床。為了將自動息肉檢測系統(tǒng)考慮用于實(shí)際臨床應(yīng)用,它必須具有非常高的敏感度和特異性,足夠的實(shí)時(shí)標(biāo)準(zhǔn)處理時(shí)間和屏幕警報(bào)系統(tǒng)。
特異性不足會產(chǎn)生許多誤報(bào)。相應(yīng),敏感度不足不僅不會增加PDR/ADR,還會增加醫(yī)生負(fù)擔(dān)。此外,為了使實(shí)時(shí)檢測有效,分析時(shí)間必須快,即AI診斷必須避免明顯的延遲。由于這些先決條件,目前關(guān)于自動息肉檢測的大多數(shù)研究都是小規(guī)模的非臨床研究,盡管隨著對該領(lǐng)域的興趣迅速增加,并且隨著深度學(xué)習(xí)的出現(xiàn),預(yù)計(jì)未來幾年將取得巨大進(jìn)展。
如今,人工智能在消化內(nèi)鏡領(lǐng)域的應(yīng)用,目前主要分為兩大方向,一是輔助診斷CADx,通過設(shè)備的光學(xué)能力,例如幾百倍的放大內(nèi)鏡,窄帶光NBI,熒光技術(shù),加之深度學(xué)習(xí)判斷病灶的性質(zhì),以求代替病理診斷。然而這種依賴病灶表面的細(xì)微特征來預(yù)測病理結(jié)構(gòu)的方式還有待考證。雖然一些傳統(tǒng)的深度學(xué)習(xí)模型在這個(gè)領(lǐng)域?qū)崿F(xiàn)了相對高的預(yù)測性能,但其與病理結(jié)構(gòu)并不能100%對應(yīng),加之各國現(xiàn)行的臨床規(guī)范有較大改變,所以并未獲得大規(guī)模應(yīng)用。另一個(gè)大方向是輔助檢測CADe,即AI只提供視野中可見病灶的位置,具體的診斷還需要臨床醫(yī)生當(dāng)場決斷。這個(gè)類型的應(yīng)用主要解決人類肉眼的局限性,在疲勞、經(jīng)驗(yàn)不足、注意力分散的情況下,AI檢測為內(nèi)鏡醫(yī)生提供有效輔助。由于對臨床規(guī)范和實(shí)踐并無本質(zhì)影響,這類型的應(yīng)用只要達(dá)到了相應(yīng)的技術(shù)指標(biāo)將會比較容易被廣泛接受。
這項(xiàng)研究屬于后者,其臨床意義十分顯著:在結(jié)腸鏡檢查中,臨床醫(yī)生和設(shè)備廠商多年以來的共同目標(biāo)就是提升ADR(腺瘤檢出率),即篩查病人中檢出腺瘤的比例。這項(xiàng)研究已經(jīng)證明了計(jì)算機(jī)可以作為第二觀察者在結(jié)腸鏡檢查中實(shí)時(shí)為臨床醫(yī)生提示病灶。此前有臨床試驗(yàn)表明配有護(hù)士或培訓(xùn)生等非專業(yè)人士作為第二觀察者的結(jié)腸鏡檢查對ADR的提升達(dá)30%,而已經(jīng)達(dá)到專家水準(zhǔn)的AI作為第二觀察者對ADR的提升將非常值得期待。
當(dāng)然,最理想的狀態(tài)是CADe與CADx的結(jié)合,即“檢測+分析”,以提高ADR/PDR,以及醫(yī)生的診斷效率。在國內(nèi)醫(yī)療資源稀缺的大背景下,人工智能也許是解決當(dāng)前矛盾的唯一途徑。
本片論文不是結(jié)束,而是一個(gè)新的開始。在未來,王璞團(tuán)隊(duì)將繼續(xù)進(jìn)行雙盲實(shí)驗(yàn)、多組研究……用數(shù)據(jù)論證醫(yī)生和AI怎樣的合作才能發(fā)揮最大的效用,并讓敏感性、特異性逐漸向“1”逼近,實(shí)現(xiàn)實(shí)時(shí)自動息肉檢測系統(tǒng)從“有效”到“飛躍”的突破。
最后引用王璞在采訪中的發(fā)言:“就消化科來看,人工智能技術(shù)的應(yīng)用可以提高臨床服務(wù)水平,降低醫(yī)療服務(wù)成本及風(fēng)險(xiǎn)。好的AI系統(tǒng)需要在真實(shí)的臨床環(huán)境中驗(yàn)證,現(xiàn)在很多的人機(jī)大賽是遠(yuǎn)遠(yuǎn)不夠的,我認(rèn)為嚴(yán)謹(jǐn)?shù)那罢靶噪S機(jī)臨床試驗(yàn)是驗(yàn)證人工智能技術(shù)的最佳方式。在消化內(nèi)鏡領(lǐng)域,除了自動檢測息肉,還有息肉窄帶光病理診斷、以及食道鏡窄帶光癌前病變檢測與分類等。每項(xiàng)技術(shù)都有提高現(xiàn)有臨床水平的潛力,關(guān)鍵在于能否在臨床使用中切實(shí)提高核心臨床指標(biāo)。這正是研究者們所需要的并為之不懈努力的方向。”
推薦內(nèi)容
-
五成腦腫瘤首發(fā)癥狀是頭痛
-2022年4月24日發(fā)(作者:血沉高是怎么回事)幽 諺璃 抗;灝 者們互動。老周還真上了一家 不小的文學(xué)網(wǎng)站,不過,讓老 前幾天,在老朋友
-
三七粉的功效與作用及禁忌
-2022年4月16日發(fā)(作者:眼睛酸痛)三七粉的功效與作用及禁忌三七又名“田七”,是補(bǔ)血、化瘀、消腫、止痛的良藥。如果你不小心碰到、磕...
-
9月16日山東疫情最新數(shù)據(jù)公布 山東昨日新增境外輸入確診病例1例
山東新增境外輸入確診病例1例。那么,對于山東疫情的這個(gè)話題,今天的你是否也在關(guān)注著?具體什么情況?下面跟小編一起來了解下具體詳情。202
-
年中國醫(yī)學(xué)院校及附屬醫(yī)院排名前五十強(qiáng)
-2022年4月17日發(fā)(作者:河北建筑工程學(xué)院分?jǐn)?shù)線)年中國醫(yī)學(xué)院校及附屬醫(yī)院排名(前五十強(qiáng))根據(jù)國家重點(diǎn)學(xué)科及實(shí)驗(yàn)室、省部級重點(diǎn)學(xué)科及實(shí)驗(yàn)
-
8月18日張家界疫情最新實(shí)時(shí)數(shù)據(jù)公布 張家界昨日無新增本土確診病例
張家界,原名大庸市,湖南省地級市。轄2個(gè)市轄區(qū)(永定區(qū)、武陵源區(qū))、2個(gè)縣(慈利縣、桑植縣)。位于湖南西北部,澧水中上游,屬武陵山區(qū)腹地
-
RNG夏季賽大名單 Uzi不在名單里
不知不覺英雄聯(lián)盟已經(jīng)陪伴我們已經(jīng)很多年了,從之前的滿腔熱血到現(xiàn)在的好友一片灰色,偶爾還有一兩好友還在亮著,今天小編給大家?guī)淼?..
-
孕產(chǎn)婦隨訪服務(wù)記錄表模板
-2022年4月18日發(fā)(作者:教資報(bào)名費(fèi))第1次產(chǎn)前隨訪服務(wù)統(tǒng)計(jì)表姓名:編號□□□-□□□□□填表日期孕婦年紀(jì)丈夫姓名孕次末次月經(jīng)既往史家族
-
玻尿酸的作用機(jī)理
-2022年4月28日發(fā)(作者:體溫)玻尿酸的作用機(jī)理原本玻尿酸只用于保濕作用,已列入除皺整形材料的行列,這種整形技術(shù)是利用細(xì)菌發(fā)酵所培養(yǎng)出
-
高血壓病的綜述
-2022年4月21日發(fā)(作者:男性更年期的癥狀)高血壓病的綜述摘要:高血壓病是指在靜息狀態(tài)下動脈收縮壓和 或舒張壓增高(>=140 90mmHg),常
-
7月15日臺灣疫情最新數(shù)據(jù)公布 臺灣新增17例本土確診病例
【導(dǎo)讀】說起疫情這兩個(gè)字眼,想必朋友們都是感觸良多,老百姓們都投入到抗疫當(dāng)中,從生活中各方面去完善疫情防控。雖然目前疫情的到了穩(wěn)定的