AI使用圖像和組學(xué)來解碼癌癥
這是每個癌癥患者心中的問題:我有多久了?基因組學(xué)家邁克爾斯奈德希望他有答案。目前,所有醫(yī)生都可以做的是將具有相似癌癥的腫塊患者分成大組,并猜測他們將與該組中的其他患者具有相同的藥物反應(yīng)或預(yù)后。但他們將人分配給這些群體的方法粗略且不完善,并且通?;谌搜矍蚴占臄?shù)據(jù)。
斯坦福大學(xué)基因組學(xué)和個性化醫(yī)學(xué)中心主任斯奈德說:“當(dāng)病理學(xué)家閱讀圖像時,只有百分之六十的時間是他們同意的。”2013年,他和當(dāng)時的研究生Kun-Hsing Yu想知道人工智能能否提供更準確的預(yù)測。
Yu將組織學(xué)圖像輸入機器學(xué)習(xí)算法,連同病理學(xué)家確定的診斷,訓(xùn)練它以區(qū)分肺癌和正常組織,以及兩種不同類型的肺癌相互之間。然后,他為這些幻燈片提供了生存數(shù)據(jù),讓系統(tǒng)了解這些信息與圖像的關(guān)系。最后,他在新的幻燈片中添加了該模型以前從未見過的內(nèi)容,并詢問了所有重要的長壽問題。
當(dāng)病理學(xué)家閱讀圖像時,只有百分之六十的時間他們同意。
- 斯坦福大學(xué)邁克爾斯奈德
計算機可以預(yù)測哪些人的生存時間比這些特定癌癥的平均生存時間更短或更長 - 病理學(xué)家很難做到這一點。1“它的效果非常好,”Yu說,現(xiàn)在是哈佛醫(yī)學(xué)院的講師。
但斯奈德和俞認為他們可以做得更多。斯奈德的實驗室也在研究,所以他們決定不僅為幻燈片提供計算機,還提供腫瘤轉(zhuǎn)錄組。通過這些數(shù)據(jù)的組合,該模型預(yù)測患者的生存率甚至優(yōu)于單獨的圖像或轉(zhuǎn)錄組,準確率超過80%。2今天,病理學(xué)家通常根據(jù)組織顯微照片的視覺評估做出生存預(yù)測,從中評估腫瘤的階段 - 腫瘤的大小和范圍 - 等級,以及它進一步生長和擴散的可能性。但病理學(xué)家并不總是同意,腫瘤分級并不總能準確預(yù)測生存。
Snyder和Yu并不是唯一一位認識到人工智能能夠分析癌癥相關(guān)數(shù)據(jù)集的能力的研究人員,這些數(shù)據(jù)集是關(guān)于圖像,一些人,以及最近兩者的結(jié)合。盡管這些工具在到達診所之前還有很長的路要走,但AI方法可以快速準確診斷,預(yù)測哪種治療方法最適合哪些患者,甚至可以預(yù)測生存率。
目前,其中一些應(yīng)用仍然是“科幻小說”,倫敦癌癥研究所的計算生物學(xué)家Andrea Sottoriva說,他正致力于人工智能預(yù)測癌癥進展并選擇合適的藥物治療特定腫瘤。“我們的目標是改變這一點。”
INPUT:圖像,輸出:診斷
在癌癥進展過度之前尋找和治療癌癥可能是提高生存率的關(guān)鍵。例如,在宮頸癌方面,早期檢測可使五年生存率超過90%。醫(yī)生可以在子宮頸轉(zhuǎn)化區(qū)的前四毫米處煎炸,冷凍或切除癌前細胞,這是宮頸周圍最常出現(xiàn)癌癥的組織環(huán)。然而,一旦癌癥轉(zhuǎn)移,存活率在五年內(nèi)降至56%或更低。
早期治療在發(fā)達國家很常見,在這些國家,婦女定期進行子宮頸抹片檢查以檢查宮頸細胞是否異常,并檢測導(dǎo)致癌癥的人乳頭瘤病毒。但在發(fā)展中國家,這種放映很少見。國家癌癥研究所的醫(yī)學(xué)流行病學(xué)家Mark Schiffman說,有一個更便宜的測試保健工作者在醋酸中涂抹女性子宮頸,尋找可能表明癌癥的明顯白色區(qū)域 - 但“這種技術(shù)是如此不準確”。因此,一些健康女性接受治療,而其他人可能會遺漏癌前細胞,從而導(dǎo)致需要更多根治治療的癌癥,如化療,放療或子宮切除術(shù)。
Schiffman和其他研究小組一直在努力尋找一種方法來使醋酸篩選更加準確 - 例如,通過使用白光以外的光譜進行成像。Schiffman的團隊在美國和哥斯達黎加積累了數(shù)千張來自不同來源的子宮頸圖片,包括醫(yī)療保健專業(yè)人員用放大鏡稱為陰道鏡或手機拍攝的照片。但他即將放棄。“我們不能像其他[測試]一樣真正敏感,準確或可重復(fù)。”
然后,在2017年底,與比爾和梅琳達蓋茨基金會相關(guān)的一個名為Global Good的非營利組織達成了協(xié)議。該組織希望嘗試在Schiffman的圖像采集上進行機器學(xué)習(xí),以查看計算機是否可以在醫(yī)生無法提供診斷時進行診斷。
因此,Schiffman與Global Good和其他合作者合作,使用一種稱為卷積神經(jīng)網(wǎng)絡(luò)的特殊機器學(xué)習(xí)來分析子宮頸圖像。該算法的目標是識別圖像中的特征 - 例如,相似或不同的并排像素往往是多少 - 這有助于它獲得正確的診斷。一開始,它的準確性并不比偶然。在分析越來越多的圖像時,它權(quán)衡了這些功能以幫助它找到答案。“這是一個變得更熱,更熱,更冷,更冷,哦是的,更熱,更熱的過程。。。直到它盡可能接近,“希夫曼解釋說。
該團隊開始使用來自9,000多名女性的哥斯達黎加七年來收集的子宮頸圖像。Schiffman還積累了這些女性更準確的篩查測試數(shù)據(jù),以及18年前有關(guān)癌前病變或癌癥診斷的后續(xù)信息。研究人員使用70%的完整數(shù)據(jù)集來訓(xùn)練模型,然后僅在其余30%的圖像上測試其性能。Schiffman無法相信結(jié)果:機器學(xué)習(xí)區(qū)分了健康組織,癌前病變和癌癥,91%是機器學(xué)習(xí)預(yù)測準確度的標準衡量標準。相比之下,人類視覺檢查的得分僅為69%。3“我從來沒有見過這么準確的東西,”希夫曼說。他確信有一些錯誤。
該小組檢查了其工作,并要求國家醫(yī)學(xué)圖書館的合作者獨立驗證該技術(shù)。沒有錯誤:機器真的很擅長識別癌前病變和癌癥。有了這個新工具,Schiffman希望開發(fā)一種低成本的宮頸癌篩查測試,將手機型相機與基于機器的圖像分析相結(jié)合。首先,他想在世界各地的成千上萬的手機宮頸圖像上訓(xùn)練他的算法。我從來沒有見過這么準確的東西。
我從來沒有見過這么準確的東西。
-Mark Schiffman,國家癌癥研究所
他不是唯一一個關(guān)注癌癥診斷智能手機的人。皮膚病變 - 可能是癌癥或良性 - 正好在表面,任何人都可以拍攝。斯坦福大學(xué)的研究人員建立了一個包含13萬張皮膚病變照片的數(shù)據(jù)庫,并用它來訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),以區(qū)分良性腫塊和三種不同類型的惡性病變,準確率至少達到91%。該算法的表現(xiàn)優(yōu)于大多數(shù)21名皮膚科醫(yī)生要求評估的相同圖片。4
創(chuàng)建癌癥預(yù)測模型的主要挑戰(zhàn)是獲取足夠的高質(zhì)量數(shù)據(jù)。當(dāng)斯坦福大學(xué)的團隊從斯坦福醫(yī)學(xué)院和互聯(lián)網(wǎng)上編輯皮膚癌的圖像時,角度,變焦和照明都變化多端。研究人員不得不翻譯各種語言的標簽,然后與皮膚科醫(yī)生合作,將病變正確分類為2,000多種疾病類別。
當(dāng)然,大多數(shù)癌癥需要的不僅僅是智能手機相機才能看到正在發(fā)生的事情。觀察腫瘤中的個體細胞需要顯微鏡檢查。Yu說,科學(xué)家們還想盡可能多地收集關(guān)于一個人的臨床治療和反應(yīng)的信息,以及基因組等分子數(shù)據(jù),但這也很難得到。“我們很少能找到患有我們想要的所有數(shù)據(jù)的患者。”
INPUT:圖像+ -Omes,輸出:生存
正如Snyder和Yu所發(fā)現(xiàn)的那樣,-omics數(shù)據(jù)(如果有的話)可以提供有關(guān)特定癌癥中涉及的分子途徑的信息,這些信息可能有助于識別癌癥類型,存活或?qū)χ委煹目赡芊磻?yīng)。在他們最初的基于圖像的研究中,研究人員共有2,186個肺組織切片,人類病理學(xué)家的疾病分類和患者存活時間。研究人員使用計算機算法從這些圖像中提取近10,000個特征,例如細胞形狀或大小,用于訓(xùn)練多種機器學(xué)習(xí)算法。
一種運作良好的方法稱為隨機森林。它會生成數(shù)百個可能的決策樹;然后那些“樹”在答案上投票,而大多數(shù)人都在這里投票。該算法在區(qū)分健康組織和兩種癌癥類型方面的準確度超過75%,并且可以預(yù)測誰比單純基于癌癥階段的模型更準確地進入高或低生存組。1“這超出了目前的病理診斷范圍,”Yu說。
在他們的后續(xù)研究中,研究人員在538名肺癌患者的組織病理學(xué)載玻片上運行他們訓(xùn)練的圖像分析算法,然后添加來自同一患者的轉(zhuǎn)錄組和蛋白質(zhì)組,并要求“隨機森林”對他們的癌癥等級進行投票。 。15個基因的表達水平預(yù)測癌癥等級,準確率為80%。這些基因被證明與DNA復(fù)制,細胞周期調(diào)控和p53信號傳導(dǎo)等過程有關(guān) - 所有這些都已知在癌癥生物學(xué)中發(fā)揮作用。該團隊還確定了15種蛋白質(zhì) - 而不是由參與細胞發(fā)育和癌癥信號傳導(dǎo)的15種基因編碼的蛋白質(zhì),這些蛋白質(zhì)以81%的準確度預(yù)測等級。雖然研究人員沒有將此與人類表現(xiàn)進行比較,但一項病理學(xué)家的研究發(fā)現(xiàn)79%的人對肺腺癌的分級達成一致5 -建立機器和人類同樣準確。但機器走得更遠,顯然正在尋找導(dǎo)致癌癥進展的特定基因表達因子。
最后,研究人員要求計算機根據(jù)基因表達,癌癥等級和患者年齡來預(yù)測生存。利用所有這些數(shù)據(jù),該模型實現(xiàn)了超過80%的準確性,正確地將病例分類為長期和短期幸存者,比人類病理學(xué)家,轉(zhuǎn)錄組或單獨的圖像更好。2
在Snyder和Yu的工作的啟發(fā)下,紐約大學(xué)醫(yī)學(xué)院的Aristotelis Tsirigos及其同事也試圖將圖像與肺癌的遺傳學(xué)聯(lián)系起來,使用1,634張健康或癌性肺組織切片。僅基于圖像,他們的卷積神經(jīng)網(wǎng)絡(luò)能夠區(qū)分腺癌和鱗狀細胞癌,準確率約為97%。然后,研究小組提供了關(guān)于肺腺癌中10個最常見突變基因的算法數(shù)據(jù),并且計算機學(xué)會了從病理學(xué)載玻片中預(yù)測其中6個突變的存在,準確度范圍為73%至86%。6“它運作得很好,”Sottoriva評論說,他沒有參與這項工作。“首先,它非常令人興奮。”
當(dāng)然,醫(yī)生和科學(xué)家不需要通過成像識別突變;其他測試更直接,更準確,基因測序提供了幾乎完美的癌癥基因組讀數(shù)。Tsirigos解釋說,這項研究有助于證明遺傳學(xué)和圖像特征以可預(yù)測的方式相關(guān)?,F(xiàn)在,他正在努力將組織病理學(xué)和分子信息結(jié)合起來預(yù)測患者的預(yù)后,正如Yu和Snyder的研究小組所做的那樣。Tsirigos說,只要研究人員有正確的數(shù)據(jù)輸入,這些方法應(yīng)適用于任何癌癥類型。
INPUT:-Omes,OUTPUT:腫瘤進化
即使沒有圖像,-Omics數(shù)據(jù)也可以自己使用。例如,Sottoriva及其同事正在使用基因組學(xué)來了解腫瘤的演變。一種腫瘤通常由多種細胞譜系組成,所有細胞譜系均源自相同的原始癌細胞。為了有效治療癌癥,了解這種異質(zhì)性和腫瘤進化的方式非常重要。如果治療僅對腫瘤的一部分起作用,癌癥就會復(fù)發(fā)。“這是生死攸關(guān)的問題,”愛丁堡大學(xué)計算機科學(xué)家,腫瘤進化研究合作者Guido Sanguinetti說。
通過對單個腫瘤的多個部分進行取樣,研究人員可以推斷出癌癥的進化途徑;它類似于對現(xiàn)代人類基因組進行抽樣,以追蹤各種群體回到祖先群體。來自不同患者的腫瘤,即使患有相同類型的癌癥,也往往具有截然不同的進化樹。Sanguinetti,Sottoriva及其同事認為,如果他們能夠找到癌癥傾向于遵循的共同途徑,腫瘤學(xué)家就可以利用這些信息對可能患有類似疾病進展的人進行分類,或者對藥物進行類似的反應(yīng)。
為了找到那些常見的進化樹,研究人員使用了一種稱為轉(zhuǎn)移學(xué)習(xí)的機器學(xué)習(xí)形式。Sanguinetti解釋說,該算法同時查看患者基因組中的所有樹,在它們之間共享信息以找到與整個組相容的解決方案。他們稱他們的工具為REVOLVER,用于癌癥的重復(fù)進化。作為第一次測試,他們發(fā)明了虛構(gòu)的腫瘤進化樹。當(dāng)他們根據(jù)這些樹木喂養(yǎng)REVOLVER基因組學(xué)數(shù)據(jù)時,它確實吐出了與發(fā)明樹相匹配的系統(tǒng)發(fā)育。
為了以眾所周知的癌癥進化形式驗證該工具,研究人員轉(zhuǎn)向了結(jié)直腸癌的惡性轉(zhuǎn)變。這發(fā)生在良性腺瘤累積已知驅(qū)動基因的突變中:例如,在APC中,然后是KRAS,然后是PIK3CA。研究人員為REVOLVER提供了一組來自9個真實良性腺瘤和10個惡性腫瘤的基因組。果然,該模型繪制了與腺瘤到癌轉(zhuǎn)變相匹配的系統(tǒng)發(fā)育樹。
然后該小組分析了腫瘤樣本,對其進展不太了解。在來自99名非小細胞肺癌患者的基因組中,REVOLVER根據(jù)腫瘤累積的突變序列確定了10個潛在的患者群。其中一些群體中的人群存活時間不到150天,而置于其他群集中的群體存活時間更長,表明這些類別具有預(yù)后價值。同樣,REVOLVER在50個乳腺癌腫瘤中發(fā)現(xiàn)了6個簇,簇之間的存活水平不同。7“我們沒想到會找到團體,真的,”Sottoriva說。“這些結(jié)果告訴我們癌癥的進展可以預(yù)測。”
Sottoriva說,醫(yī)學(xué)運行的是那種可預(yù)測的模式。AI是一種強大的工具,可幫助識別臨床相關(guān)的模式。此外,通過從模型的輸入中選擇性地消除某些數(shù)據(jù),并查看其準確性是否下降,生物信息學(xué)家開始弄清楚計算機用來區(qū)分這些模式的特征,Tsirigos說。
目前用于癌癥研究的AI應(yīng)用僅僅是個開始。未來的算法不僅可以包含一些物體和圖像,還可以包含有關(guān)治療結(jié)果,進展以及科學(xué)家可以獲得的任何其他信息的其他數(shù)據(jù)。
“在一天結(jié)束時,”斯奈德說,“在處理像癌癥這樣的復(fù)雜疾病時,你需要一些信息。”
推薦內(nèi)容
-
機票賣出白菜價怎么回事?幾十元就能坐飛機?
花幾十元就能坐一趟飛機,你敢相信嗎?聽起來也許不可思議,但現(xiàn)在卻成為現(xiàn)實,近日,據(jù)媒體報道,從北上廣深等城市飛往重慶、成都、昆明等
-
額頂區(qū)九針治療失眠療效觀察
-2022年4月17日發(fā)(作者:埋線醫(yī)院雙眼皮價格)實用中醫(yī)藥雜志2015年7月第31卷7期(總第27O期)?。剩希眨遥危粒獭。希啤。校遥粒?
-
7月29日廣東疫情最新數(shù)據(jù)公布 廣東新增境外輸入確診病例3例
當(dāng)前疫情防控形勢仍然嚴峻復(fù)雜,要緊繃疫情防控常態(tài)化這根弦,始終保持警惕、嚴密防范。從當(dāng)下全國各地的疫情形勢來看,似乎已經(jīng)迎來了好...
-
新病毒的傳播據(jù)信發(fā)生在養(yǎng)殖和野生魚類之間
2010年,研究人員發(fā)現(xiàn)了一種名為魚類呼腸孤病毒(PRV)的新型魚類病毒。該病毒在養(yǎng)殖魚類中很常見,很可能該病毒可導(dǎo)致鮭魚的心臟和骨骼肌炎
-
發(fā)現(xiàn)酶LSD1調(diào)節(jié)肌纖維類型分化
我們的身體將食物轉(zhuǎn)化為能量,用于所有生命活動這些代謝過程使細胞產(chǎn)生能量(合成代謝)并從營養(yǎng)物質(zhì)中消耗能量(分解代謝)。在最近日本熊本大
-
膳食營養(yǎng)指導(dǎo)改善高血壓的癥狀效果
-2022年4月21日發(fā)(作者:腎病病因)膳食營養(yǎng)指導(dǎo)改善高血壓的癥狀效果目的:探討膳食營養(yǎng)指導(dǎo)改善高血壓的癥狀效果。方法:原發(fā)性高血壓患者
-
我國漢族女生月經(jīng)初潮年齡變化地域分布研究
-2022年4月24日發(fā)(作者:北京男科最好的醫(yī)院)我國漢族女生月經(jīng)初潮年齡變化地域分布研究61我國漢族女生月經(jīng)初潮年齡變化地域分布研究劉穎郭
-
6月30日廣州疫情最新消息通報 廣州國際健康驛站預(yù)計九月投入使用!
內(nèi)疫情控制得很好,風(fēng)險度是逐漸下降,但個別地方還是會有零散的病例發(fā)生。6月28日,廣州市政府新聞辦舉行疫情防控新聞發(fā)布會,廣州市衛(wèi)健委
-
致幻劑對癌癥患者具有持久的抗焦慮和抗抑郁作用
繼2016年里程碑式的研究之后,紐約大學(xué)格羅斯曼醫(yī)學(xué)院(NYU Grossman School of Medicine)的研究人員發(fā)現(xiàn),將迷幻蘑菇中發(fā)現(xiàn)的化合物...
-
高血壓病防治知識(宣傳單)
-2022年4月21日發(fā)(作者:2020年1月黃道吉日一覽表)高血壓病防治知識每年的十月八日定為“全國高血壓日”,高血壓是最常見的心血管疾病,...