深度學習用於辨認出癌疾的分子模式
MAUI深度學習平台對相同的樣本作出類似的劃分,但發現亞型2 (在圖A以綠色表示) 實際上可能是2個不同的類型 (在圖B由綠色和淺藍色表示)。
圖片來源: Akalin 實驗室,MDC(網上)
根據生命科學聯盟期刊 (Life Science Alliance Journal) 最新刋載的研究顯示一個新深能度學習演算法能快而準分析幾種結直腸腫瘤的基因组數據以便更準確分類,從而改善診斷及相關的治療選案。
结直腸腫瘤的發展,差異是非常巨大,需使用不同藥物,同時存活率的差異亦非常大。基於它們的基因表現水平分析,一般會分為不同的亞型。據在MDC's柏林學院醫藥系統生物學(Berlin Institute of Medical System Biology 簡稱BIMSB)主導生命資訊平台研究组的生命資訊科學家Atuna Akalin 表示疾病比單一個基因要複雜得多,要理解其複雜性,要使用一些機器學習去真正好好利用數據。
要尋找遺傳基因物質中的多種特性,包括遺傳基因表現、單點異變及DNA拷貝數量,Akaline 和博士生 Johnathan Ronen 設計出多層組學自動编碼機整合平台 – 簡稱MAUI。
如何運作
監督式機器學習通常要人類專家對數據進行標示,然後訓練人工智能去預測這些已標示數據,例如由一些眼睛圖片去預測眼睛的顏色,研究人員首先需要輸入一些已標示眼睛顏色的圖片到人工智能,人工智能通過學習辨認眼睛的不同顏色,從而能夠獨立分析新數據。
相反非監督式機器學習則不會有訓練的過程,深度學習人工智能通過篩選輸入的未經標示原始數據去尋找出被稱為潛在因子的通用模式或代表性的特性,例如這類人工智能可處理一些未經任何標示的臉部圖片,而辨認出主要特徵包括眼睛的顏色、眉型、鼻型及笑容。
由於深度學習平台MAUI 能夠分析多層數據组並辨認出最相關的模式或特性,在這個事例指遺傳基因組或引起結直腸癌的途徑。
重新分類亞型
MAUI能辨認出跟四種已確立的結直腸癌亞型相關的模式,極準確地將腫瘤歸類到其亞型。還有一個有趣的發現,這個平台發現一個模式指出亞型 (CMS2) 可能需要分成2個獨立的組別。這腫瘤有不同的機制及存活率。研究團隊建議跟進調查以核實這亞型是獨特的或可能代表腫瘤擴散。這顯示平台有能力處理所有數據及作出深刻的見解,而不單是已知跟疾病有關的遺傳基因。
Akalin 表示數據科學能處理繁複的數據,這是其他方法很難做到及詮釋清楚。你能輸入所有跟腫瘤有關的資料從而找出有意義的模式。
Akalin 和Ronen討論研究結果
圖片來源: Felix Petermann,MDC(網上)
更快、更好
這程式不單更準確,它處理的速度比其他機器學習人工智能更快 – 3分鐘查找出100種模式相比其他程式要11小時20分鐘。
據研究的主作者Johnathan Ronen 表示它能用對計算機來說很短的時間去學習幾何數的潛在因子。
研究團隊很驚訝系統處理速度如此快速,特別是無需使用圖像晶片(GPUs) 去加快計算速度。這顯示人工智能已極度優化,儘管他們還在持續優化系統。
改善藥物研發
他們的團隊包括Bayer AG 計算生物學家Sikander Hayat採納這系統去分析從腫瘤提取並在實驗室培植的細胞株去研究潛在藥物治療的有效性。但細胞株在分子層面跟真正的腫瘤有很多方面的差異。研究團隊使用MAUI去比對現時用於結直腸藥物測試的細胞株跟真正的腫瘤有多相似。發現接近一半的細胞株跟其他細胞株比跟真正腫瘤更相類。只有很少數量的細胞株最接近結直腸腫瘤及最能代表不同結直腸腫瘤類型。
雖然藥物研發已不再使用細胞株,這些見解能最大化細胞株研究的潛在影響及採納作為其他基因類藥物測試的工具。
谷歌用於腫瘤
現在用於結直腸腫瘤的深度學習平台已經建立,它能用於分析新病患的數據。
Akalin 表示可將這想像成一個搜索引擎。
一個臨床醫師可以將新病患的遺傳基因數據輸入MAUI 尋找相近數據以更快及更準確將腫瘤分類。這平台能建議什麼藥物曾用於相似腫瘤及效果如何,從而幫忙預估藥物效果及存活前景。
現在只有等醫生嘗試過已建立的模式後,才能用於研究設定。Akalin 表示要讓這些測試或系統批准作臨床使用,還有相當遙遠的路要走。研究團隊通過 TheBerlin Institute of Health’s Digital Health Accelarator Program幫忙探索商業化的可能性。他們也在嘗試採納MAUI 用於其他癌症。
J. Wong / 癌症資訊網