Google 機器學習的應用在科學探索上愈來愈多元,在人工無法處理龐大資料時,利用機器學習快速完成目的,包括利用機器學習找到人工無法發現的 Kepler-90i 及 Kepler-80g 新行星,以及開發 DeepVariant 開源工具,提高基因組測序準確性,以利於找出疾病原因等等。
天文學:發現 Kepler-90i 及 Kepler-80g 新行星
致力於尋找系外行星的克卜勒任務(Kepler mission),於 2009 年 5 月開始,天文學家透過人工的方式,檢查超過 30,000 萬個透過克卜勒太空望遠鏡所偵測到的訊號中,約有 2,500 個訊號被認定為行星。不過,仍有許多較弱的訊號參雜太多雜訊,無法以人工判別是否為行星,但透過 Google 機器學習的模型運算,從龐大的數據庫中再分析找出 2 顆漏網的行星,分別為 Kepler-90i 及 Kepler-80g。
Google 是將機器學習中的神經網路運算套用在探索行星中,透過卷積神經網路(convolutional neural network)來預測及偵測其人工無法判斷的微弱訊號中,可能為行星的機率,進而找到 Kepler-90i 及 Kepler-80g,而 卷積神經網路通常用於圖像分類,例如一般人較熟悉的 Google 相簿。目前已知 Kepler-90i 為岩石行星,是在 Kepler-90 星系中第八個被發現的行星,溫度大約為 400 度,圍繞著母恆星 Kepler-90 運轉,而 Kepler-90 星系更是目前已知第一個與我們所處的太陽系同樣擁有 8 顆行星數的星系。至於Kepler-80g 是 Kepler-80 恆星系統的第 6 顆行星,大小和地球相仿。
生命科學:提高基因組測序準確性
Google 機器學習除了在天文學上的應用外,生命科學的領域裡,Google Brain團隊與 Verily Life Sciences 合作,開發 DeepVariant 開源工具,目的是用來提高基因組測序準確性,分析任何有機體遺傳密碼中的訊息,可幫助許多目前無法解決的病例,例如當新生兒發生無法解釋的疾病時,可利用基因組測序來尋找可能的原因。
而 DeepVariant 在運作上,會將測序儀所讀到的數據編碼為圖像格式,接著利用圖像分類演算法,運算出準確的變體識別(Variant Calling),而所謂變體識別是透過個體與參考基因組之間的差異,是找出差異性的第一步,但不表示一個變體即為產生疾病,確可做為許多醫療和藥物開發的參考。
未來,DeepVariant 將應用到人類以外的生物上,根據目前初步研究中發現,在其他動植物上的變體識別,也有很高的準確率,例如老鼠、米,而這也表示 DeepVariant 可以應用在農業或其他的生物研究上,或是與更多臨床驗證的合作,藉由結合基因組測序資料,以及實際的臨床結果與病史,一步驗證 DeepVariant 的準確性以及對於衍生應用的幫助。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!