世界上最大、最完整的人類基因組資料庫剛剛上線。
由美國能源部 (DOE) 和國家衛生研究院 (NIH) 在 1990 年共同主導展開的跨國性「人類基因體計劃 (Human Genome Project, HGP)」雖然已在 2003 年宣布完成,然而其實我們一直以來都沒有真正獲得過「完整的」人類基因體序列。當年研究團隊完成92%的人類基因體序列,也成為現今基因體研究的基石。
基因體是生物中所有遺傳訊息的組合,以人類來說,基因體中的遺傳密碼以染色體(chromosome)中的去氧核糖核酸(DNA)序列儲存,這些DNA 序列可以轉錄(transcribe)成核糖核酸(RNA),再進一步轉譯(translate)成蛋白質,決定生物的各式樣貌。
英國生物銀行,一個有關健康、基因組和其他生物資料的資訊資源庫,於11月30日發佈了50萬名英國志願者的全基因組序列。世界各地的研究人員都可以申請訪問這些缺乏可識別細節的資料,並利用它們來探索健康和疾病的遺傳基礎。
英國生物銀行首席執行長Rory Collins在新聞發佈會上表示:“當科學家想知道從生活方式、環境、基因到疾病的途徑是什麼時,他們不會去Google了,而是去英國生物銀行。”
2021年,英國生物銀行曾公開20萬名英國志願者的全基因組資料,供全世界科學家研究使用。這項耗資2億英鎊的研究由生物醫學研究基金惠康基金會、英國政府和幾家製藥公司資助,作為回報,這些公司在資料廣泛發佈前9個月便獲得了資料。
此前,英國生物銀行公佈的遺傳資訊包括整個“外顯子組”——每個外顯子組佔基因組的2%,負責編碼蛋白質,以及分佈在基因組中的85萬個常見的單鹼基DNA變異。後者的資訊為將健康和基因聯絡起來的全基因組關聯研究(GWAS)提供了動力。
但是,當研究人員尋找遺傳與疾病或其他性狀之間的關聯時,大多數“位點”出現在基因組的非編碼區域,這些區域在外顯子組序列中缺失,並且在現有的全基因組資料中僅以低解析度覆蓋。英國埃克塞特大學人類遺傳學家Michael Weedon說,全基因組還允許研究人員發現非常罕見的突變,這些突變往往比全基因組資料中包含的常見變異對某個性狀的影響更大。“我們希望罕見的變異能讓我們對生物學有更多的瞭解”。
事實已經證明了這一點。在11月20日發佈的預印本文章中,Weedon團隊挖掘了英國生物銀行公開的首批20萬個完整基因組資料,並行現了29種罕見的DNA變異,這些變異與高達7cm的身高差異有關,並且在以前的基因研究中從未被發現。
Weedon表示,最終,研究人員將需要50多萬個完整基因組來全面繪製罕見基因變異與健康之間的關係,這是獲得數百萬個樣本的良好開端。
一項由美國政府資助的名為“我們所有人”的研究,計畫最終公佈100萬或更多美國人的全基因組和健康資料。此前,這項工作已經公佈了25萬個基因組,但直到8月份才開始接受非美國研究人員的資料研究申請。研究人員表示,像“我們所有人”這樣的資料庫也將有助於確認與英國生物銀行相關資料發現的聯絡。
根據英國生物銀行之前公開的20萬個基因組資料瞭解到的情況,芬蘭赫爾辛基大學統計遺傳學家Andrea Ganna還不相信這些資料能帶來多大的回報。許多由全基因組研究發現的非編碼變異與通過GWAS已經發現的突變非常接近。
Ganna說,儘管如此,完整的基因組序列可能會幫助研究人員更準確地繪製出疾病與結構變異之間的聯絡,如缺失、多餘或翻轉的DNA片段。
Collins認為,英國生物銀行已經發表了9000多篇論文,最新發表論文的真正影響在一段時間內可能還不清楚。“我想,我們會驚訝地發現,有很多東西是我們甚至沒有想到的。”
- 延伸閱讀:Excel功能出包,迫使科學家必須重新命名人類基因!現在這個Bug被修復了
- 延伸閱讀:生命科學的「登月計畫」!科學家首次完成對整個人類基因組的完整定序
- 延伸閱讀:利用基因工程,科學家發明可以程式化的3D列印活體生物墨水!
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!