高度發展的人類擁有成千上萬組基因,無數種可能組合呈現出了你我獨一無二的樣貌與特徵。但是,為這些基因進行研究的科學家們,長期以來卻被一項大問題所困擾,那就是試算表軟體 Microsoft Excel。
為了對基因進行詳細的研究跟了解,同時也便於學界稱呼跟識別,科學家為每個基因都給予了一個由英文字母跟數字所組成的名稱,在學界也被稱呼為「符號」(Symbol)。
在過去一年時間以來,總共有 27 個人類基因符號,獲得科學家重新進行命名,但是其原因並非定義不準確或違反學界規則,而是由於 Microsoft Excel 不斷將這些「基因符號」誤讀為「日期」。
Microsoft Excel 是套主流的試算表軟體,當然科學家也會拿它來進行工作,但很顯然微軟沒有想到,這款面向大眾消費者的軟體,居然會對科學研究造成困擾。
舉例來說,當科學家在 Microsoft Excel 的表格中輸入「MARCH1」,也就是「Membrane Associated Ring-CH-Type Finger 1」,一組跟人類手指有關的基因符號時,Excel 會自動將其識別為「日期」的 March 1,轉換成 3 月 1 日進行呈現。
一名英國 Quadram 研究所的系統生物學家 DezsőMódos 向媒體表示,這雖然不能算是 Microsoft Excel 的 Bug,但它真的非常煩人。更糟糕的是,Microsoft Excel 自動把基因符號轉換成日期的「好意」行為,甚至影響到相關論文的同儕審查工作。
根據 2016 年的一項研究,科學家檢查了 3,597 篇已發表論文中的遺傳數據,卻赫然發現有大約五分之一的基因符號,竟然受到了 Excel 錯誤的影響,為科學精準性帶來了相當程度的威脅。
身為一套成熟的試算表軟體,照理來說 Microsoft Excel 應該有相當簡單的解決辦法,能夠提供給苦惱的科學家。但是,眾所周知 Excel 並不提供關閉自動格式轉換的選項,科學家只能在鍵入文字之後,手動修改資料形態,讓基因符號以純文字方式呈現。
上述這種已經很麻煩的處理方法,卻仍然有一個顯而易見的缺點。假設科學家並不是個操作 Microsoft Excel 的能手,那麼在開啟同行傳來的試算表時,若忘記進行轉換,那麼這些基因符號終究還是會以日期的方式,顯示於表格之中。
考慮到 Microsoft Excel 並非科學家專用的軟體,負責基因命名的國際人類基因組組織(HUGO)旗下,人類基因組組織基因命名委員會(HGNC),決定用一個最直截了當的方式來解決問題,那就是把會影響數據處理和檢索的基因符號,用有規則的方式重新命名。
舉例來說,前面提過的「MARCH1」現在已重新更名為「MARCHF1」,而「SEPT1」則已變為「SEPTIN1」,這樣一來當科學家於 Microsoft Excel 中輸入文字時,就不會自動被轉換成日期。
事實上,基因更名在科學界也並非先例。在過去,CARS 也曾變更為 CARS1,WARS 也更改成了 WARS1,至於 MARS 則調整為 MARS1,但它們的更名理由是為了避免侮辱詞或常用詞,並非是為了某套特定的電腦軟體。
HGNC 表示,截至目前為止,有 27 個基因符號獲得更加友善的名稱。且為了避免將來造成識別上的混亂,所以官方也在資料庫中,同時保留了舊的基因符號與更名記錄。
遺傳學家 Janna Hutz 在 Twitter 上分享了 HGNC 重新命名的做法後,科學家社群間的反應異常活躍,她說國際人類基因組組織的選擇「令人震驚」,但也有科學家興奮表示「終於改了!」,甚至有人指稱,這真的是當天最重要也最大條的新聞。
參考來源:The Verge
想看小編精選的3C科技情報&實用評測文,快來加入《T客邦》LINE@
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!