您現在位於 - 綜合外電
|
谷歌研發一款深度學習模型 能預測長達100萬堿基對的DNA序列的功能
【記者林孟論/外電報導】國際學術期刊《自然》最新發表一篇基因組學論文稱,谷歌研究團隊研發的一款深度學習模型AlphaGenome,能預測長達100萬堿基對的DNA序列的功能。
研究團隊認為,基於能預測DNA序列變異如何影響不同生物過程,AlphaGenome可用於理解遺傳疾病、改進基因檢測,並為開發新療法提供信息。
該論文介紹,基因變異會影響生物學過程並可能引發疾病,但理解DNA序列變化如何影響其功能是個難題,大多數變化(約98%)發生於非編碼區域(不編碼蛋白質但影響基因表達的DNA區域),使得預測其影響變得困難,要解決這一問題需要計算模型,現有的方法在序列長度和預測強度上必須做出取捨,但AlphaGenome能在長DNA序列中做出高分辨率預測。
在本項研究中,谷歌DeepMind團隊展示了AlphaGenome的能力,這一深度學習模型用人類和小鼠基因組訓練來學習DNA序列如何影響不同生物學過程,AlphaGenome可以即時預測5930種人類或1128種小鼠遺傳信號,這些信號與特定功能有關,如基因表達、剪接(基因組的切割與重組)和蛋白質修飾,在26項變異效果預測評估中,其結果在25項中與現有頂尖模型表現相當或更優,因此,該模型優勢在於能同時對多種遺傳信號和生物學結果進行多重預測。
研究團隊總結表示,進一步改進這一工具或能拓展其應用,例如增加涵蓋的物種,或拓展模型能識別的非編碼序列範圍,未來,AlphaGenome有望深化對DNA序列變異引發的複雜生物學結果的理解。
↑圖說:本項研究的AlphaGenome工作原理示意圖(圖片來自谷歌DeepMind)(施普林格·自然供圖)。
|
|
|
|