
【轉發】DeepMind發布了一款利用DNA測序數據來預測基因表達的工具Enformer,可能會對遺傳學領域產生深遠影響
Transformer要逆天啊:DeepMind發布了一款利用DNA測序數據來預測基因表達的工具Enformer,可能會對遺傳學領域產生深遠影響。
當人類基因組計劃成功地繪制出人類的DNA序列時,研究人員為有機會更好地了解影響人類健康和發展的遺傳指令而感到興奮。DNA攜帶著決定一切的基因信息,從眼睛的顏色到對某些疾病的易感性。人類體內大約有2萬個被稱為基因的DNA片段。
然而,這些被繪制的基因只占基因組的不到2%。剩下的堿基對——占基因組30億個“字母”的98%——被稱為“非編碼”,包含關于基因應該在人體中何時何地產生或表達的不太為人所知的指令。
科學家們想要了解DNA突變是如何發生在距離不同基因很近和很遠的地方,從而改變細胞內的RNA表達,最終影響蛋白質。目前最先進的預測基因表達的工具,都是基于卷積神經網絡CNN的,但是卷積核的局部性限制了網絡中遠端神經元之間的信息交流。
Transformer架構已經證明了在自然語言處理NLP中特別適合處理長段落的文本,DeepMind開發者對其進行了改造,使其能夠“閱讀”大量擴展的DNA序列。最新的網絡將神經元視野擴大了5倍以上,可以綜合處理超20萬個堿基對的相互作用,從而可以模擬被稱為增強子(Enhancer)的重要調控元件對更遠的DNA序列中的基因表達的影響,結果把基因表達預測的準確性提高了三分之一。
人類還遠遠沒有解決基因組中的謎題,但Enformer在理解基因組序列的復雜性方面邁出了重要一步。未來使用人工智能來探索基本的細胞過程如何工作,它們如何在DNA序列中編碼,以及如何建立新的系統來推進基因組學和對疾病的理解,將有助于臨床研究更精確地了解DNA突變如何影響健康和疾病。
https://xueqiu.com/1039527614/199855086
當人類基因組計劃成功地繪制出人類的DNA序列時,研究人員為有機會更好地了解影響人類健康和發展的遺傳指令而感到興奮。DNA攜帶著決定一切的基因信息,從眼睛的顏色到對某些疾病的易感性。人類體內大約有2萬個被稱為基因的DNA片段。
然而,這些被繪制的基因只占基因組的不到2%。剩下的堿基對——占基因組30億個“字母”的98%——被稱為“非編碼”,包含關于基因應該在人體中何時何地產生或表達的不太為人所知的指令。
科學家們想要了解DNA突變是如何發生在距離不同基因很近和很遠的地方,從而改變細胞內的RNA表達,最終影響蛋白質。目前最先進的預測基因表達的工具,都是基于卷積神經網絡CNN的,但是卷積核的局部性限制了網絡中遠端神經元之間的信息交流。
Transformer架構已經證明了在自然語言處理NLP中特別適合處理長段落的文本,DeepMind開發者對其進行了改造,使其能夠“閱讀”大量擴展的DNA序列。最新的網絡將神經元視野擴大了5倍以上,可以綜合處理超20萬個堿基對的相互作用,從而可以模擬被稱為增強子(Enhancer)的重要調控元件對更遠的DNA序列中的基因表達的影響,結果把基因表達預測的準確性提高了三分之一。
人類還遠遠沒有解決基因組中的謎題,但Enformer在理解基因組序列的復雜性方面邁出了重要一步。未來使用人工智能來探索基本的細胞過程如何工作,它們如何在DNA序列中編碼,以及如何建立新的系統來推進基因組學和對疾病的理解,將有助于臨床研究更精確地了解DNA突變如何影響健康和疾病。
https://xueqiu.com/1039527614/199855086
1 個回復
贊同來自:
要回復問題請先登錄或注冊