用于預(yù)測(cè)基因調(diào)控未來(lái)演變的DNA預(yù)言機(jī)
研究人員設(shè)計(jì)了一種神經(jīng)網(wǎng)絡(luò)模型,能夠預(yù)測(cè)酵母中非編碼 DNA 序列的變化如何影響基因表達(dá)和生殖適應(yīng)性。該模型創(chuàng)建了稱為健身景觀的地圖,此處顯示并以化石鳥(niǎo)類和魚(yú)類的形狀呈現(xiàn)。這些高階生物是由于非編碼 DNA 序列的進(jìn)化變化而進(jìn)化的,就像健康景觀中描繪的那樣。來(lái)源:馬丁·克日溫斯基
研究人員創(chuàng)建了一個(gè)數(shù)學(xué)框架來(lái)檢查基因組并檢測(cè)自然選擇的特征,破譯非編碼DNA的進(jìn)化過(guò)去和未來(lái)。
盡管每個(gè)人類細(xì)胞都包含大量基因,但這些所謂的“編碼”DNA序列僅占我們整個(gè)基因組的 1%。剩下的 99% 由“非編碼”DNA 組成——與編碼 DNA 不同,它不攜帶構(gòu)建蛋白質(zhì)的指令。
這種非編碼 DNA(也稱為“調(diào)節(jié)性”DNA)的一個(gè)重要功能是幫助打開(kāi)和關(guān)閉基因,控制蛋白質(zhì)的制造量(如果有的話)。隨著時(shí)間的推移,隨著細(xì)胞復(fù)制它們的 DNA 以生長(zhǎng)和分裂,這些非編碼區(qū)域經(jīng)常會(huì)出現(xiàn)突變——有時(shí)會(huì)調(diào)整它們的功能并改變它們控制基因表達(dá)的方式。許多這些突變是微不足道的,有些甚至是有益的。但有時(shí),它們可能與常見(jiàn)疾?。ㄈ?2 型糖尿?。┗蚋<吧募膊。òò┌Y)的風(fēng)險(xiǎn)增加有關(guān)。
為了更好地了解這些突變的影響,研究人員一直在努力研究數(shù)學(xué)圖譜,使他們能夠查看生物體的基因組,預(yù)測(cè)哪些基因?qū)⒈槐磉_(dá),并確定該表達(dá)將如何影響生物體的可觀察特征。這些被稱為適應(yīng)度景觀的地圖大約在一個(gè)世紀(jì)前被概念化,以了解基因構(gòu)成如何影響一種常見(jiàn)的有機(jī)體適應(yīng)度,特別是:繁殖成功率。早期的適應(yīng)環(huán)境非常簡(jiǎn)單,通常只關(guān)注有限數(shù)量的突變?,F(xiàn)在可以獲得更豐富的數(shù)據(jù)集,但研究人員仍然需要額外的工具來(lái)表征和可視化這些復(fù)雜的數(shù)據(jù)。這種能力不僅有助于更好地理解個(gè)體基因如何隨著時(shí)間的推移而進(jìn)化,
在 2022 年 3 月 9 日發(fā)表在《自然》雜志上的一項(xiàng)新研究中,一組科學(xué)家開(kāi)發(fā)了一個(gè)框架,用于研究調(diào)控 DNA 的適應(yīng)性景觀。他們創(chuàng)建了一個(gè)神經(jīng)網(wǎng)絡(luò)模型,當(dāng)對(duì)數(shù)億次實(shí)驗(yàn)測(cè)量進(jìn)行訓(xùn)練時(shí),該模型能夠預(yù)測(cè)酵母中這些非編碼序列的變化如何影響基因表達(dá)。他們還設(shè)計(jì)了一種以二維方式表示景觀的獨(dú)特方式,使其易于理解過(guò)去并預(yù)測(cè)酵母以外的生物中非編碼序列的未來(lái)演變——甚至為基因治療和工業(yè)應(yīng)用設(shè)計(jì)定制的基因表達(dá)模式。
KD-3368AM 全自動(dòng)電腦智能組織切片機(jī)
“我們現(xiàn)在有一個(gè)‘神諭’,可以詢問(wèn):如果我們嘗試了這個(gè)序列的所有可能突變?cè)趺崔k?或者,我們應(yīng)該設(shè)計(jì)什么樣的新序列來(lái)給我們想要的表達(dá)?”?麻省理工學(xué)院生物學(xué)教授(休假)、哈佛大學(xué)布羅德研究所和麻省理工學(xué)院的核心成員(休假)、基因泰克研究和早期開(kāi)發(fā)負(fù)責(zé)人、該研究的資深作者 Aviv Regev 說(shuō)?!翱茖W(xué)家們現(xiàn)在可以使用該模型解決他們自己的進(jìn)化問(wèn)題或場(chǎng)景,以及其他問(wèn)題,例如制作以所需方式控制基因表達(dá)的序列。我也對(duì)對(duì)可解釋性感興趣的機(jī)器學(xué)習(xí)研究人員的可能性感到興奮。他們可以反過(guò)來(lái)問(wèn)他們的問(wèn)題,以更好地了解潛在的生物學(xué)。”
在這項(xiàng)研究之前,許多研究人員只是簡(jiǎn)單地針對(duì)自然界中存在的已知突變(或其輕微變化)訓(xùn)練他們的模型。然而,Regev 的團(tuán)隊(duì)希望更進(jìn)一步,創(chuàng)建他們自己的無(wú)偏模型,該模型能夠基于任何可能的 DNA 序列——甚至是他們以前從未見(jiàn)過(guò)的序列,預(yù)測(cè)生物體的適應(yīng)性和基因表達(dá)。這也將使研究人員能夠使用這些模型來(lái)設(shè)計(jì)用于制藥目的的細(xì)胞,包括癌癥和自身免疫性疾病的新療法。
為了實(shí)現(xiàn)這一目標(biāo),麻省理工學(xué)院的研究生、共同第一作者、現(xiàn)任不列顛哥倫比亞大學(xué)助理教授卡爾·德布爾 (Carl de Boer) 和他們的同事創(chuàng)建了一個(gè)神經(jīng)網(wǎng)絡(luò)模型來(lái)預(yù)測(cè)基因表達(dá)。他們?cè)谕ㄟ^(guò)將數(shù)百萬(wàn)個(gè)完全隨機(jī)的非編碼 DNA 序列插入酵母中生成的數(shù)據(jù)集上對(duì)其進(jìn)行訓(xùn)練,并觀察每個(gè)隨機(jī)序列如何影響基因表達(dá)。他們專注于一個(gè)特定的非編碼 DNA 序列子集,稱為啟動(dòng)子,它作為蛋白質(zhì)的結(jié)合位點(diǎn),可以打開(kāi)或關(guān)閉附近的基因。
“這項(xiàng)工作強(qiáng)調(diào)了當(dāng)我們?cè)O(shè)計(jì)新的實(shí)驗(yàn)來(lái)生成正確的數(shù)據(jù)來(lái)訓(xùn)練模型時(shí)會(huì)帶來(lái)哪些可能性,”Regev 說(shuō)。“從更廣泛的意義上說(shuō),我相信這些方法對(duì)于許多問(wèn)題都很重要——比如了解調(diào)節(jié)區(qū)域中賦予人類基因組疾病風(fēng)險(xiǎn)的遺傳變異,以及預(yù)測(cè)突變組合的影響,或設(shè)計(jì)新分子。”
新研究: 光學(xué)顯微鏡200倍/400倍下可以看到直徑多大的顆粒物?
Regev、Vaishnav、de Boer 和他們的合著者繼續(xù)以各種方式測(cè)試他們模型的預(yù)測(cè)能力,以展示它如何幫助揭開(kāi)某些推動(dòng)者的進(jìn)化過(guò)去和可能的未來(lái)的神秘面紗。“創(chuàng)建一個(gè)準(zhǔn)確的模型當(dāng)然是一項(xiàng)成就,但對(duì)我來(lái)說(shuō),這實(shí)際上只是一個(gè)起點(diǎn),”Vaishnav 解釋說(shuō)。
首先,為了確定他們的模型是否有助于合成生物學(xué)應(yīng)用,例如生產(chǎn)抗生素、酶和食品,研究人員練習(xí)使用它來(lái)設(shè)計(jì)可以為任何感興趣的基因產(chǎn)生所需表達(dá)水平的啟動(dòng)子。然后,他們搜索了其他科學(xué)論文,以確定基本的進(jìn)化問(wèn)題,以查看他們的模型是否可以幫助回答這些問(wèn)題。該團(tuán)隊(duì)甚至為他們的模型提供了來(lái)自一項(xiàng)現(xiàn)有研究的真實(shí)世界人口數(shù)據(jù)集,其中包含來(lái)自世界各地酵母菌株的遺傳信息。通過(guò)這樣做,他們能夠描繪出數(shù)千年來(lái)塑造當(dāng)今酵母基因組的過(guò)去選擇壓力。
但是,為了創(chuàng)建一個(gè)可以探測(cè)任何基因組的強(qiáng)大工具,研究人員知道他們需要找到一種方法來(lái)預(yù)測(cè)非編碼序列的進(jìn)化,即使沒(méi)有如此全面的人口數(shù)據(jù)集。為了實(shí)現(xiàn)這一目標(biāo),Vaishnav 和他的同事設(shè)計(jì)了一種計(jì)算技術(shù),使他們能夠?qū)⒖蚣苤械念A(yù)測(cè)繪制到二維圖上。這幫助他們以非常簡(jiǎn)單的方式展示了任何非編碼 DNA 序列將如何影響基因表達(dá)和適應(yīng)性,而無(wú)需在實(shí)驗(yàn)室工作臺(tái)上進(jìn)行任何耗時(shí)的實(shí)驗(yàn)。
“健身景觀中一個(gè)未解決的問(wèn)題是,我們沒(méi)有一種方法可以將它們可視化,從而有意義地捕捉序列的進(jìn)化特性,”Vaishnav 解釋說(shuō)?!拔艺娴暮芟胝业揭环N方法來(lái)填補(bǔ)這一空白,并為創(chuàng)建完整健身景觀的長(zhǎng)期愿景做出貢獻(xiàn)。”
未參與這項(xiàng)研究的愛(ài)丁堡大學(xué)醫(yī)學(xué)研究委員會(huì)人類遺傳學(xué)部門(mén)遺傳學(xué)教授馬丁泰勒表示,這項(xiàng)研究表明,人工智能不僅可以預(yù)測(cè)調(diào)控 DNA 變化的影響,還可以揭示潛在的原理。支配著數(shù)百萬(wàn)年的進(jìn)化。
盡管該模型僅在少數(shù)生長(zhǎng)條件下對(duì)一小部分酵母調(diào)節(jié) DNA 進(jìn)行了訓(xùn)練,但他印象深刻的是,它能夠?qū)Σ溉閯?dòng)物基因調(diào)控的進(jìn)化做出如此有用的預(yù)測(cè)。
“有明顯的近期應(yīng)用,例如在釀造、烘焙和生物技術(shù)中為酵母定制調(diào)控 DNA,”他解釋道?!暗@項(xiàng)工作的擴(kuò)展還可以幫助識(shí)別人類調(diào)節(jié) DNA 中的疾病突變,這些突變目前在臨床上很難找到并且在很大程度上被忽視了。這項(xiàng)工作表明,在更豐富、更復(fù)雜、更多樣化的數(shù)據(jù)集上訓(xùn)練的基因調(diào)控人工智能模型有著光明的未來(lái)?!?/p>
甚至在該研究正式發(fā)表之前,Vaishnav 就開(kāi)始收到其他研究人員的詢問(wèn),希望使用該模型設(shè)計(jì)用于基因治療的非編碼 DNA 序列。
“幾十年來(lái),人們一直在研究監(jiān)管演變和健康狀況,”Vaishnav 說(shuō)?!拔艺J(rèn)為我們的框架將在回答有關(guān)基因調(diào)控 DNA 的進(jìn)化和可進(jìn)化性的基本、開(kāi)放性問(wèn)題方面大有幫助——甚至可以幫助我們?cè)O(shè)計(jì)用于令人興奮的新應(yīng)用的生物序列。”
參考:
Eeshit Dhaval Vaishnav、Carl G. de Boer、Jennifer Molinet、Moran Yassour、Lin Fan、Xian Adiconis、Dawn A. Thompson、Joshua Z. Levin、Francisco A. Cubillos 和 Aviv Regev,2022 年 3 月 9 日,《自然》。
DOI: 10.1038/s41586-022-04506-6
類似內(nèi)容推薦
- 對(duì)生物合成的新見(jiàn)解:藍(lán)藻如何進(jìn)化它們的光合機(jī)制
- 綠色化學(xué)和生物燃料:關(guān)鍵光酶的解密機(jī)制
- 科學(xué)家在DNA中構(gòu)建生物閥門(mén)以控制細(xì)胞信息流
- 科普時(shí)間:什么是系統(tǒng)生物學(xué)?
- 海洋微生物可在食物稀缺時(shí)巧妙地合作收集食物
- 華威大學(xué)研究人員發(fā)現(xiàn)了一種將細(xì)菌轉(zhuǎn)換為化學(xué)生產(chǎn)模式的廉價(jià)方法
- 新發(fā)現(xiàn)表明人類細(xì)胞可以將RNA序列寫(xiě)入DNA
- 新基因治療方法可用于各種電性心臟病和疾病
- 科學(xué)家驚訝地發(fā)現(xiàn)致命基因已從無(wú)害生物轉(zhuǎn)變?yōu)橹旅≡w
- 基因分析揭示了無(wú)吸煙史人群肺癌的起源
- 麻省理工學(xué)院生物學(xué)家確定癌癥疫苗的新靶點(diǎn)
- 科學(xué)家首次對(duì)人類基因組進(jìn)行了完整測(cè)序
- 基因測(cè)序的飛躍將導(dǎo)致改進(jìn)的個(gè)性化醫(yī)學(xué)和對(duì)進(jìn)化的理解
- 能夠感應(yīng)和改變細(xì)胞生物電場(chǎng)的納米級(jí)分子裝置首次問(wèn)世
- 科學(xué)家從6000萬(wàn)年前的細(xì)菌中捕獲新DNA修飾系統(tǒng)
- 新型神經(jīng)網(wǎng)絡(luò)模型可預(yù)測(cè)DNA序列變化
- 天體生物學(xué)研究可預(yù)測(cè)未知外星生命
- 生物進(jìn)化之美:為什么大自然中的生物會(huì)往對(duì)稱方向進(jìn)化?
- 另類DNA結(jié)構(gòu)可能會(huì)推動(dòng)癌癥治療的發(fā)展
- 與嗅覺(jué)有關(guān)的基因可能在乳腺癌向大腦的傳播中發(fā)揮作用
版權(quán)屬于:景通儀器 - 國(guó)內(nèi)領(lǐng)先的顯微鏡與顯微數(shù)字成像解決方案供應(yīng)商
轉(zhuǎn)載時(shí)必須以鏈接形式注明作者和原始出處及本聲明。
本文地址:http://www.nrrfnfr.cn/blog/3289/