科學(xué)家們終于對完整的人類基因組進行了測序——并揭示了新的遺傳秘密
對人類基因組最后 8% 的測序花費了 20 年時間,發(fā)明了讀取遺傳密碼長序列的新技術(shù),該序列由核苷酸 C、T、G 和 A 組成。整個基因組包含超過 30 億個核苷酸。圖片來源:Ernesto del Aguila III,NHGRI
著絲粒周圍的重復(fù)DNA序列顯示了人類遺傳變異的歷史。
當(dāng)科學(xué)家在 2003 年公布人類基因組的完整序列時,他們有點捏造。
事實上,近 20 年后,大約 8% 的基因組從未被完全測序,主要是因為它由高度重復(fù)的 DNA 塊組成,很難與其余部分對齊。
但一個成立三年的聯(lián)盟終于填補了剩余的 DNA,為科學(xué)家和醫(yī)生提供了第一個完整的、無間隙的基因組序列供參考。
新完成的基因組被稱為 T2T-CHM13,代表了當(dāng)前參考基因組 GRCh38 的重大升級,醫(yī)生在尋找與疾病相關(guān)的突變時使用該參考基因組,以及研究人類遺傳變異進化的科學(xué)家使用。
除其他外,新的 DNA 序列揭示了著絲粒周圍區(qū)域的前所未有的細(xì)節(jié),這是細(xì)胞分裂時染色體被抓住并拉開的地方,確保每個“子”細(xì)胞繼承正確數(shù)量的染色體。該地區(qū)的變異性也可能為我們?nèi)祟愖嫦热绾卧诜侵捱M化提供新的證據(jù)。
“發(fā)現(xiàn)這些以前缺失的基因組區(qū)域的完整序列告訴了我們很多關(guān)于它們是如何組織的,這對于許多染色體來說是完全未知的,”加州大學(xué)伯克利分校的博士后研究員 Nicolas Altemose 說。四篇關(guān)于完整基因組的新論文的合著者。“以前,我們只是對那里的東西有最模糊的了解,而現(xiàn)在它已經(jīng)清晰到單堿基對分辨率?!?/p>
Altemose 是一篇描述著絲粒周圍堿基對序列的論文的第一作者。一篇解釋測序是如何完成的論文將出現(xiàn)在 4 月 1 日的《科學(xué)》雜志印刷版中,而Altemose 的著絲粒論文和其他四篇描述新序列告訴我們的內(nèi)容的論文在期刊中進行了總結(jié),全文發(fā)布在網(wǎng)上。四篇配套論文,包括一篇由 Altemose 為共同第一作者的論文,也將于 4 月 1 日在線發(fā)表在Nature Methods雜志上。
測序和分析是由一個 100 多人的團隊進行的,即所謂的Telemere-to-Telomere Consortium或 T2T,以覆蓋所有染色體末端的端粒命名。該聯(lián)盟的所有 22 個常染色體和 X 性染色體的無間隙版本由 30.55 億個堿基對(構(gòu)建染色體和我們的基因的單位)和 19,969 個蛋白質(zhì)編碼基因組成。在蛋白質(zhì)編碼基因中,T2T 團隊發(fā)現(xiàn)了大約 2,000 個新的基因,其中大多數(shù)被禁用,但其中 115 個可能仍被表達。他們還在人類基因組中發(fā)現(xiàn)了大約 200 萬個額外變異,其中 622 個發(fā)生在醫(yī)學(xué)相關(guān)基因中。
“將來,當(dāng)某人對他們的基因組進行測序時,我們將能夠識別他們 DNA 中的所有變體,并利用這些信息更好地指導(dǎo)他們的醫(yī)療保健,”T2T 的負(fù)責(zé)人之一、高級研究員 Adam Phillippy 說。美國國立衛(wèi)生研究院國家人類基因組研究所(NHGRI)的研究員?!罢嬲瓿扇祟惢蚪M序列就像戴上一副新眼鏡?,F(xiàn)在我們可以清楚地看到一切,我們離理解這一切意味著什么又近了一步?!?/p>
進化著絲粒
著絲粒內(nèi)和周圍的新 DNA 序列總計約占整個基因組的 6.2%,或近 1.9 億個堿基對或核苷酸。在其余新添加的序列中,大多數(shù)位于每條染色體末端的端粒周圍和核糖體基因周圍的區(qū)域。整個基因組僅由四種核苷酸組成,它們以三種為一組,編碼用于構(gòu)建蛋白質(zhì)的氨基酸。Altemose 的主要研究包括尋找和探索蛋白質(zhì)與 DNA 相互作用的染色體區(qū)域。
在細(xì)胞分裂過程中將染色體拉開的紡錘體(綠色)附著在一種稱為動粒的蛋白質(zhì)復(fù)合體上,該復(fù)合體在稱為著絲粒的位置鎖定在染色體上——著絲粒是一個包含高度重復(fù) DNA 序列的區(qū)域。比較這些重復(fù)序列的序列揭示了突變累積了數(shù)百萬年的位置,反映了每個重復(fù)序列的相對年齡。活躍著絲粒中的重復(fù)序列往往是該區(qū)域中最年輕和最近重復(fù)的序列,并且它們的 DNA 甲基化程度非常低。在兩側(cè)活躍著絲粒周圍是較老的重復(fù),可能是以前著絲粒的遺跡,最古老的著絲粒離活躍著絲粒最遠(yuǎn)。研究人員希望新的實驗方法能夠幫助揭示為什么著絲粒從中間進化,以及為什么這種模式與動粒結(jié)合和低 DNA 甲基化密切相關(guān)。學(xué)分:加州大學(xué)伯克利分校的 Nicolas Altemose
發(fā)現(xiàn): 蛋白質(zhì)控制在帕金森病中出錯的線粒體裂變過程
“沒有蛋白質(zhì),DNA 就什么都不是,”獲得博士學(xué)位的 Altemose 說。在獲得博士學(xué)位后,于 2021 年從加州大學(xué)伯克利分校和加州大學(xué)舊金山分校聯(lián)合獲得生物工程博士學(xué)位。牛津大學(xué)統(tǒng)計學(xué)專業(yè)?!癉NA 是一組指令,如果周圍沒有蛋白質(zhì)來組織、調(diào)節(jié)、修復(fù)受損并復(fù)制它,就沒有人可以閱讀它。蛋白質(zhì)-DNA相互作用確實是基因組調(diào)控的所有作用發(fā)生的地方,能夠繪制出某些蛋白質(zhì)與基因組結(jié)合的位置對于理解它們的功能非常重要?!?/p>
在 T2T 聯(lián)盟對丟失的 DNA 進行測序后,Altemose 和他的團隊使用新技術(shù)在著絲粒內(nèi)找到了一個稱為動粒的大蛋白質(zhì)復(fù)合物牢固地抓住染色體的位置,以便細(xì)胞核內(nèi)的其他機器可以將染色體對分開。
“當(dāng)出現(xiàn)問題時,你最終會得到錯誤分離的染色體,這會導(dǎo)致各種問題,”他說?!叭绻@種情況發(fā)生在減數(shù)分裂中,這意味著你的染色體異??赡軙?dǎo)致自然流產(chǎn)或先天性疾病。如果它發(fā)生在體細(xì)胞中,你最終可能會患上癌癥——基本上,細(xì)胞有大量的失調(diào)。”
他們在著絲粒內(nèi)和周圍發(fā)現(xiàn)的是新序列層覆蓋著舊序列層,好像通過進化,新的著絲粒區(qū)域被反復(fù)放置以與著絲粒結(jié)合。較老的區(qū)域的特征是更多的隨機突變和缺失,表明它們不再被細(xì)胞使用。動粒結(jié)合的較新序列的可變性要小得多,而且甲基化程度也較低。甲基的添加是一種表觀遺傳標(biāo)簽,傾向于使基因沉默。
著絲粒內(nèi)部和周圍的所有層都由重復(fù)長度的 DNA 組成,基于一個大約 171 個堿基對長的單位,這大致是纏繞一組蛋白質(zhì)形成核小體的 DNA 長度,保持 DNA 包裝和緊湊。這 171 個堿基對單元形成了更大的重復(fù)結(jié)構(gòu),這些重復(fù)結(jié)構(gòu)串聯(lián)重復(fù)多次,在著絲粒周圍形成了一個大的重復(fù)序列區(qū)域。
T2T 團隊只關(guān)注一個人類基因組,該基因組是從一種稱為葡萄胎的非癌性腫瘤中獲得的,該腫瘤本質(zhì)上是一個拒絕母體 DNA 并復(fù)制其父系 DNA 的人類胚胎。這樣的胚胎死亡并轉(zhuǎn)化為腫瘤。但事實上,這顆痣有兩個相同的父親 DNA 拷貝——都帶有父親的 X 染色體,而不是來自母親和父親的不同 DNA——這使得測序變得更容易。
研究人員本周還發(fā)布了來自不同來源的 Y 染色體的完整序列,該序列的組裝時間幾乎與基因組其余部分的總和一樣長,Altemose 說。對這一新 Y 染色體序列的分析將出現(xiàn)在未來的出版物中。
當(dāng)研究人員比較來自世界各地的 1,600 人的著絲粒區(qū)域時,他們發(fā)現(xiàn)那些沒有近期非洲血統(tǒng)的人大多具有兩種類型的序列變異。這兩種變化的比例由圓圈內(nèi)的黑色和淺灰色楔形表示,它們位于地圖上每組個體被采樣的位置附近。那些來自非洲或其他有很大比例的人最近有非洲血統(tǒng)的地區(qū),如加勒比地區(qū),有更多的著絲粒序列變異,以多色楔形為代表。這種變異可以幫助追蹤著絲粒區(qū)域如何進化,以及這些遺傳變異如何與健康和疾病相關(guān)。學(xué)分:加州大學(xué)伯克利分校的 Nicolas Altemose
Altemose 和他的團隊,包括加州大學(xué)伯克利分校項目科學(xué)家 Sasha Langley,也使用新的參考基因組作為支架來比較來自世界各地的 1,600 個人的著絲粒 DNA,揭示了周圍重復(fù) DNA 的序列和拷貝數(shù)的主要差異著絲粒。先前的研究表明,當(dāng)一群古代人類從非洲遷移到世界其他地方時,他們只帶走了一小部分基因變異樣本。Altemose 和他的團隊證實這種模式延伸到著絲粒。
“我們發(fā)現(xiàn),在最近有非洲大陸以外血統(tǒng)的個體中,他們的著絲粒,至少在 X 染色體上,傾向于分成兩個大簇,而大多數(shù)有趣的變異發(fā)生在最近有非洲血統(tǒng)的個體中,”Altemose說過。“鑒于我們對基因組其余部分的了解,這并不完全令人驚訝。但它表明,如果我們想研究這些著絲粒區(qū)域的有趣變異,我們真的需要集中精力對更多的非洲基因組進行測序,并完成端粒到端粒的序列組裝?!?/p>
他指出,著絲粒周圍的 DNA 序列也可用于將人類譜系追溯到我們共同的猿祖先。
“當(dāng)你離開活躍著絲粒的位置時,你會得到越來越多的退化序列,以至于如果你走到這片重復(fù)序列海洋的最遠(yuǎn)海岸,你就會開始看到古老的著絲粒,也許,我們遙遠(yuǎn)的靈長類動物祖先曾經(jīng)與動粒結(jié)合,”Altemose 說?!斑@幾乎就像一層層的化石?!?/p>
長讀測序改變游戲規(guī)則
T2T 的成功歸功于改進的一次測序長 DNA 片段的技術(shù),這有助于確定高度重復(fù)的 DNA 片段的順序。其中包括 PacBio 的 HiFi 測序,可讀取長度超過 20,000 個堿基對,準(zhǔn)確率高。另一方面,由 Oxford Nanopore Technologies Ltd. 開發(fā)的技術(shù)可以按順序讀取多達數(shù)百萬個堿基對,但保真度較低。相比之下,Illumina Inc. 所謂的下一代測序僅限于數(shù)百個堿基對。
完成人類基因組序列需要 20 年的原因之一是:我們的大部分 DNA 都極其重復(fù)。信用:信息圖由 NHGRI、NIH 提供
“這些新的長讀長 DNA 測序技術(shù)簡直令人難以置信;它們是這樣的游戲規(guī)則改變者,不僅因為這個重復(fù)的 DNA 世界,而且因為它們允許你對單個長 DNA 分子進行測序,”Altemose 說?!澳梢蚤_始以前所未有的分辨率提出問題,即使使用短讀長測序方法也是如此?!?/p>
Altemose 計劃進一步探索著絲粒區(qū)域,使用他和斯坦福大學(xué)的同事開發(fā)的一種改進技術(shù)來確定染色體上與蛋白質(zhì)結(jié)合的位點,類似于動粒與著絲粒的結(jié)合方式。這種技術(shù)也使用了長讀長測序技術(shù)。他和他的團隊在本周發(fā)表在《自然方法》雜志上的一篇論文中描述了這項技術(shù),稱為長讀長測序定向甲基化 (DiMeLo-seq)?。
與此同時,T2T 聯(lián)盟正在與人類泛基因組參考聯(lián)盟合作,致力于打造代表全人類的參考基因組。
“我們應(yīng)該有一個代表每個人的參考,而不是僅僅從一個人類個體或一個葡萄胎(甚至不是真正的人類個體)獲得一個參考,”Altemose 說?!瓣P(guān)于如何實現(xiàn)這一點有各種各樣的想法。但我們首先需要掌握這種變異是什么樣子的,我們需要大量高質(zhì)量的個體基因組序列來實現(xiàn)這一點?!?/p>
他在著絲粒區(qū)域的工作,他稱之為“激情項目”,由博士后獎學(xué)金資助。T2T 項目的負(fù)責(zé)人是加州大學(xué)圣克魯茲分校的 Karen Miga、華盛頓大學(xué)的Evan Eichler和 NHGRI 的 Adam Phillippy,他們提供了大部分資金。著絲粒論文的其他加州大學(xué)伯克利分校的合著者是生物工程助理教授 Aaron Streets;Abby Dernburg 和 Gary Karpen,分子和細(xì)胞生物學(xué)教授;項目科學(xué)家 Sasha Langley;和前博士后研究員吉娜卡爾達斯。
類似內(nèi)容推薦
- 科學(xué)家在DNA中構(gòu)建生物閥門以控制細(xì)胞信息流
- 饑餓游戲:科學(xué)家揭開大腦中饑餓開關(guān)的秘密
- 科學(xué)家嘗試使用核磁共振波譜 (NMR)構(gòu)建SARS-CoV-2分子的三維結(jié)構(gòu)
- 研究人員已確定了一種控制細(xì)胞生長和存活的細(xì)胞通訊途徑
- 研究發(fā)現(xiàn)抗生素可以治療癌癥等人類疾病
- 新發(fā)現(xiàn)表明人類細(xì)胞可以將RNA序列寫入DNA
- 新診斷策略可用來作為帕金森病和其他突觸核蛋白病理治療
- 新基因治療方法可用于各種電性心臟病和疾病
- 科學(xué)家驚訝地發(fā)現(xiàn)致命基因已從無害生物轉(zhuǎn)變?yōu)橹旅≡w
- 新算法可以作為分析生物系統(tǒng)模型的更有效方法
- 科學(xué)家發(fā)現(xiàn)神經(jīng)免疫相互作用如何燃燒深層脂肪
- 基因分析揭示了無吸煙史人群肺癌的起源
- 科學(xué)家首次對人類基因組進行了完整測序
- 科學(xué)家實現(xiàn)了微磁體遠(yuǎn)程控制腦細(xì)胞
- 科學(xué)家們發(fā)現(xiàn)了變異的冠狀病毒蛋白復(fù)合物
- 基因測序的飛躍將導(dǎo)致改進的個性化醫(yī)學(xué)和對進化的理解
- 新型神經(jīng)網(wǎng)絡(luò)模型可預(yù)測DNA序列變化
- 科學(xué)家創(chuàng)造了由人類細(xì)胞制成的“時間機器”來逆轉(zhuǎn)胰腺癌的擴散
- 植物科學(xué)家在百里香和牛至等草藥中找到抗癌化合物的配方
- 與嗅覺有關(guān)的基因可能在乳腺癌向大腦的傳播中發(fā)揮作用
版權(quán)屬于:景通儀器 - 國內(nèi)領(lǐng)先的顯微鏡與顯微數(shù)字成像解決方案供應(yīng)商
轉(zhuǎn)載時必須以鏈接形式注明作者和原始出處及本聲明。
本文地址:http://www.nrrfnfr.cn/blog/3375/