導(dǎo)讀 |
國立首爾大學(xué)醫(yī)學(xué)院的研究人員運用第三代測序PacBio單分子實時測序技術(shù)、GemCodeTM和BioNano等多個平臺以及在本期的Nature上發(fā)表了迄今為止最連續(xù)人類基因組,對一名韓國人的基因組(AK1)進行從頭組裝和單倍體型定相信息分析。
|
國立首爾大學(xué)醫(yī)學(xué)院的研究人員和美國被譽為“測序黑馬”的公司——10x Genomics聯(lián)合運用去年新發(fā)售的GemCodeTM測序平臺以及第三代測序PacBio單分子實時測序平臺在本期的Nature上發(fā)表了一項新的研究,對一名韓國人的基因組(AK1)進行從頭組裝和單倍體型定相信息分析。這是迄今為止發(fā)表的最為連續(xù)的人類基因組組裝。作者填補了特異人群參考基因組的空白,并確定了結(jié)構(gòu)變異。
該研究的顯著改進
這項工作提供了了到目前為止最鄰近的二倍體基因組裝配與之前未報道的亞洲特異結(jié)構(gòu)變異的廣泛調(diào)查。其優(yōu)質(zhì)的臨床相關(guān)的等位基因的單體型分析有著提高精準醫(yī)療的潛力。這對于目前基于歐洲人和白人人群的基因組分析方法,是一個顯著的改進。這個方法提高了從一個個體的短讀長序列比對形成到一個單倍體的一致性參考基因組的分析狀況,調(diào)整了通常無法捕捉到相對于個體基因組或種族人群屬于新序列的問題。
主要研究方法
GemCode平臺能夠與現(xiàn)有的短讀取測序儀互補,產(chǎn)生長片段信息(10-100 kb),實現(xiàn)結(jié)構(gòu)變異和單體型等分析。為了更全面了解結(jié)構(gòu)變異的范圍和更好地理解AK1二倍體基因組結(jié)構(gòu)的相,研究者對從PacBio單分子實時測序reads組裝得到的,每個染色體單倍型的裝配體——“haplotig”進行從頭組裝。除了PacBio長讀長測序,該研究還使用了Illumina短讀長測序、10X Genomics連接讀取、細菌人工染色體(BAC)測序和BioNano Genomics光學(xué)圖譜。Contig N50達到17.9Mb,Scaffold N50達到44.8Mb。
實驗設(shè)計及數(shù)據(jù)分析流程
數(shù)據(jù)上的提升
到目前為止該研究在之前最佳的N50長度上提高了18Mb,最大的91個scaffold覆蓋了基因組的90%,8個染色體的臂是由單個scaffold構(gòu)成的。研究人員用AK1的組裝序列補齊了在人類參考基因組GRCh38上的190個空缺中的105個,補齊的序列由364kb變成1.5Mb。另外也將剩下的85個空缺中的72個從663kb補充到4.1Mb。該研究鑒定到的18,210個結(jié)構(gòu)變異,包含7,358個刪除,10,077個插入,71個轉(zhuǎn)換和704個復(fù)雜變異,所有這些變異均在AK1組裝結(jié)果和人類參考基因組GRCh37之間進行了直接比較,達到了單堿基的分辨率。在18,210個結(jié)構(gòu)變異中,總共有11,927個變異是以前未曾報道的。
AK1 de novo assembly Scaffolds與GRCh38的數(shù)據(jù)結(jié)果進行比較
測序新技術(shù)的強大作用
這項研究的結(jié)果顯示了測序新技術(shù)在從頭基因組組裝和“真正的”二倍體定相方面的強大能力,可以用來檢測全方位的遺傳變異和了解臨床相關(guān)基因的單倍體的結(jié)構(gòu)。這項基因包括:主要組織相容性復(fù)合體(MHC)的人類白細胞抗原(HLA)的基因變異,對藥物基因組非常重要的CYP2D6基因,以及罕見的常染色體隱性遺傳疾病,如家族性地中海熱、Upshaw–Shalman綜合征中涉及到的基因。
該項研究的領(lǐng)導(dǎo)者,國立首爾大學(xué)醫(yī)學(xué)院的Jeong Sun Seo醫(yī)生說:“10x Genomics的GemCode平臺和有針對性的BAC克隆測序在這項研究中成功單倍體定相是必不可少的。”
10x Genomics的聯(lián)合創(chuàng)始人和首席執(zhí)行官SergeSaxonov說:“從頭裝配和定相就像十字瞄準線一樣是我們的主要目標。我們的技術(shù)非常適合于臨床和人群規(guī)模的測序。”
人類基因組從頭組裝及單倍體型定相信息總結(jié)統(tǒng)計
作者在文章中還比較了目前已有的人類基因組組裝的測序平臺、算法、組裝和定相統(tǒng)計數(shù)據(jù)。該列表表明,單分子長讀長測序技術(shù)在生成高質(zhì)量組裝數(shù)據(jù)上遠超過短讀長測序技術(shù)。這項研究清楚地表明了第三代測序長讀長技術(shù)結(jié)合GemCode測序平臺解決單倍型的從頭組裝方法的潛力,并揭示了以前未被發(fā)現(xiàn)的新的遺傳變異,將迎來人類基因組測序的新標準。