我國科學(xué)家首次完全自主實施國家級人類全基因組項目。圖片來源:百度圖片
■本報記者 李惠鈺
屬于中國人自己獨特的基因“密碼”有望被精準(zhǔn)破譯。近日,由哈爾濱工業(yè)大學(xué)牽頭的國家重點研發(fā)計劃精準(zhǔn)醫(yī)學(xué)研究重點專項之“中國十萬人基因組計劃暨中國人群多組學(xué)參比數(shù)據(jù)庫與分析系統(tǒng)建設(shè)”項目正式啟動,并進入為期4年的項目實施階段。
“這是我國科學(xué)家首次完全自主實施的國家級人類全基因組項目。”項目負(fù)責(zé)人、哈工大生物信息技術(shù)研究院院長王亞東在啟動會上介紹,項目組將選取十萬中國自然人群作為研究對象,進行基因組、暴露組、表型組等組學(xué)研究,揭示中國人群特有基因組變異、變異頻率及其影響,最終繪制完成屬于國人自己的基因組變異圖譜和多組學(xué)健康地圖。
“目前,我國在人類基因組研究方面的總體科學(xué)影響力,還不能認(rèn)為是達到了國際領(lǐng)先水平。” 中國科學(xué)院上海生命科學(xué)研究院生物醫(yī)學(xué)大數(shù)據(jù)中心首席科學(xué)家、中國科學(xué)院院士趙國屏評價道,“在組學(xué)研究進入大數(shù)據(jù)時代這個關(guān)鍵時刻,結(jié)合精準(zhǔn)醫(yī)療方向?qū)嵤?lsquo;中國人群多組學(xué)參比數(shù)據(jù)庫與分析系統(tǒng)建設(shè)’這一大研究計劃,輔以正在開展的大規(guī)模人群隊列研究和正在籌劃中的‘人類表型組’計劃,是我們實現(xiàn)‘彎道超車’的大好機遇。”
為什么要選定“十萬人”
人類基因組變異多數(shù)都是無害的,但也有些變異可導(dǎo)致疾病,如癌癥、心腦血管疾病、糖尿病等。中國十萬人基因組計劃就是要比較全面而精準(zhǔn)地鑒定中國人的基因組變異及相關(guān)的其他組學(xué)(包括表型組)數(shù)據(jù),形成比較完善的基因組變異參比數(shù)據(jù)庫。這個基本數(shù)據(jù)基礎(chǔ),將大大促進我國科學(xué)和醫(yī)學(xué)工作者,鑒定與不同人群表型(包括各種復(fù)雜疾病)相關(guān)的基因組變異,以利于疾病防治,保證全民健康。
“我國尚未建立高精度的中國人參考基因組,大量精準(zhǔn)醫(yī)學(xué)前沿研究缺少參考數(shù)據(jù),已經(jīng)成為我國精準(zhǔn)醫(yī)學(xué)發(fā)展的重大瓶頸問題。”王亞東坦言,啟動中國十萬人基因組計劃就是瞄準(zhǔn)了這一瓶頸問題。
王亞東表示,該計劃將構(gòu)建世界級精度中國人參考基因組和多組學(xué)參比數(shù)據(jù)庫,這是我國精準(zhǔn)醫(yī)學(xué)發(fā)展的重要基礎(chǔ),將滿足精準(zhǔn)醫(yī)學(xué)研究的關(guān)鍵共性需求,有助于挖掘健康和疾病的遺傳與環(huán)境風(fēng)險因素的相關(guān)性、建立精準(zhǔn)的疾病防治方案。
那么,為什么要選定十萬人作為參比人群?實際上,“研究環(huán)境和基因相互作用對健康的影響,研究腫瘤等重大疾病易感性的個體遺傳差異,罕見變異(頻率低于千分之五)可能是重要的研究對象。”王亞東在接受媒體采訪時指出,我國人口接近14億,遺傳結(jié)構(gòu)復(fù)雜,根據(jù)統(tǒng)計遺傳學(xué)理論,要達到本項目精確地鑒定罕見變異的目標(biāo),即變異檢測的精度達到萬分之一,十萬人只是一個最小限度的基因組測序數(shù)量。
那這十萬人又是如何選取出來的呢?一方面是依托精準(zhǔn)醫(yī)學(xué)研究專項等國家科研項目,從已有的研究隊列中選取樣本;另一方面,項目還將建立一個開放的平臺,志愿者也可以參與其中。
為了保證樣本的全面性和多樣性,項目基本涵蓋了我國東北、西北、華北、華中、華東、華南、西南7大地區(qū)的漢族樣本。同時,還選擇了包括藏族、蒙古族、壯族、回族、滿族等9個人口數(shù)量在500萬以上的少數(shù)民族群體,在接下來的項目推動過程中,將逐步擴展到56個民族。
實施過程將面臨重大挑戰(zhàn)
人類約有2.5萬個基因,要想把十萬人每個人體內(nèi)的基因密碼全部解開,面臨的首要挑戰(zhàn)就是十萬人基因組變異檢測的計算復(fù)雜性和質(zhì)量控制。
趙國屏對《中國科學(xué)報》記者解釋道,全基因組是指全部30億堿基長的人類基因組序列。只有通過包括全基因組測序又高于現(xiàn)在常用的二代測序的方法,才能夠發(fā)現(xiàn)基因組上的單核苷酸變異(SNV)、插入/缺失變異(INDEL)和結(jié)構(gòu)變異(SV)等所有基因組變異。
“在過去的基因組計劃,雖然GWAS(全基因組關(guān)聯(lián)分析)研究曾經(jīng)用到萬人以上的樣本,但全基因組測序的計劃從未有如此大的樣本。”趙國屏表示,該項目產(chǎn)生的數(shù)據(jù)規(guī)模巨大,數(shù)據(jù)總量可達到10PB,從基因組測序數(shù)據(jù)中檢測基因組變異的計算量巨大,可達到2000萬CPU小時,需要建立高效的計算分析平臺完成所有數(shù)據(jù)分析工作。
除此之外,目前,國際上的基因組變異檢測方法準(zhǔn)確率較低,其中SNP準(zhǔn)確率低于99%,INDEL準(zhǔn)確率低于95%,SV準(zhǔn)確率低于90%。如何確保此次項目數(shù)據(jù)分析的準(zhǔn)確度也是一大難點。
“因此,我們需要建立高效的計算分析平臺完成所有數(shù)據(jù)分析工作,研發(fā)更高精度的基因組分析算法、軟件和工作流,以及基因組變異檢測的質(zhì)量控制體系,確保基因組變異檢測的準(zhǔn)確性。”王亞東說。
面對龐大數(shù)據(jù)算法方面的挑戰(zhàn),上海交通大學(xué)Bio-X研究院院長、中國科學(xué)院院士賀林則建議,除了算法改進和計算機能力的更新,未來側(cè)重點還應(yīng)考慮放在對海量“垃圾”序列的劃界和處理上。
除此之外,賀林還對《中國科學(xué)報》記者指出,中國十萬人基因組計劃完成之后,立即面對的是如何解讀所得到的大量序列數(shù)據(jù)與健康和疾病之間的關(guān)系。建立遺傳咨詢行業(yè)被認(rèn)為是唯一出路,然而在我國的職業(yè)大典上,至今還找不到遺傳咨詢師這一職業(yè)。
集中力量實現(xiàn)“彎道超車”
繼成功繪制人類基因組測序“中國卷”和水稻基因組圖譜后,進入本世紀(jì)以來,我國科學(xué)家繼續(xù)向著生命科學(xué)的深處進軍,繼續(xù)參與了人類基因組新計劃HapMap計劃、腫瘤基因組計劃和千人基因組計劃,并且在成功完成HapMap計劃的基礎(chǔ)上,針對若干重大疾病,大規(guī)模地開展GWAS研究工作,獲得了可喜的成就。
據(jù)趙國屏介紹,在過去二十年里,利用人類基因組研究的技術(shù)與知識,中國微生物(包括病毒)基因組研究進展迅速,在傳染病防控的基礎(chǔ)研究與臨床應(yīng)用方面迅速走向國際前沿。另外,中國在干細(xì)胞、腫瘤防治、胎兒遺傳疾病早期檢測、慢性病代謝病防治方面的進步也有目共睹,其中干細(xì)胞的研究已經(jīng)達到了國際前沿水平。但是,我國在基因組,特別是人類基因組研究方面的總體科學(xué)影響力,還達不到國際領(lǐng)先的水平。
趙國屏認(rèn)為,對基因組的研究,本質(zhì)上是對基因型的認(rèn)識。我們目前所使用的關(guān)于人類基因組的比較系統(tǒng)和可靠的基礎(chǔ)數(shù)據(jù),大部分是由以西方人群為主的國際研究項目所提供,這對于服務(wù)中國人的健康與醫(yī)藥事業(yè)是不適應(yīng)的。另一方面,以往國際項目對于相應(yīng)表型信息的采集,基本上是項目導(dǎo)向,比較分散難以整合,再加上其中亞洲人樣本有限,也更為開展基因型與表型的相關(guān)分析帶來了基礎(chǔ)性的問題。
“造成這個問題的根本原因就是我們在過去二十年中,對于我們自己產(chǎn)生的基因組數(shù)據(jù)的整合、交互和共享沒有組織并實施持之以恒的大規(guī)模的工程性管理、支撐、服務(wù)、研究和開發(fā)工作。”趙國屏再次強調(diào)說。
而此次啟動的中國十萬人基因組計劃正好給了我們“彎道超車”的大好機遇。中國人“多組學(xué)”相關(guān)項目的整合,為中國人類基因組研究走向工程化,為中國人類基因組數(shù)據(jù)能夠真正在整合與共享基礎(chǔ)上實現(xiàn)高效的挖掘與研發(fā)創(chuàng)造了條件。相信這個項目的扎實推進,一定能為我國健康事業(yè)和生命科學(xué)研究事業(yè)作出根本性的貢獻。
據(jù)悉,該項目設(shè)立五個課題,分別由哈爾濱工業(yè)大學(xué)、復(fù)旦大學(xué)、中國科學(xué)院北京基因組研究所、華中科技大學(xué)、中國科學(xué)院上海生命科學(xué)研究院等五個科研單位領(lǐng)銜,將有20個大學(xué)、科研院所和企業(yè)的166位專家學(xué)者參與到項目中。
“現(xiàn)在我國測序設(shè)計和分析能力是有的,但力量卻是分散的,這次項目是一個機會,希望能夠把力量集中起來。現(xiàn)在,在籌備的過程中,也看到了這方面希望。”趙國屏說。
《中國科學(xué)報》 (2018-01-11 第5版 技術(shù)經(jīng)濟周刊)