上海交通大學醫工交叉研究取得重要進展

——成功構建中國漢族人泛基因組分析流程

來源:交大醫學院僑聯       發布時間:2019/8/9 14:09:39

字體:【大】【中】【小】

  近日,來自上海交通大學和交大醫學院的兩個跨學科、跨專業科研團隊,通過數年的協作科技攻關,在人類基因組分析方法學上開發了一套全新的人類基因組測序數據分析系統---人類泛基因組分析系統(Human Pan-genome Analysis system,簡稱HUPAN)。該項研究成果于2019年7月31日在國際基因組學研究權威刊物《Genome Biology》在線發表(影響因子14.028)。該研究工作是由上海交通大學生命科學技術學院韋朝春教授課題組和交大醫學院附屬瑞金醫院于穎彥教授課題組聯合完成。韋朝春教授與于穎彥教授為該文章共同通訊作者,博士生段忠取為該文章第一作者。該項研究是上海交大啟動醫工交叉項目以來取得的重要實質性成果。項目實施期間還得到國家科技部及國家衛健委重點研發計劃、國家自然科學基金委、上海市科委重點項目以及交大醫學院轉化醫學創新基金等的大力支持。

  背景知識

  人類基因組計劃宣告完成后產生了一個基于有限個體的人類參考基因組序列,這就是當前眾多的分子生物學實驗研究的參照基礎。但隨著對人類基因組測序研究的廣泛開展,測序個體數量的不斷增加科學家們逐漸發現,現有的人類基因組參考序列尚不夠完整,特別是在一些特定的人群或個體基因組中被測序到現有人類基因組參考序列中缺失的片段,也就是說,人類基因組的序列其實比已知的基因組參考序列要復雜的多,尚有很多未知序列(或者說是暗物質)有待于科學家們通過不斷的深化研究加以發現。

  泛基因組(Pan-genome)研究的意義

  泛基因組是指某個群體中所有個體基因組的總和。隨著測序技術的進展,針對人類某個群體的多個個體基因組的測序數據不斷積累增加,給泛基因組研究提供了前所未有的契機。然而,人類全基因組測序數據量龐大,現有針對如此大型的基因組數據進行拼接研究的方法學尚有限,如果研究方法不加以創新,在分析過程中容易引入較多的拼接錯誤,且會導致分析速度緩慢。為此,上海交大生命科學技術學院與交大醫學院附屬瑞金醫院的研究人員進行了分析方法的創新,他們首先對原有真核生物泛基因組分析流程進行改進,包括引入節約內存的拼接方法,可直接對每個個體的所有測序數據進行拼接以降低拼接錯誤,優化了泛基因組分析步驟,從而明顯提高了海量測序數據的分析速度。該方法學的建立為解析人類基因組中尚未被發現的“暗物質”提供了重要研究工具。

  為了構建新型的分析系統,研究人員針對185個中國漢族人的全基因組開展深度測序分析,并整合了開放數據庫內已有的90個中國漢族人全基因組深度測序數據。通過新構建的人類泛基因組分析流程,至少在中國漢族人全基因組測序數據中發現了不同于人類參考基因組中的29.5Mb新序列,暨人類基因組參考序列中漏掉的序列。通過新基因預測分析,發現至少188個新基因,其中約40%屬于中國漢族人特有的基因。

  該新型泛基因組研究方法的開發不僅僅為深入研究人類進化、人類遷徙規律、種族基因組之間差異以及新基因是否與人類疾病相關提供了重要工具,還為其它具有較大基因組的高等動物泛基因組研究提供了重要實驗工具。項目實施過程中還得到上海市轉化醫學協同創新中心和上海交大超級計算機中心提供的硬件支撐。

   WDCM上傳圖片 

  韋朝春,上海交通大學生命科學技術學院生物信息學與生物統計學系教授/博士生導師。先后于北京大學和美國華盛頓大學(圣路易斯)獲得數學學士、信息處理碩士和計算機科學博士學位。主要研究方向為基因組學和進化基因組學。具體研究內容包括基因組中的功能因子識別及其進化分析、真核生物泛基因組學、腫瘤基因組學和宏基因組學等。

   WDCM上傳圖片 

  于穎彥,上海交通大學醫學院附屬瑞金醫院教授/博士生導師,上海消化外科研究所副所長,中國抗癌協會胃癌專業委員會委員,中國醫藥生物技術協會生物樣本庫分會及慢病管理分會常委。上海市浦江人才與上海市優秀學術帶頭人。從事消化病理、腫瘤分子分型、生物標志物和轉化醫學研究。承擔國家重點研發計劃精準醫學專項和慢病專項課題,國家自然科學基金、上海市科委重點項目、上海交大醫工交叉重點項目以及交大醫學院轉化醫學創新基金等。

分分pk拾