近日,复旦大学、西安交大、中国医学科学院等26家单位联合发布中国人群泛基因组联盟(CPC)一期研究进展。北京时间6月14日,相关成果以《基于36个族群的中国人泛基因组参考图谱》为题,发表于《自然》(Nature)主刊。据悉,这是我国学者领导的人群基因组研究首次发表于《自然》主刊。
具有巨大潜在价值
这项研究初步构建了我国人群的泛基因组参考图谱,发现了在人类通用参考基因组上缺失的约1.9亿个碱基对的参考序列;新鉴定了约580万个点突变或小变异,以及3.4万个结构变异,涉及大量潜在功能原件,包括至少1367个蛋白质编码基因;发现通用参考基因组上缺失的参考序列富集了适应性演化和起源于远古人类的遗传变异,并且与角质化、紫外线辐射应激、DNA修复、免疫反应及寿命等表型或功能相关。
这项研究也显示了建立我国自己的人群泛基因组图谱十分必要,在重构人类演化历程、挽回复杂疾病研究时“丢失的遗传率”等研究和应用中,具有巨大的潜在价值。
支撑精准医学发展
人类参考基因组是广泛用于人类遗传学和医学研究的遗传密码“导航图”。从2001年首次发表人类基因组草图,人类参考基因组经历了数十次的更新迭代,发展到目前广泛使用的第38版本(GRCh38)。人类参考基因组从“线性一维序列”过渡到“泛基因组多维图谱”。
据介绍,目前通用的人类参考基因组皆基于欧洲白人为主体样本构建,难以代表非欧裔族群尤其我国族群的基因组多样性。
作为人口大国,我国巨大的人口基数和丰富的人群多样性是发展人类基因组学和精准医学的重要优势:西南部高原地区分布着众多藏缅、南亚语系族群,东西方人群在西北部丝绸之路沿线交融,苗瑶语族人群在云贵地区世代繁衍,蒙古、突厥人群曾游牧于北部风沙地,通古斯语族抵抗严寒一路向北,台-卡岱(侗台)族群的先辈亦曾穿梭于南方丛林河谷。构建能够代表中华民族遗传多样性的中国人群泛基因组图谱势在必行且迫在眉睫,这将极大提高捕获罕见或低频遗传变异的灵敏度和准确性。
为此,复旦大学徐书华教授、西安交通大学叶凯教授联合国内26家单位发起了中国人群泛基因组联盟,旨在建立我国专属参考基因组和泛基因组资源和分析体系,形成我国自主可控的人类基因组资源与核心技术,支撑精准医学发展,服务“健康中国”战略。
为科研提供新线索
在第一期研究计划中,中国科学家新发现的遗传变异可能与亚洲人群特有的疾病易感性及表型多样性有关。一个典型的例子是α-珠蛋白基因簇,研究人员在该基因区域鉴定出两个中国人群特异性的大规模结构变异,包括一段20kb的缺失序列和一段10kb的重复序列,为进一步研究中国人群贫血症的遗传机理和致病机制提供了新的线索。
此外,研究人员发现了相当大比例的古人来源基因序列——平均每个族群和每个样本中分别有约15Mb和约9.5Mb的古人来源新序列。这可能是前期开展大量研究却未在现代人基因组中发现的古人基因渗入序列,或将为东亚现代人基因组中的古人基因渗入研究乃至整个古DNA领域提供新的信息资料和线索。
从人类基因组计划中国只承担“1%”的图谱绘制任务,到今天中国人群泛基因组图谱“100%”由中国科学家完成,这项研究成果展现了中国生命科学尤其是基因组学的科研水平在过去40年间的历史性跨越,也为人类参考泛基因组图谱绘制了“中国画卷”。本报记者 张炯强