图IC
复旦大学近日发布消息:中国科学院院士、复旦大学教授金力团队对来自中国华北(郑州)、华东(泰州)、华南(南宁)三个代表性汉族群体的5000名个体进行了基因组全外显子测序,初步构建了“华表”外显子组数据库。目前,“华表”数据库共包含207万个遗传变异,其中46.4%的遗传变异为该研究首次发现。全球研究人员都可以通过布设在中国生物医学大数据中心(上海)网站下的数据库子站(https://www.biosino.org/wepd)快速检索相关遗传变异的频率信息。
外显子
寻找罕见病基因缺陷
建立基因数据库、基因测序、查寻罕见病基因缺陷,对于这些名词,人们已经不陌生。那么,外显子又是什么?为什么要构建外显子数据库呢?据介绍,外显子是真核生物基因的一部分,负责编码蛋白质;也就是说,寻找罕见病基因缺陷,外显子起到主要作用。
与全基因组测序相比,新一代覆盖基因组编码区的全外显子组测序,不必观察基因组的全部,而是突出重点,由此效率大大增加,技术成本大幅降低。可以说,外显子测序是基因测序的“精简版”,可在高测序深度情况下,更准确检测出临床致病的罕见变异位点。
第一步
测序了中国汉族人群
目前,国际上已有多个大型公共全外显子(WES)数据库,如ExAC、gnomAD等。但这些数据库的样本大多由高加索人、非洲裔美国人或拉丁美洲人组成,中国汉族样本数量有限。作为世界上人口最多的民族,汉族具有较高的遗传多样性,建立一个高质量且有代表性的中国汉族人群全外显子数据库对于生物医学研究具有重要的价值。
2017年9月,在科技部和国家卫计委(现国家卫健委)等部门指导下,复旦大学现代人类学教育部重点实验室联合有关机构发起“华表计划”——中国全外显子组数据库项目,是自主建设的中国人群公共数据库之一。作为“华表计划”的主要科学设计者,金力表示,“华表计划”第一阶段的建设目标是通过对覆盖全国、有代表性的汉族人群样本进行高质量测序,系统解析外显子区域等位基因频率,精细刻画中国汉族人群遗传结构,形成我国自主建设的中国人群基因组数据库。
助发现
罕见病精准诊疗方案
团队成员、复旦大学人类遗传学与人类学系主任王久存教授介绍,包括全外显子组数据库在内的人群数据库对生物医学界开展罕见病具有重大意义。罕见病是指仅在极少数人身上发生、人群患病率小于万分之一的稀罕病症。统计表明,大部分(72%)罕见病是遗传性疾病,许多罕见病在患者生命早期发病,例如地中海贫血、成骨不全症等。
“华表”数据库提供了中国汉族人群的低频位点频率信息,能够帮助研究人员区分罕见致病突变和高频良性变异,从而为进一步精准识别和分析中国人所患罕见病的致病分子机制、遗传机理以及基于此的罕见病精准诊疗方案提供了科学基础。本报记者 张炯强