大规模蛋白质组学研究能够深化对健康和疾病的理解,但蛋白质与健康和疾病之间的关系仍然存在许多未解之谜。复旦大学附属华山医院郁金泰、毛颖团队联合复旦大学类脑智能科学与技术研究院程炜、冯建峰团队联合攻关全面绘制了人类健康与疾病蛋白质组图谱,结合人工智能大数据分析方法构建疾病诊断预测模型,发现了26个药物治疗新靶点,为精准医疗和新药开发提供了重要科学依据。相关成果以《健康与疾病血浆蛋白质组图谱》为题,22日晚在《细胞》(Cell)杂志发表。
蛋白质能够直接反映人体的生物过程和病理变化,是理解疾病机制和开发新疗法的关键。郁金泰教授和程炜教授多学科融合交叉团队敏锐觉察到蛋白质组学研究对阿尔茨海默病(AD)预防、诊断和治疗的意义,先后通过血浆及脑脊液蛋白质组学研究发现了AD新的诊断生物标志物,联合诊断精度高达98.7%。
在前期蛋白质组学研究的基础上,团队发现,尚缺乏全面的健康与疾病蛋白质组图谱,而这引出了许多尚未解决的问题。例如,前期所发现的AD相关蛋白质是否特异性地与AD相关,抑或同时与其他疾病有关联?这些蛋白在疾病的病理生理机制中有何贡献?血浆蛋白对人类疾病的预测诊断效能如何,是否能作为疾病的潜在治疗靶点?……高维度蛋白测序数据内部也存在错综复杂的交互作用,这使得数据的处理与分析过程异常烦琐且充满挑战。
该研究通过深入分析53026名个体的血浆蛋白质组数据,跨越了14.8年的中位随访期,建立了全面的蛋白质组图谱。研究中发现超过650种蛋白质与至少50种疾病存在联系,而超过1000种蛋白质表现出性别和年龄的异质性,这些发现加深了我们对疾病间共享和特异分子机制的理解,揭示了不同人群在疾病易感性上的差异,为精准诊疗提供了科学依据。
利用蛋白质组学特征对660种疾病进行聚类,能够根据其共享的生物学特性将这些疾病联系起来,从而重新审视疾病的类别和亚型。例如,各种痴呆亚型被划分到同一疾病亚群,该亚群还包含精神、内分泌、心血管等系统疾病,基于此,研究团队进一步揭示了该亚群的特征性生物学通路,将生物学上相关的疾病联系在一起,有助于解释为何患者身上会同时出现看似不相关的症状,并进一步加深对疾病机制的理解和提高治疗的有效性。
为了精准评估血浆蛋白质组学在疾病预测和诊断中的临床价值,需要结合人工智能和大数据分析技术。研究利用人工智能与大数据分析技术,识别出了具有潜在诊断和预测价值的生物标志物,并发现了可以预测和诊断多种疾病的关键蛋白。同时,研究还确立了26个具有治疗潜力且安全性良好的新靶点,为新药开发提供了重要线索。
本报记者 左妍