■ 人类的基因组,如同一本由30亿个碱基对编织而成的宏大天书。在这本书里,绝大部分“文字”在全人类中是通用的,唯有那些被称为SNP(单核苷酸多态性)的微小差异,悄悄决定了每个人的身高、智力、性格,甚至是患病风险。昨天下午,全球首个专为全基因组规模SNP分析设计的基础大模型——SNPBag正式发布。这意味着,人类在破解遗传密码的征途中跨入大模型时代
■ SNPBag拥有8.4亿参数,它像大语言模型学习人类文字逻辑一样,通过深度学习能自动在海量数据中找出基因间复杂的相互关系,读懂基因变异之间的语境,处理基因信息时运行速度比传统工具快10到100倍
■ 基于SNPBag大模型,未来的无创产前早筛有望筛查出更多的罕见病种类,为更多家庭筑起健康屏障。在亲缘关系推断上,SNPBag能精准识别远至12级的血缘联系;在预测冠心病、阿尔茨海默病等重大疾病风险时,SNPBag将展现出超过传统手段的临床应用潜力;在药物研发领域,SNPBag有望将药物靶点筛查的成功率提高200%以上
>>>详见第2版 本报记者 马丹 报道