2025年05月17日 星期六
利用AI预测 小样本数据下抗耐药菌聚合物结构 开发机器学习方法 解析生物大分子凝聚体全基因组图谱 游戏与创新 苦涩甘鲜  乌龙茶风味的秘密被揭开
第6版:科创上海 2024-09-07
同济团队

开发机器学习方法 解析生物大分子凝聚体全基因组图谱

生物大分子凝聚体在细胞功能中扮演着至关重要的角色,它们通过聚集蛋白质或核酸分子,形成较为稳定的独立区域。与染色质相关的生物大分子凝聚体,是近年细胞生物学研究的一个热点。众多研究已经揭示,这些凝聚体与染色质的活动——如基因转录和表观遗传修饰——有着密切的联系。尽管如此,对于生物大分子凝聚体在全基因组尺度的定位图谱,包括基因组上各种凝聚体的种类和具体位点,目前尚缺乏系统性的研究和解析。

近日,同济大学生命科学与技术学院张勇课题组与临港实验室朱光亚课题组合作在《自然·通讯》上发表文章,开发了预测染色质关联生物大分子凝聚体全基因组图谱的机器学习方法CondSigDetector。

这种名为CondSigDetector的新方法,旨在探测生物大分子凝聚体的全基因组定位图谱。这一方法利用了生物大分子凝聚体的核心特性——通常由多种蛋白质通过协同作用形成。CondSigDetector分两个步骤执行:首先,通过整合特定细胞类型中的染色质相关蛋白的ChIP-seq数据,构建主题模型来识别这些蛋白在基因组上的特异性共定位模式。随后,利用公共数据库中的数据,结合这些蛋白的凝聚物理化学性质,评估这些共定位模式组成凝聚体的潜能。具有高凝聚潜力的共定位模式被识别为CondSigs(Condensatelike chromatin-associated protein cooccupancy Signatures)。这些CondSigs不仅提供了组成凝聚体的蛋白信息,还指明了这些凝聚体在基因组中的具体位点。在对小鼠胚胎干细胞和人类K562细胞进行了大规模预测后,张勇课题组与朱光亚课题组合作,对两个新发现的CondSig进行了详细鉴定。这些研究验证了这些凝聚体在细胞内的具体组成和定位,进一步证实了CondSigDetector方法的有效性和实用性。 本报记者 张炯强

放大

缩小

上一版

下一版

下载

读报纸首页