谷歌深度机器模型一次注释了10%的已知蛋白质序列,超过人类十年研究成果

2022-03-01  美国 来源:其他 作者:张芮晴 领域:生物

关键词:

据DeepTech深科技公众号2月24日消息,谷歌与欧洲生物信息学研究所合作开发出一种深度学习模型ProtCNN。该模型可使用神经网络可靠预测蛋白质功能,使更多未知蛋白质序列得到注释。该方法更快速、易操作且成本低,使记录了一系列蛋白质家族及其功能注释的主流数据库“Pfam数据库”中注释的蛋白质序列的覆盖范围扩大了9.5%,超越过去十年里科学家在此方面的成果,并预测了360种该数据库未注释过的人类蛋白质的功能。该方法可较为准确地预测蛋白质功能、突变的功能效应并进行蛋白质设计,进而应用于药物发现、酶设计以及了解生命起源等方面。未来,类似ProtCNN的深度学习模型将成为蛋白质注释工具的核心组成部分。相关研究成果发表于Nature Biotechnology期刊。

消息来源:https://mp.weixin.qq.com/s/-QjVo7gsSjFlxveeR364gw