美国科研团队评估GPT-4等大语言模型的生物推理能力

2024-01-03  美国 来源:其他 作者:戴吉 领域:生物

关键词:

据ScienceAI网12月29日消息,美国佐治亚大学和梅奥诊所的科研人员评估了GPT-4、PaLM2、Claude2、SenseNova等多个领先大型语言模型(LLM)回答概念生物学问题的能力。该评估涵盖分子生物学、生物技术、代谢工程和合成生物学等生物学主题的108个多项选择问题。其中,GPT-4获得了90分的最高平均分,且在不同提示的试验中表现出最大的一致性,表现出逻辑推理能力以及通过数据分析、假设生成和知识整合等帮助生物学研究的潜力,但在加速生物发现方面仍需要进一步的开发和验证。相关研究成果发表于arXiv预印平台。

消息来源:https://mp.weixin.qq.com/s/WnAE809eQnuETWQrNyg9SQ