OpenAI公布全新生物AI基准,大模型通过率最高仅31.5%

2026-07-03  美国 来源:智药局公众号 作者:张芮晴 领域:生物

关键词:

据智药局公众号7月1日消息,OpenAI正式推出GeneBench-Pro,是初代GeneBench升级专业版生物AI评测基准,专门衡量大模型处理计算生物学复杂科研决策的综合能力,是首个覆盖全流程基因组科研的标准化评测基准。实测结果显示,OpenAI最强的模型GPT-5.6 Sol在专业模式下的通过率从28.7%升至31.5%,有望成为药企、AI企业、高校衡量生物垂直大模型落地价值的核心参考,结束行业零散、碎片化自测乱象。

https://mp.weixin.qq.com/s/7A4Iw2Vo2g0H1aZ5oWdoRg