美国Meta公司推出“自学评估器”,利用合成数据训练人工智能

2024-08-10  美国 来源:其他 作者:唐乾琛 领域:信息

关键词:

据AIbase网8月7日消息,美国Meta公司推出了“自学评估器”(Self-Taught Evaluator),利用合成数据训练人工智能。它首先通过种子模型生成对比的合成偏好对,然后模型评估这些对并迭代改进,利用自己的判断来提高后续迭代的性能,从而大大减少对人工生成的注释的依赖,有助于提高效率、降低成本。研究人员使用Llama-3-70B-Instruct 模型测试了“自学评估器”的性能。该方法将模型在RewardBench基准上的准确率从75.4%提升至88.7%。

消息来源:https://www.aibase.com/news/10880