2023-05-11 美国 来源:其他 作者:唐乾琛 领域:信息
关键词:
据TechCrunch网5月9日消息,美国OpenAI公司正开发一个新的工具,来识别大型语言模型(LLM)的哪些部分与其行为模式相关联。研究人员调用GPT-4来记录其他架构更简单的语言模型上神经元的行为,为LLM中的每个神经元生成解释,并将这些解释被编译到与工具代码一起发布的数据集中。这项工作基本可以为每个神经元提出某种初步的自然语言解释,说明它在做什么,并对该解释与实际行为的匹配程度进行评分。目前,OpenAI公司已能为GPT-2模型中超30万个神经元生成解释。该工作有望为提高人工智能的可解释度和可信度铺平道路。