全球技术地图

全球

欧盟

英国

中国

美国

印度

以色列

日本

其他

美国OpenAI公司正开发解释AI模型行为的工具

2023-05-11 美国来源：其他作者：唐乾琛领域：信息

关键词：

据TechCrunch网5月9日消息，美国OpenAI公司正开发一个新的工具，来识别大型语言模型（LLM）的哪些部分与其行为模式相关联。研究人员调用GPT-4来记录其他架构更简单的语言模型上神经元的行为，为LLM中的每个神经元生成解释，并将这些解释被编译到与工具代码一起发布的数据集中。这项工作基本可以为每个神经元提出某种初步的自然语言解释，说明它在做什么，并对该解释与实际行为的匹配程度进行评分。目前，OpenAI公司已能为GPT-2模型中超30万个神经元生成解释。该工作有望为提高人工智能的可解释度和可信度铺平道路。

消息来源：https://techcrunch.com/2023/05/09/openais-new-tool-attempts-to-explain-language-models-behaviors/