美国英伟达公司为人工智能大模型开发安全工具

2023-05-06  美国 来源:其他 作者:唐乾琛 领域:信息

关键词:

据量子位5月4日消息,美国英伟达公司为人工智能大模型开发安全工具NeMo Guardrails,以过滤输入内容和控制输出内容。一方面,NeMo Guardrails能保护大模型不受用户的攻击,帮它挡住来自外界的恶意输入;另一方面,用户诱导大模型生成攻击性代码、输出不道德内容时,NeMo Guardrails将阻止大模型输出不安全的内容。目前,NeMo Guardrails一共提供三种形式的护栏技术:话题限定护栏(Topical guardrails)、对话安全护栏(Safety guardrails)和攻击防御护栏(Security guardrails)。英伟达公司已将NeMo Guardrails开源发布。

消息来源:https://www.pingwest.com/a/281435