中美联合研究团队开发出无需矩阵乘法即可运行AI语言模型的方法

2024-06-28  中国 来源:其他 作者:唐乾琛 领域:信息

关键词:

据TechXplore网6月26日消息,中国苏州大学、美国加州大学戴维斯分校和加州大学圣克鲁斯分校联合研究团队开发出一种无需矩阵乘法即可运行AI语言模型的方法。当前,使用图形处理器运行大语言模型负载遇到了矩阵乘法(MatMul)运算的瓶颈。研究人员使用了新的数据加权方法和量化技术,使用“-1,0,1”三个浮点数的方法取代了当前依赖16位浮点数的方法,并开发了有助于提高性能的量化技术,由此引入了无矩阵乘法线性门控循环单元(MLGRU)。研究团队测试后发现,新方法的性能与目前最先进的系统相当,但消耗的算力和电力更少。

消息来源:https://techxplore.com/news/2024-06-software-ai-language-matrix-multiplication.html#google_vignette