2024-11-23 美国 来源:其他 作者:刘纪铖 领域:信息
关键词:
据麻省理工科技评论11月21日消息,美国初创公司Enfabrica推出全球最快GPU网络接口控制芯片ACF SuperNIC,可实现更高效的数据传输,提高算力系统的利用率。该芯片采用一种融合纵向扩展和横向扩展的混合架构,能够分解和扩展任意计算资源。此外,该芯片通过结合高基数的800、400和100千兆以太网接口、32个网络端口和160个PCIe通道以及更高效的两层网络设计,能够支持超过50万GPU的AI集群并实现集群中所有GPU的最高横向扩展吞吐量和最低的端到端延迟。该芯片所具有的“弹性消息多路径”技术可大规模提高AI集群的弹性、可维护性和正常运行时间,消除由于网络链路故障导致的AI作业停滞,从而提高有效训练时间和GPU计算效率。Enfabrica称,该芯片使客户能够在相同的性能点上将大型语言模型推理的GPU计算成本降低约50%,深度学习推荐模型推理的成本降低75%。