
2024年6月18日,“多样性算力产业峰会2024”在京成功举办。会上,郑纬民院士、中国移动研究院副院长段晓东、北京市科学技术委员会、中关村管委会副主任董齐超,联合19家产业合作伙伴启动“北京全向智感OISA协同创新平台”,共建国内GPU开放互联生态,并发布全球首个GPU卡间互联开放协议OISA和交换芯片原型。
中国移动研究院副院长段晓东对OISA进行了介绍。OISA(Omni-directional Intelligent Sensing Express Architecture,全向智感互联)是中国移动原创提出的GPU卡间互联协议体系。当前,随着大模型向万亿参数演进,模型性能和泛化能力进一步增强,推动底层智算基础设施向“超节点”形态升级,这对大规模GPU卡间互联的兼容性、传输效率、时延等关键指标提出了高要求。

当前国内GPU芯片均采用私有化的互联方案,在互联规模、拓扑、带宽、时延等方面,距离国际先进方案有较大差距,且未有超节点产品发布。目前产业正在积极探索开放技术路线,共同制定GPU卡间互联标准。
OISA最早由中国移动发起,旨在解决GPU卡间开放互联问题。OISA提出四大设计理念,包括大规模GPU对等互联、极致报文格式、数据层流控和重传以及高效物理传输,为GPU卡间互联通信提供解决方案。本次峰会发布“OISA Gen1协议”并推出“OISA交换芯片原型”。OISA Gen1的设计规格支持128张GPU通过8个Switch芯片互联,任意卡间点对点带宽达到800GB/s,每个Switch芯片支持128个端口,芯片总速率达到51.2T。
解决GPU卡间互联问题不仅需要单点技术的突破,更需要GPU芯片、Switch芯片、服务器整机厂家以及超级用户的联合攻关。接下来,中国移动将协同更广泛的GPU芯片企业进一步细化协议,与整机厂家和上层模型进行适配与验证。未来,OISA将通过IP开放的形式鼓励GPU芯片集成高速互联接口,提升研发效率,帮助国产GPU芯片快速迈向下一代智算设施的能力建设。
中国移动将全面拥抱“AI+”时代,通过开放OISA协议凝聚产业共识,共同牵引AI产业全面升级。擘画开放互联辉煌明天,释放智算潜能崭新时代。
信息来源:人民邮电报
