百度发布业界首款支持OAI标准和液冷散热的超级AI计算平台X

图片 1

9月27日消息,在荷兰阿姆斯特丹举办的2019 OCP Regional Summit会议上,百度发布了业界首款支持OAI标准和液冷散热的超级AI计算平台X-MAN4.0。

OAI标准是什么?

随着AI技术的快速发展,众多AI芯片公司诞生,AI芯片产业多元化发展,但由于AI硬件系统设计的技术难度和复杂性,研发周期通常长达一年,并且需要投入大量的研发资源,阻碍了新AI加速芯片的落地和应用。在今年3月份的OCP全球峰会上,百度联合Facebook和微软发布了OAM标准,该标准制定了AI硬件加速模块的尺寸、供电、高速互联接口等规范,之后主导发起将OAM项目升级为OAI,该标准用于指导AI硬件加速模块和系统设计,集合定义AI硬件加速模块本身、主板、互联拓扑、机箱、供电、散热以及系统管理等系列设计规范。

通过OAI标准,相关厂商可以统一AI硬件加速模块和系统设计,兼容多元化AI加速芯片。OAI标准也得到Google、阿里、英伟达、英特尔、浪潮、IBM等行业厂商的支持。

首款支持OAI标准和液冷散热的AI计算产品X-MAN4.0

X-MAN4.0是百度超级AI计算平台X-MAN系列产品的第四代,是第一款支持OAI标准和液冷散热的的AI计算产品。

X-MAN4.0单节点可以支持8个AI加速器,加速器之间采用8 port HCM互联架构,双向通信带宽高达56 GBps。

在单个机柜层面,X-MAN4.0最大可支持32个AI加速器构建互联集群,具有极好的可扩展性。X-MAN4.0符合ODCC 3.0整机柜规范,高度为4SU,宽21英寸,长度850mm,支持风冷散热方式,也支持液冷,采用更高效的48V供电方式。

X-MAN系列是百度用于超大规模AI训练的专用平台,已经在百度内部数据中心大规模应用。自研产品能最大程度满足百度需求,X-MAN 1.0首次实现AI计算硬件解耦架构、X-MAN2.0首次将冷板式液冷散热技术应用到AI计算产品里、X-MAN3.0首次倡导模块化标准化设计。从AI芯片昆仑到超级AI计算平台X-MAN,再到深度学习框架PaddlePaddle等,百度AI正在打造一个软硬一体AI解决方案。

本文由杏彩网页版登录入口发布于项目案例,转载请注明出处:百度发布业界首款支持OAI标准和液冷散热的超级AI计算平台X

您可能还会对下面的文章感兴趣: