欧洲时间9月27日,在荷兰阿姆斯特丹举办的2019 OCP Regional Summit 会议上,百度发布了业界首款支持 OAI(OpenAccelerator Infrastructure)标准和液冷散热的超级 AI 计算平台 X-MAN4.0。百度在主导 OAI 标准定义的同时,也以实际行动推动 OAI 标准落地,通过构建开放的 AI 硬件生态系统来推动全球 AI 新硬件技术创新和落地。
▲百度超级 AI 计算平台 X-MAN4.0
OAI 标准为何而生?
随着 AI 技术的快速发展,众多 AI 芯片公司应运而生,AI 芯片产业的格局正呈现多元化发展趋势。由于 AI 硬件系统设计的技术难度和复杂性,其研发周期通常长达一年,并且需要投入大量的研发资源,这严重阻碍了新 AI 加速芯片的落地和应用。
OCP 开放计算项目,是由 Facebook 携手英特尔、Rackspace 等公司于2011年成立的一个非营利组织,也是全球云计算基础硬件技术领域覆盖面最广、最有影响力的开源组织。在今年3月美国 OCP 全球峰会上,百度联合 Facebook 和微软发布了 OAM(OCP Accelerator Module)标准,该标准制定了 AI 硬件加速模块的尺寸、供电、高速互联接口等规范,之后主导发起将 OAM 项目升级为 OAI,该标准用于指导 AI 硬件加速模块和系统设计,它集合定义了 AI 硬件加速模块本身、主板、互联拓扑、机箱、供电、散热以及系统管理等系列设计规范。
通过 OAI 标准,可以统一 AI 硬件加速模块和系统设计,有效兼容多元化 AI 加速芯片,促进 AI 芯片多元化生态格局的健康持续发展。
▲百度主导 OAI 标准定义
首款支持 OAI 标准和液冷散热的 AI 计算产品 X-MAN4.0
X-MAN4.0是百度超级 AI 计算平台 X-MAN 系列产品的第四代,是第一款支持 OAI 标准和液冷散热的的 AI 计算产品。X-MAN4.0 单节点可以支持8个 AI 加速器,加速器之间采用8port HCM(Hybrid Cube Mesh)互联架构,双向通信带宽高达56 GBps。在单个机柜层面,X-MAN4.0最大可支持32个 AI 加速器构建互联集群,具有极好的可扩展性。
X-MAN4.0符合 ODCC3.0整机柜规范,高度为4SU(182.5mm),宽21英寸(536.0mm),长度850mm,支持风冷散热方式,也支持液冷,采用更高效的48V 供电方式。
百度 X-MAN 系列产品多项技术行业领先,如 X-MAN1.0首次实现AI 计算硬件解耦架构、X-MAN2.0首次将冷板式液冷散热技术应用到 AI 计算产品里、X-MAN3.0首次倡导模块化标准化设计。此次百度将相关设计理念贡献到 OCP 并主导 OAI 标准制定,并实现了首款支持 OAI 标准及液冷散热的 AI 计算产品。浪潮作为百度的重要合作伙伴之一,一直在参与 X-MAN 系列产品的研发和生产。
OAI 标准获得行业广泛支持
OAI 项目是由百度、Facebook、微软三家国际 AI 领先企业联合发起的,包括多项标准,其中 OAM 标准已经在3月发布,OAI-UBB(UniversalBaseboard)标准已经形成初稿即将在10月正式发布。OAI 标准也得到了众多公司包括 Google、阿里、腾讯、京东云等互联网企业,英伟达、英特尔、AMD、高通、赛灵思等 AI 芯片企业,Graphcore、HabanaLabs、寒武纪等 AI 芯片及处理器初创企业,以及浪潮、IBM、联想、英业达等 ODM/OEM 系统厂商的参与和支持。当前英特尔、英伟达、AMD 和 Habana 已经开发出了支持 OAM 标准的 AI 加速卡,并且 OAI 项目成员相比3月初增长了近50%,这充分显示了 OAI 标准的全球影响力。
对此,百度副总裁侯震宇表示:“百度非常高兴能够与 Facebook 和微软及 OCP 其他成员围绕 OAI 标准的制定展开合作,该标准将极大提高不同 AI 硬件加速模块和系统的互操作性,加速新 AI 硬件加速模块的大规模落地应用。”
▲OAI 标准获得广泛支持
参与全球标准定义,打造软硬一体 AI 全栈解决方案
此次百度主导 OAM 和 OAI 标准定义,不仅将又一次推动 AI 新硬件技术全球范围内的创新与进步,还会进一步将自己在 AI 领域的最佳实践、专业能力和创新能力,贡献给国际 AI 社区,促进世界 AI 水平的进步。这不是百度第一次参与国际 AI 领域技术标准的制定了。2018年5月,在纽约人工智能大会上,百度、谷歌、斯坦福大学、哈佛大学等多家企业和高校联合发布了一套用于测量和提高机器学习软硬件性能的国际基准 MLPerf,旨在推动机器学习硬件+软件相关技术创新。
通过基础技术创新,百度正在打造 AI 芯片昆仑、超级 AI 计算平台X-MAN、深度学习框架PaddlePaddle等软硬一体全栈 AI 解决方案。
在“夯实移动基础,决胜 AI 时代”的战略指引下,百度也在稳步打造 AI 生态体系,加速 AI 技术的产品化和商业化进程。作为 AI 生态体系的重要组成部分,百度打造了面向自动驾驶领域的 Apollo 开放平台和对话式 AI 操作系统 DuerOS,并通过百度智能云的 ABC(AI、Big Data、Cloud Computing)三位一体发展战略,促进各行各业智能化升级。
来源 | 百度AI