近年来,人工智能技术的突破性进展,离不开两大核心驱动力——强大的算力基础设施与开放协作的用户生态。在中国科技自立自强的战略背景下,由鹏城实验室牵头建设的中国算力网正不断推动国内自主算力资源迈入“全民共享”时代。
今年新春,国内外AI界都在为DeepSeek而沸腾。自2024年底震撼发布其新一代模型以来,DeepSeek凭借其前瞻性的开源策略与卓越的技术创新,迅速跃升为AI领域的焦点,并在国内外AI模型界赢得了广泛的关注与赞誉。
为了进一步降低国内AI开发者参与门槛,OpenI启智社区作为“中国算力网开源开放试验场”,已在春节期间及时通过“大模型基地”上线DeepSeek系列模型(包括“自然语言处理”的DeepSeek-V3和DeepSeek-R1-Distill-Qwen、DeepSeek-R1-Distill-Llama系列不同参数模型,以及“计算机视觉”的DeepSeek-CV系列模型)。无需进行复杂繁琐的配置,开发者可直接基于已上线的模型和社区提供的算力资源、一站式AI开发环境自行开展模型验证和测试,体验DeepSeek模型的强大功能。
大模型基地地址:
https://openi.pcl.ac.cn/modelbase/list
依托中国算力网卓越的算力调度与智能分配能力,OpenI启智社区现已成功部署DeepSeek-R1满血版(671B),且已适配英伟达GPU资源,并积极携手全国各地的算力中心合作伙伴,共同开放更多经过深度适配的普惠自主算力资源,包括华为的NPU、天数智芯的GPGPU、海光的DCU以及燧原的GCU等,为广大开发者提供更加丰富的选择。
值得一提的是,在鹏城实验室与华为昇思MindSpore及华为昇腾团队的通力协作下,我们已完成DeepSeek部分模型在昇腾NPU 910A、910B上的适配工作,这些模型现已能在MindSpore与PyTorch框架上顺畅运行,并已通过OpenI启智社区开源开放。同时,“中国算力网开源开放试验场”合作伙伴也将于近期完成两个版本模型的部署。借助中国算力网,我们将硬件资源高效整合,形成“算力云际池化”模式,旨在帮助开发者在使用DeepSeek模型时实现计算效率的大幅提升。
为了方便大家基于910A计算资源本地部署或通过华为云ModelArts平台部署DeepSeek模型(PyTorch/MindSpore框架),我们开源了部署方法,供给类昇腾用户参考和快速上手,链接如下:
https://openi.pcl.ac.cn/OpenIOSSG/Ascend910A-DeepSeek-Service
如果说中国算力网为国内AI发展提供了“燃料”,那么开源生态则是点燃AI技术突破的“火花”。自OpenI启智社区上线DeepSeek后,蛇年春节期间,系列蒸馏模型被社区开发者体部署体验超过两万次,社区累计为开发者提供了上万卡时高性能计算资源体验DeepSeek,我们见证了开源力量与普惠算力深度融合的典范。下一步,在开源开放试验场的基础上,我们将通过中国算力网云际协同机制,将DeepSeek系列模型一键进行分发部署到各地算力中心,支撑算力中心基于本地算力形成特色化模型服务能力。
从“算力自主”到“普惠共赢”,中国科技界正以开放胸怀书写新的篇章,探索科技创新的新路径。通过共享资源、协同创新,中国算力网将致力于构建一个更加开放、包容、共赢的科技生态,为推动全球科技进步贡献力量。