2018 年 10 月,华为在上海举办的全连接大会上公布了两款芯片:昇腾 910 和昇腾 310,并表示它们将在 2019 年面世。
2019 年 8 月 23 日,华为在深圳总部举办的昇腾 910 AI 处理器和 MindSpore 计算框架发布会上,正式发布算力最强的 AI 处理器 Ascend 910(昇腾 910),同时推出了全场景 AI 计算框架 MindSpore,后者将在 2020 年第一季度全面开源。
华为公司轮值董事长徐直军在发布会上表示:昇腾 910、MindSpore 的推出,标志着华为已完成全栈全场景 AI 解决方案(Portfolio)的构建,也标志着华为 AI 战略的执行进入新的阶段。
更多优质内容请关注微信公众号“AI 前线”(ID:ai-front)
华为副董事长徐直军仍然负责本次发布,在会上他宣布:昇腾 910 芯片正式发布。这标志着华为 AI 生态又向前迈进了一大步。
去年在上海的全连接大会上,徐直军确认了华为“造芯”的传闻,并 宣布推出昇腾 910 与昇腾 310 两款芯片,其中:
-
昇腾 910,是目前全球已发布的单芯片计算密度最大的 AI 芯片;
-
昇腾 310,是目前面向计算场景最强算力的 AI SoC。
得益于达芬奇架构针对 AI 运算特征的设计,这两款芯片能够大大加速华为 AI 在平安城市、互联网、金融、运营商、交通、电力等各行业的应用。
彼时,徐直军就在演讲中表示:昇腾 910 是目前为止计算密度最大的单芯片,最大功耗为 350W,半精度为(FP 16)256 Tera FLOPS,比英伟达 V100 的 125 Tera FLOPS 还要高出近 1 倍。若集齐 1024 个昇腾 910,将会出现迄今为止全球最大的 AI 计算集群,性能也将达到 256 个 P,不管多复杂的模型都能轻松训练。
在今天的发布会上,华为给出的最新测试结果表明:在算力方面,昇腾 910 完全达到了设计规格,即:半精度 (FP16) 算力达到 256 Tera-FLOPS,整数精度 (INT8) 算力达到 512 Tera-OPS,重要的是,达到规格算力所需功耗仅 310W,明显低于设计规格的 350W。徐直军表示:
昇腾 910 总体技术表现超出预期,作为算力最强 AI 处理器,当之无愧。与此同时,华为已经把昇腾 910 用于实际 AI 训练任务,比如在典型的 ResNet50 网络的训练中,昇腾 910 与 MindSpore 配合,与现有主流训练单卡配合 TensorFlow 相比,显示出接近 2 倍的性能提升。
那么这样一款算力超强的 AI 芯片售价会不会很高呢?徐直军表示目前昇腾 91最终价格还没有讨论出来,但是肯定不会比英伟达贵。
当然,徐直军也同步了昇腾 310 的最新进展:自发布以来,基于昇腾 310 芯片的产品和云服务获得广泛应用。其中,基于昇腾 310 的 MDC 和很多国内外主流车企在园区巴士、新能源车、自动驾驶等场景已经深入合作。基于昇腾 310 的 Atlas 系列板卡、服务器,与数十家伙伴在智慧交通、智慧电力等数十个行业落地行业解决方案。基于昇腾 310,华为云提供了图像分析类服务、OCR 服务、视频智能分析服务等云服务。
面向未来,针对不同的场景,包括边缘计算、自动驾驶车载计算、训练等场景,华为将持续投资,推出更多的 AI 处理器,面向全场景持续提供更充裕、更经济、更适配的 AI 算力。
全场景 AI 框架 MindSpore 将于 2020 年 Q1 开源
除了昇腾 910,MindSpore 计算框架是今天的另一位主角。
MindSpore 是支持端、边、云独立的和协同的统一训练和推理框架,作为华为 AI 全栈全场景解决方案的重要一环,MindSpore 被认为是华为布局 AI 生态的一张王牌。
很多人一直认为华为的优势在于硬件,但其实,华为近些年来在软件上的进步也不容小觑。2018 年全连接大会上,华为接连推出了一系列软件解决方案,除了 MindSpore,还有:兼具最优开发算力和算子性能的 CANN(芯片算子库和高度自动化算子开发工具),提供全流程服务的 AI 开发平台 ModelArts。
据介绍,全场景支持,是在隐私保护日渐重要的背景下,实现 AI 无所不在越来越基础的需求,也是 MindSpore 的重要特色。针对不同的运行环境,MindSpore 框架架构上支持可大可小,适应全场景独立部署。
MindSpore 框架通过协同经过处理后的、不带有隐私信息的梯度、模型信息,而不是数据本身,以此实现在保证用户隐私数据保护的前提下跨场景协同。除了隐私保护,MindSpore 还将模型保护 Built-in 到 AI 框架中,实现模型的安全可信。在原生适应每个场景包括端,边缘和云,并能够按需协同的基础上,通过实现 AI 算法即代码,使开发态变得更加友好,显著减少模型开发时间。
以一个 NLP(自然语言处理)典型网络为例,相比其他框架,用 MindSpore 可降低核心代码量 20%,开发门槛大大降低,效率整体提升 50% 以上。通过 MindSpore 框架自身的技术创新及其与昇腾处理器协同优化,有效克服 AI 计算的复杂性和算力的多样性挑战,实现了运行态的高效,大大提高了计算性能。除了昇腾处理器,MindSpore 同时也支持 GPU、CPU 等其它处理器。
从去年华为在 HC 大会透露即将推出自研 AI 框架 MindSpore 以来,业内一直有人抱有疑问:已经有了 TensorFlow、PyTorch 等成熟的 AI 框架,华为为什么还要开发一个新的框架?对于这个问题,徐直军在现场回应称:“这是因为我们现在还没有看到哪一个框架能够真正做到支撑全场景,而华为 MindSpore 的目标就是成为这样一个框架”。
下面是 MindSpore 的详细技术特性:
-
MindSpore 秉承“AI 算法即代码”理念,提供一系列关键技术,其中 MindSpore 自动微分采用 Source 2 Source 方式实现,在性能和可编程性上,显著优于业界图和运算符重载方式,能够实现任意算子的微分表达和编译优化,同时实现反向算子自动生成,极大地方便模型开发。
-
随着数据集和模型规模越来越大,模型并行将成为必然,手工切分的模型并行:门槛高、效率低、调优难,而 MindSpore 只需定义单机模型即可实现多机混合并行运行,无需了解 AI 集群细节。MindSpore 调试同时支持静态图和动态图,且可用一条语句实现无缝切换,使得调试简单而高效。
-
在运行态友好方面,MindSpore 提供 Ascend Native 运行技术,能够帮助昇腾芯片的算力达到最优发挥。主从控制模式中,CPU 和 GPU 交互会引入内存和数据开销,MindSpore 能够在芯片上完成神经网络模型训练的所有控制和执行,减少和主机 CPU 的交互时间,速度更快。已有的分布式训练方案引入中心控制来寻找梯度同步点,MindSpore 实现了去中心化的分布式梯度聚合,完全消除控制开销。软硬件优化为不同类型算子,映射为最佳的计算单元和数据布局,获得最佳性能。
综上所述,MindSpore 为数据科学家及研究人员提供了全新的工具,使理论探索和创新变得更加简单高效。为了更好促进 AI 的应用,徐直军宣布
MindSpore 将在 2020 年 Q1 开源,助力每一位开发者,促进 AI 产业生态发展。
针对开源生态,想必大家都很好奇,华为打算如何吸引开发者并赢得开发者的信任。徐直军直言,对于 MindSpore 来说,最大的挑战就是能不能像其他框架一样建立一个足够好的生态。但对此徐直军很乐观,他认为华为有其优势所在,比如算力和开发引擎,开发者可以在华为 AI 开发引擎上自由开发相应的服务与应用,将算力和 MindSpore 计算框架相结合,开发者可以打造很多其他框架不可能做到的事情。
至此,华为想做的全栈全场景 AI 解决方案已经初步形成。它将助力开发者克服 AI 开发过程中遇到的困难,包括训练耗时长、调试部署繁、开发效率低等等。对于进入 AI 时代的华为来说,开发者已经成为和行业合作伙伴同样重要的角色。华为想要打造的是打通底层硬件到上层软件应用、开发者与行业两手抓的全方位 AI 生态体系。
正如徐直军所说:只有把生态打造起来,华为的全栈全场景解决方案才有生命力。为此,华为曾在去年推出了“沃土 AI 开发者使能计划”,旨在培养更多 AI 人才、提升开发者的 AI 能力。直白地说,就是让更多技术人成为 AI 开发者,并加入华为的 AI 生态圈。
今年 7 月,华为围绕鲲鹏技术体系,打造了集技术支持、知识共享和产业互助为一体的 鲲鹏社区,与客户、伙伴、开发者共建开放共赢的鲲鹏生态,致力于加速鲲鹏的产业化进程。
华为在 AI 和云两大领域都建立了自己的开发者生态,一个更加开放、进步的生态圈似乎正在逐步成形。
8 月 9 日,在华为开发者大会 2019 的现场,鸿蒙操作系统 正式发布,据华为消费者业务 CEO 余承东介绍:这是全世界第一个基于微内核的全场景分布式 OS,通信效率秒杀现有一众操作系统。并表示:如果未来某天安卓不可用,鸿蒙将随时可以顶上。
鸿蒙给国产操作系统打了一针强心剂,但是华为面临的情况仍然不容放松。
8 月 19 日,也就是本周一,美国商务部长威尔伯·罗斯 (Wilbur Ross) 表示:美国将允许美国公司在未来 90 天内,继续与华为进行业务往来。这一决策确实部分缓解了对华为的技术封锁,虽然目前华为“软硬兼备”,但 90 天后该怎么做,仍然是个不小的挑战。
正如华为创始人任正非所说:美方的做法对美国本土的公司也造成了深远的影响。不少美国公司曾游说美国政府放缓对华为的限制,因为他们或多或少都与华为有着不同程度的合作关系,两败俱伤的结局一定不是大多数人希望看到的。
虽然面临着不少困难,但是华为的未来仍然值得期待。今天,徐直军在回答记者提问时再次强调:
外部的事件对于华为 AI 的发展没有任何影响,目前一切都在按照计划发展。随着 5G 时代的到来,华为希望通过实现模型的闭环、实时更新,保证企业 AI 应用始终处于最佳状态,并将 AI 技术与 5G、云、物联网、边缘计算、区块链、大数据、数据库等技术充分协同,发挥出更大的价值。
在答记者问环节,徐直军透露:华为正在开发自己的自动驾驶解决方案,同时,今年即将在上海举办的全连接大会上,将会有更加重磅的 AI 产品发布,AI 前线也将持续保持关注。
来源 | AI前线
作者 | 陈思、蔡芳芳