肖然《华为AI战略及开发者生态》

演讲者:肖然 华为战略与发展副总裁

演讲速记(根据现场演讲整理,未经演讲者确认)
    尊敬的黄铁军秘书长、李世鹏秘书长、张伟民秘书长、各位来宾、各位同学,大家早上好。来到这里特别亲切,感谢鹏城实验室的邀请。亲切一方面是鹏城实验室,包括刚才秘书长分享的AITISA联盟,在人工智能方面跟华为有大量的志同道合的构想,我们有很多的合作,所以来到鹏城实验室的活动,就像回到自己家。
    今天是首届启智开发者大会,我在华为公司也负责开发者生态,也推动了几年,对各位开发者我感到特别亲切。
    这个活动在深圳南山,就在鹏城,大家知道华为公司就是从南山发展起来的,我家也在附近,所以非常高兴,周末的时间跟各位同学一起来做一些交流和分享。
    我今天的题目有点长,核心是希望利用这个机会介绍一下华为的AI战略。因为大家听到华为,可能更多的知道华为的5G,知道华为的终端,但是华为的计算业务,包括人工智能的战略,可能大家听到的比较少。我觉得鹏城实验室搭建这样一个平台,也是非常好的大家可以互相学习、互相了解、互相借鉴。
    (见PPT)这是华为对AI的思考,我们说AI也好,人工智能也好,甚至是区块链,这些概念都非常热,但是作为一个企业,我们如何看待这些大家认为炒作得有点过的概念,到底它的本质是什么,发展的阶段是什么,未来的方向是什么?
    我们认为人工智能总体来看,从技术层面可以分为三个阶段:一是弱人工智能,它的特点是基于芯片(CPU、GPU、FPGA)为主的基础设施,它擅长的是单方面的人工智能处理,包括图象、语音、内容分析等。第二个阶段是构筑在专有的AI芯片上的人工智能,它的特点是具备了认知和推理的能力,而且在某些特定的领域,它能够比肩人类的大脑。第三个阶段,它有一些新的基础设施的要求,包括类脑计算的芯片,包括相关的还在探索中的一些基础设施的技术。它的特点更多的是会具备感知和思想的意识,可能在更多的领域会超越人类,特别是在科学创新和社交方面,如果有这样的应用,我们把它姑且定义为第三个阶段,也就是超人工智能的阶段。目前我们正处在弱人工智能的阶段,随着融合视频分析、语义理解、自行判断、自主决策这些相关的技术,包括深度学习和强化学习算法进一步的成熟,各个行业和领域也正在迈进强人工智能的阶段。
    在这样一个阶段,我们来看看到底人工智能行业存在哪些挑战、风险和困难。总体来说可以用三个词概括:第一个挑战是贵,大量的算力,因为现在的基础设施的工艺是单一厂商,过去一段时间是一个单一厂商的工艺,所以它的价格是非常昂贵的,包括训练单机,去年14.9万美金左右,在云上的AI算力一小时要3美金左右,我们认为还是比较贵的。第二是门槛高,带来的就是的开发过程慢,包括对数据的标签,从数据的标注到模型的训练,到最终的使用周期是非常长的,往往是数周、数月。在这样一个门槛高的情况下,各个企业包括华为自身,我们也在识别AI的人才,包括选拔这样的人才,但是现在人才供给是严重不足的。因此第三就是专业人才的缺失,据统计,美国的AI专业人才缺口就有100万以上。
    这是一个小的视频,我刚才讲了一些挑战,我们看看华为是如何来应对这些挑战的,包括作为一个企业,我们是如何在AI产业发展大潮中定位和做好选择的。
   
    (播放视频)
   
    刚才这个视频谈到了一些华为在AI上的投资,包括我们的一些基本的考虑,我接下来再用几页胶片把一些要点给大家介绍一下。
    华为在AI上的愿景是希望能普惠AI,包括解决算力贵、开发慢、人才缺的问题,让每个企业和开发者能用得起、用得好、用得放心。战略上我们有几个大的举措,一个是长期投资基础设施,特别是在计算视觉、自然语言处理、决策推理等领域,我们希望构筑一个数据高效、能耗高校、安全可信、自主、自治、自动的基础能力,这里面有大量的基础设施的投资。然后还有全栈的解决方案,以及投资开放生态和人才培养,包括和我们的客户、合作伙伴一起来做人才培养,包括我们自己也在参与国家和高校的人才培养。另外就是解决方案的增强,人工智能作为一个通用的技术,它有大量的使用场景,对华为来说,在我们原来的核心业务上,我们会聚焦在通信管道,也就是网络的智能和自动驾驶方面会使用人工智能。另外就是大家用到的华为的手机上,我们叫HiAI,已经在率先使用人工智能,另外在华为公有云上提供的企业智能,已经在跟大量的合作伙伴给企业客户提供服务。还有一些是人工智能本身作为一些产品,在自动驾驶上的一些场景。对华为来说,还有一项我们一直在实践的内部的端到端的管理,包括人力资源、生产、物流的管理,也在使用人工智能。这是华为面向AI的选择。
    刚才提到了我们的主题,华为的全栈全场景。所谓的全栈全场景,这个全场景就包括了公有云、私有云、各种边缘计算,包括物联网行业的一些终端,以及消费类的终端,这些相关的各种环境,华为都有相应的方案。另案全栈更多的是从技术视角,包括底层的芯片,包括芯片的使能,包括开发过程的数据的收集、训练、推理的框架,这是全栈的,包括我们要面向开发者提供大量的应用使能。特别是在赋能行业,和行业一起解决问题的时候,我们更多地和我们的客户在思考,AI到底能解决什么问题,AI不是万能的,很多场景不是AI所擅长的。通过华为的实践,我们认为如下三个场景是AI特别能发挥它的优势和用武之地的:一是海量的重复的场景,通过AI可以完成自动化,并大幅提升效率。二是专家经验场景,因为专家作为一种稀缺的资源,AI往往可以逐步吸收专家的相关经验,并最终让更多人享受到专家的服务。三是多域协同的场景,特别是在一些超级复杂的场景,AI可以帮助人类突破人类本身的极限,去解决更有挑战的问题,这些是典型的在城市的智慧交通领域,跨行业、跨工种、跨地域、跨空间的管理,人工智能可以比人脑更有优势。
    我们在这个全栈场景下的核心是聚焦在提供芯片、基础框架,我们在基础框架上提供了包括开放开源的工具,和我们的行业伙伴一起识别关键场景,一起来完成相关的开发和探索。
    这里提到我们的生态,我们深知AI除了有大量的技术,更多的是生态伙伴,我们说全栈,不可能只有一家公司提供,需要和业界最佳的伙伴一起共同完成。
    (见PPT)这张图是一个示意,7月份我们的轮值CEO小徐总在北京做了一个华为战略的发布,也特别介绍了华为公司在智能计算,特别是人工智能里头有所为有所不为的战略选择。图中标黄色的是华为相对聚焦的,绿色的是我们正在积极合作的部分,华为主要聚焦在相关深度投资的芯片,包括围绕着相关的基础技术,另外会通过华为云这样一个商业模式来做变现。其有一部分的商业选择是我们基于昇腾和鲲鹏提供一些主板,大量的部件会慢慢交给我们的合作伙伴,我们把硬件会逐步开放出来。到了操作系统之上的软件,我们选择的是开源开放的思路,包括我们和社区在共同打造一个开源操作系统,在数据库方面,我们也在开元我们的单机版的高斯数据库,在大量的学习框架中间件上和边缘计算里面,我们都有开源的产品,还有面向高密计算场景的开源项目,这些项目目前都是美国的开源基金会,我们也希望中国有这种社区,包括启智社区,能有更多的项目开源出来。同时华为还提供大量的迁移和开发工具,这些工具是和我们的合作伙伴一起,我们也会提供一些免费的主流应用和软件迁移的服务,包括配套软件的工具。这是我们除了全栈全场景解决方案之外,在生态上的考虑。
    最底层的芯片,刚才视频里也讲到了,华为的芯片有一个特色,我们采用了统一的达芬奇架构的芯片,它是一个独创的三维弹性的立方体,它的特点是高算力和平滑、可扩展性,基于这样一个架构我们也发布了一些芯片,包括昇腾310和昇腾910,其中有一些场景,基于310的智能驾驶计算场景,MDC600、Atlas200和面向开发者的Atlas200开发工具,都可以提供给我们的伙伴和一些高校。昇腾910是面向训练长颈的,包括中心训练和中心推理,我们有Atlas300、Atlas800等等产品。我们如何真正让算力能更经济、能更充裕,这是芯片上的一些投入。
    刚才提到了开发框架,包括高院士开场提到的,我们大量的开发框架应用的是源于美国相关的技术,包括TensorFlow,可能慢慢大家会听到另外一个名字,就是MindSpore,它是一些非常创新的模式,包括我们支持新编程的范式,能提升编程的效率,包括把大量的编程提供成可微分的编程,包括新执行的模式,提升芯片本身的算力,讨论会图调度,我们可以把它整体下沉到芯片执行,释放芯片本身的优势。还有一个是新协作方式,包括原来的人工智能,在每次部署的时候要做多次的开发,我们希望做到一次开发、支持多次部署。
    MindSpore的几个特点我刚才已经快速讲了,这两天的会议上也有相关的研发的专家,包括负责云服务的总经理也在现场,他们都有一些分享,我就不展开讲它的具体的特点。
    另外一个是ModelArts,我们现在的很多开发环境不是面向人工智能设计的,因为人工智能和传统的程序开发有很大的差异,其中大量的G比特、T比特的数据处理,包括打标签、面前标签的版本管理,这是传统IT做不到的,面向人工智能未来的开发环境到底是什么样的?我们在华为开发云上提供了一个ModelArts,它是可视化的,特别是针对AI的全流程的管理领域,它把AI数据的筛选,自动标注,到算法的开发、训练、部署,以及上市,包括提供AI市场,端到端流程,通过一个工具把它打通。比如在AI框架里头,通过数据的预处理,包括自动的标注,效率有望提升100倍。在训练环节,我们的分布式集群的加速,训练时长可以从周缩短到分钟。因为AI本身是要面向很多商业场景去解决问题的,所以有大量的AI算法,包括API,实际上是可以参与到这个交易过程的,我们也提供了交易的平台。核心是希望通过这样一个ModelArts面向AI,而不是传统的计算环境来给大家提供一个新的开发平台,它的目标是让开发者上手更快,训练过程更快,上线更快、商业变现更快。
    (见PPT)这是ModelArts的几个特点,我们目前在自动驾驶领域已经做了大量的实践,这里有一个具体的例子,就是40T的原始数据预处理,按照传统的方式可能处理要800人天,通过ModelArts的能力,可以缩短到80人天,所以整个数据模型开发周期是从月缩短到了周。
    另外是很多开发过程支持自动学习,包括零AI基础就可以构建模型,包括我们在自动深度学习方面,特别提供了图象分类、物体检测、声音分类、神经架构搜索、自动迁移等相关的能力,包括在自动机器学习上,有自动特征提取、自动建模等等,包括全程UI的向导,而不是编代码本身。
    我们提到了算力,算力也是整个人工智能能否长期健康发展的一个基础,除了我们的芯片,包括在边和端侧的算力提供以外,华为公司跟鹏城实验室合作,我们提供弹性可伸缩最大1024节点超大规模区间的集群能力。1024集群的算力可以达到256P,它的训练集群包括了从通讯库、拓扑、低时延网络、端到端垂直整合,它的关键的指标也是让我们非常自豪的,愿意分享给我们的产业界的。包括刚才提到的1024的节点能做到256P,在训练时间上能到90秒,这是今年的数据,明年还会有更好的数据。在线性度,华为在1024节点,线性度能达到80%,这是业界最佳表现。
    今天可能还会分享鹏城云脑2,华为也给它提供了一些算力的基础,包括我们的Atlas900,我们希望通过这样一个架构,能支持鹏城云脑的持续、可平滑的扩展,从P级到E级AI集群的场景发展。
    刚才讲到人才的缺乏,华为也在跟高校和产业界,包括产业联盟的组织一起合作,一起推动AI人才的培养,我们内部叫做AI人才培养Program项目。
    同时我们针对高校的人才培养,内部也有一个创智计划,是面向全球发布的,我们希望在华为的AI全栈全场景能力上,和周边合作,包括在线精品课程和相关教材的开发,大家看到很多的教材,包括人工智能的教材,一方面可能都是来自于美国的技术,另外很多教材已经跟不上现在人工智能的快速发展。我们也跟专业的高校老师合作,希望有100个以上的AI的专业化的高校教师培训。还有产学合作协同育人项目,我们希望建设20多个创客空间和项目孵化的平台,因为人工智能有大量的用武之地还在挖掘,我们这里有大量的孵化的机会。同时我们提供华为AI认证服务,希望培养1万名以上华为认证的AI工程师。这是面向AI人才培养的计划,当然我们整体还有一个华为的沃土计划,除了AI,我们还有大量的其它的能力,包括云服务的能力,包括网络开放的能力,都是在这个计划中。
    以上就是简单给大家介绍的华为AI的战略选择,以及现在基于这个战略选择,在产品和解决方案方面,过去几年投资产出的一些全栈全场景的解决方案,希望在这些技术的基础上,和各个产业界的伙伴一起来合作,包括我们高校的学生,以及大量的开发者,一起把AI的算力真正释放出来。我们也希望跟鹏城AITISA联合推进AI的生态,在这里也做一个小预告,2020年2月份,同样是在深圳,我们会举办一届HDC开发者大会,也欢迎在深圳的同学和朋友能去参与,在那个平台上有大量的动手机会,有大量的代码出现,也会有我们的合作伙伴参与,欢迎大家共同参与。