启智讲堂

肖然《华为AI战略及开发者生态》

演讲者：肖然华为战略与发展副总裁

演讲速记（根据现场演讲整理，未经演讲者确认）
  尊敬的黄铁军秘书长、李世鹏秘书长、张伟民秘书长、各位来宾、各位同学，大家早上好。来到这里特别亲切，感谢鹏城实验室的邀请。亲切一方面是鹏城实验室，包括刚才秘书长分享的AITISA联盟，在人工智能方面跟华为有大量的志同道合的构想，我们有很多的合作，所以来到鹏城实验室的活动，就像回到自己家。
    今天是首届启智开发者大会，我在华为公司也负责开发者生态，也推动了几年，对各位开发者我感到特别亲切。
    这个活动在深圳南山，就在鹏城，大家知道华为公司就是从南山发展起来的，我家也在附近，所以非常高兴，周末的时间跟各位同学一起来做一些交流和分享。
    我今天的题目有点长，核心是希望利用这个机会介绍一下华为的AI战略。因为大家听到华为，可能更多的知道华为的5G，知道华为的终端，但是华为的计算业务，包括人工智能的战略，可能大家听到的比较少。我觉得鹏城实验室搭建这样一个平台，也是非常好的大家可以互相学习、互相了解、互相借鉴。
    （见PPT）这是华为对AI的思考，我们说AI也好，人工智能也好，甚至是区块链，这些概念都非常热，但是作为一个企业，我们如何看待这些大家认为炒作得有点过的概念，到底它的本质是什么，发展的阶段是什么，未来的方向是什么？
    我们认为人工智能总体来看，从技术层面可以分为三个阶段：一是弱人工智能，它的特点是基于芯片（CPU、GPU、FPGA）为主的基础设施，它擅长的是单方面的人工智能处理，包括图象、语音、内容分析等。第二个阶段是构筑在专有的AI芯片上的人工智能，它的特点是具备了认知和推理的能力，而且在某些特定的领域，它能够比肩人类的大脑。第三个阶段，它有一些新的基础设施的要求，包括类脑计算的芯片，包括相关的还在探索中的一些基础设施的技术。它的特点更多的是会具备感知和思想的意识，可能在更多的领域会超越人类，特别是在科学创新和社交方面，如果有这样的应用，我们把它姑且定义为第三个阶段，也就是超人工智能的阶段。目前我们正处在弱人工智能的阶段，随着融合视频分析、语义理解、自行判断、自主决策这些相关的技术，包括深度学习和强化学习算法进一步的成熟，各个行业和领域也正在迈进强人工智能的阶段。
    在这样一个阶段，我们来看看到底人工智能行业存在哪些挑战、风险和困难。总体来说可以用三个词概括：第一个挑战是贵，大量的算力，因为现在的基础设施的工艺是单一厂商，过去一段时间是一个单一厂商的工艺，所以它的价格是非常昂贵的，包括训练单机，去年14.9万美金左右，在云上的AI算力一小时要3美金左右，我们认为还是比较贵的。第二是门槛高，带来的就是的开发过程慢，包括对数据的标签，从数据的标注到模型的训练，到最终的使用周期是非常长的，往往是数周、数月。在这样一个门槛高的情况下，各个企业包括华为自身，我们也在识别AI的人才，包括选拔这样的人才，但是现在人才供给是严重不足的。因此第三就是专业人才的缺失，据统计，美国的AI专业人才缺口就有100万以上。
    这是一个小的视频，我刚才讲了一些挑战，我们看看华为是如何来应对这些挑战的，包括作为一个企业，我们是如何在AI产业发展大潮中定位和做好选择的。

    （播放视频）

    刚才这个视频谈到了一些华为在AI上的投资，包括我们的一些基本的考虑，我接下来再用几页胶片把一些要点给大家介绍一下。
    华为在AI上的愿景是希望能普惠AI，包括解决算力贵、开发慢、人才缺的问题，让每个企业和开发者能用得起、用得好、用得放心。战略上我们有几个大的举措，一个是长期投资基础设施，特别是在计算视觉、自然语言处理、决策推理等领域，我们希望构筑一个数据高效、能耗高校、安全可信、自主、自治、自动的基础能力，这里面有大量的基础设施的投资。然后还有全栈的解决方案，以及投资开放生态和人才培养，包括和我们的客户、合作伙伴一起来做人才培养，包括我们自己也在参与国家和高校的人才培养。另外就是解决方案的增强，人工智能作为一个通用的技术，它有大量的使用场景，对华为来说，在我们原来的核心业务上，我们会聚焦在通信管道，也就是网络的智能和自动驾驶方面会使用人工智能。另外就是大家用到的华为的手机上，我们叫HiAI，已经在率先使用人工智能，另外在华为公有云上提供的企业智能，已经在跟大量的合作伙伴给企业客户提供服务。还有一些是人工智能本身作为一些产品，在自动驾驶上的一些场景。对华为来说，还有一项我们一直在实践的内部的端到端的管理，包括人力资源、生产、物流的管理，也在使用人工智能。这是华为面向AI的选择。
    刚才提到了我们的主题，华为的全栈全场景。所谓的全栈全场景，这个全场景就包括了公有云、私有云、各种边缘计算，包括物联网行业的一些终端，以及消费类的终端，这些相关的各种环境，华为都有相应的方案。另案全栈更多的是从技术视角，包括底层的芯片，包括芯片的使能，包括开发过程的数据的收集、训练、推理的框架，这是全栈的，包括我们要面向开发者提供大量的应用使能。特别是在赋能行业，和行业一起解决问题的时候，我们更多地和我们的客户在思考，AI到底能解决什么问题，AI不是万能的，很多场景不是AI所擅长的。通过华为的实践，我们认为如下三个场景是AI特别能发挥它的优势和用武之地的：一是海量的重复的场景，通过AI可以完成自动化，并大幅提升效率。二是专家经验场景，因为专家作为一种稀缺的资源，AI往往可以逐步吸收专家的相关经验，并最终让更多人享受到专家的服务。三是多域协同的场景，特别是在一些超级复杂的场景，AI可以帮助人类突破人类本身的极限，去解决更有挑战的问题，这些是典型的在城市的智慧交通领域，跨行业、跨工种、跨地域、跨空间的管理，人工智能可以比人脑更有优势。
    我们在这个全栈场景下的核心是聚焦在提供芯片、基础框架，我们在基础框架上提供了包括开放开源的工具，和我们的行业伙伴一起识别关键场景，一起来完成相关的开发和探索。
    这里提到我们的生态，我们深知AI除了有大量的技术，更多的是生态伙伴，我们说全栈，不可能只有一家公司提供，需要和业界最佳的伙伴一起共同完成。
    （见PPT）这张图是一个示意，7月份我们的轮值CEO小徐总在北京做了一个华为战略的发布，也特别介绍了华为公司在智能计算，特别是人工智能里头有所为有所不为的战略选择。图中标黄色的是华为相对聚焦的，绿色的是我们正在积极合作的部分，华为主要聚焦在相关深度投资的芯片，包括围绕着相关的基础技术，另外会通过华为云这样一个商业模式来做变现。其有一部分的商业选择是我们基于昇腾和鲲鹏提供一些主板，大量的部件会慢慢交给我们的合作伙伴，我们把硬件会逐步开放出来。到了操作系统之上的软件，我们选择的是开源开放的思路，包括我们和社区在共同打造一个开源操作系统，在数据库方面，我们也在开元我们的单机版的高斯数据库，在大量的学习框架中间件上和边缘计算里面，我们都有开源的产品，还有面向高密计算场景的开源项目，这些项目目前都是美国的开源基金会，我们也希望中国有这种社区，包括启智社区，能有更多的项目开源出来。同时华为还提供大量的迁移和开发工具，这些工具是和我们的合作伙伴一起，我们也会提供一些免费的主流应用和软件迁移的服务，包括配套软件的工具。这是我们除了全栈全场景解决方案之外，在生态上的考虑。
    最底层的芯片，刚才视频里也讲到了，华为的芯片有一个特色，我们采用了统一的达芬奇架构的芯片，它是一个独创的三维弹性的立方体，它的特点是高算力和平滑、可扩展性，基于这样一个架构我们也发布了一些芯片，包括昇腾310和昇腾910，其中有一些场景，基于310的智能驾驶计算场景，MDC600、Atlas200和面向开发者的Atlas200开发工具，都可以提供给我们的伙伴和一些高校。昇腾910是面向训练长颈的，包括中心训练和中心推理，我们有Atlas300、Atlas800等等产品。我们如何真正让算力能更经济、能更充裕，这是芯片上的一些投入。
    刚才提到了开发框架，包括高院士开场提到的，我们大量的开发框架应用的是源于美国相关的技术，包括TensorFlow，可能慢慢大家会听到另外一个名字，就是MindSpore，它是一些非常创新的模式，包括我们支持新编程的范式，能提升编程的效率，包括把大量的编程提供成可微分的编程，包括新执行的模式，提升芯片本身的算力，讨论会图调度，我们可以把它整体下沉到芯片执行，释放芯片本身的优势。还有一个是新协作方式，包括原来的人工智能，在每次部署的时候要做多次的开发，我们希望做到一次开发、支持多次部署。
    MindSpore的几个特点我刚才已经快速讲了，这两天的会议上也有相关的研发的专家，包括负责云服务的总经理也在现场，他们都有一些分享，我就不展开讲它的具体的特点。
    另外一个是ModelArts，我们现在的很多开发环境不是面向人工智能设计的，因为人工智能和传统的程序开发有很大的差异，其中大量的G比特、T比特的数据处理，包括打标签、面前标签的版本管理，这是传统IT做不到的，面向人工智能未来的开发环境到底是什么样的？我们在华为开发云上提供了一个ModelArts，它是可视化的，特别是针对AI的全流程的管理领域，它把AI数据的筛选，自动标注，到算法的开发、训练、部署，以及上市，包括提供AI市场，端到端流程，通过一个工具把它打通。比如在AI框架里头，通过数据的预处理，包括自动的标注，效率有望提升100倍。在训练环节，我们的分布式集群的加速，训练时长可以从周缩短到分钟。因为AI本身是要面向很多商业场景去解决问题的，所以有大量的AI算法，包括API，实际上是可以参与到这个交易过程的，我们也提供了交易的平台。核心是希望通过这样一个ModelArts面向AI，而不是传统的计算环境来给大家提供一个新的开发平台，它的目标是让开发者上手更快，训练过程更快，上线更快、商业变现更快。
    （见PPT）这是ModelArts的几个特点，我们目前在自动驾驶领域已经做了大量的实践，这里有一个具体的例子，就是40T的原始数据预处理，按照传统的方式可能处理要800人天，通过ModelArts的能力，可以缩短到80人天，所以整个数据模型开发周期是从月缩短到了周。
    另外是很多开发过程支持自动学习，包括零AI基础就可以构建模型，包括我们在自动深度学习方面，特别提供了图象分类、物体检测、声音分类、神经架构搜索、自动迁移等相关的能力，包括在自动机器学习上，有自动特征提取、自动建模等等，包括全程UI的向导，而不是编代码本身。
    我们提到了算力，算力也是整个人工智能能否长期健康发展的一个基础，除了我们的芯片，包括在边和端侧的算力提供以外，华为公司跟鹏城实验室合作，我们提供弹性可伸缩最大1024节点超大规模区间的集群能力。1024集群的算力可以达到256P，它的训练集群包括了从通讯库、拓扑、低时延网络、端到端垂直整合，它的关键的指标也是让我们非常自豪的，愿意分享给我们的产业界的。包括刚才提到的1024的节点能做到256P，在训练时间上能到90秒，这是今年的数据，明年还会有更好的数据。在线性度，华为在1024节点，线性度能达到80%，这是业界最佳表现。
    今天可能还会分享鹏城云脑2，华为也给它提供了一些算力的基础，包括我们的Atlas900，我们希望通过这样一个架构，能支持鹏城云脑的持续、可平滑的扩展，从P级到E级AI集群的场景发展。
    刚才讲到人才的缺乏，华为也在跟高校和产业界，包括产业联盟的组织一起合作，一起推动AI人才的培养，我们内部叫做AI人才培养Program项目。
    同时我们针对高校的人才培养，内部也有一个创智计划，是面向全球发布的，我们希望在华为的AI全栈全场景能力上，和周边合作，包括在线精品课程和相关教材的开发，大家看到很多的教材，包括人工智能的教材，一方面可能都是来自于美国的技术，另外很多教材已经跟不上现在人工智能的快速发展。我们也跟专业的高校老师合作，希望有100个以上的AI的专业化的高校教师培训。还有产学合作协同育人项目，我们希望建设20多个创客空间和项目孵化的平台，因为人工智能有大量的用武之地还在挖掘，我们这里有大量的孵化的机会。同时我们提供华为AI认证服务，希望培养1万名以上华为认证的AI工程师。这是面向AI人才培养的计划，当然我们整体还有一个华为的沃土计划，除了AI，我们还有大量的其它的能力，包括云服务的能力，包括网络开放的能力，都是在这个计划中。
    以上就是简单给大家介绍的华为AI的战略选择，以及现在基于这个战略选择，在产品和解决方案方面，过去几年投资产出的一些全栈全场景的解决方案，希望在这些技术的基础上，和各个产业界的伙伴一起来合作，包括我们高校的学生，以及大量的开发者，一起把AI的算力真正释放出来。我们也希望跟鹏城AITISA联合推进AI的生态，在这里也做一个小预告，2020年2月份，同样是在深圳，我们会举办一届HDC开发者大会，也欢迎在深圳的同学和朋友能去参与，在那个平台上有大量的动手机会，有大量的代码出现，也会有我们的合作伙伴参与，欢迎大家共同参与。

启智社区，确实给力

启智讲堂

肖然《华为AI战略及开发者生态》