吴甜《飞桨开源平台助力产业智能化》

演讲者: 吴甜,百度集团副总裁,深度学习技术及应用国家工程实验室副主任,百度黄埔学院院长


演讲速记(根据现场演讲整理,未经演讲者确认)

    尊敬的各位来宾、开发者朋友们、同学们,大家上午好!我今天带来的是启智飞桨项目的报告,这个项目是一个完全开源的项目,我们也能够看到,现在整个软件开源的发展势头是非常迅猛的,这一组数据是来自于github上的数据,能看到github上已经积累了4000万开发者,2019年全年新增1000万代码库有4000多万,44%的用户在2019年创建了自己的代码库,拉取请求也是在今年一年有大量的用户在创建自己的首个拉取请求。70%的全球50强企业都在为开源做贡献,有大量的学生在github上学习编程、练习编程。可以看到全球开源开放是非常迅猛的发展状态,在使用最多的20个国家和地区中,中国开发者在fork和clone中的比例已经超过了48%,这个数据是非常惊人的,在这样的背景下,启智这样一种新一代的人工智能开源开放平台对我们国家来说是非常重要、非常有意义的一件事情。
    可以看到开源软件已经形成了一种重要的软件创新发展模式,而且开源软件这样一个协同模式也在加速全球化。而人工智能浪潮推动着整个开源软件生态系统越来越繁荣。
    人工智能技术在和产业进行持续的深度融合的过程中,因为人工智能技术的一些特点,我们能看到人工智能技术本身是一个多技术整合的领域,它并不是单一技术来解决现实场景中的问题,而且这些大量的技术在积累下来之后,其实是可以进行能力的复用的。在人工智能技术和产业结合的时候,本身它又是一个社会分工精细化和组合式创新的过程,它需要整个产业链生态角色打通。同时,因为这一系列技术需要进行大数据的计算,所以对于产业来说,对于用户来说,它的数据保密、隐私、国家安全又是非常重要的。所以人工智能开源开放平台本身也是在现在这个时代当中非常重要的。
    这一轮的人工智能技术是由深度学习技术突破所推动发展起来的,深度学习技术就离不开深度学习框架,开源深度学习框架在整个技术栈当中属于是向下衔接芯片、向上承接应用,生态当中也是这样的位置,它拥有自己开发的生态,向下与硬件生态紧密结合,向上与应用的生态紧密结合。所以我们认为这样一个软件本身它是在新的时代里,类似于操作系统这样一个位置的软件,而基于基础框架,加上它的基础上的平台组件等等形成的整体深度学习平台,也是构建AI生态,加速产业智能化的核心基础。
    启智飞桨项目就是这样一个深度学习开源开放平台,飞桨上积累了大量能力,来源于产业的实践,它其实也是产学研融合推动起来的完备的平台,在核心框架层,覆盖了开发、训练、预测全方位的能力,在基础模型库上已经覆盖到了自然语言处理、视觉、推荐和语音等等主流的人工智能算法方向。在飞桨上有面向端到端场景的开发套件,这一系列开发套件会在场景当中进一步降低使用的门槛,在工具组件上也已经覆盖到了大量的自动化深度学习、迁移学习、强化学习等一系列的主流学习的算法方向。而在服务平台上进一步的推出了一系列的平台,降低AI的门槛。
    在飞桨上现在已经累计有150万以上开发者在使用,在飞桨和产业应用不断结合的过程中,我们能看到有大量的创新产生,同时也有很多和大规模结合应用的挑战。今天我会分享几个我们所观察到的重要的挑战和难点,以及飞桨未来的重要发展方向。
    首先在向互联网产品应用中,互联网产品是拥有海量数据的,它的内容覆盖网页数据、媒体内容、用户贡献内容等等一系列数据,需要进行超大规模数据分析处理,同时又有海量的用户群体。而且因为这些产品在线上与用户实时地进行交互和反馈,所以有很多产品也是有这种在线的流式学习需求的。所以对一个深度学习平台来说,在这样一个场景下,需要有很强的分布式训练的能力,在飞桨平台上已经实现了超大规模稀疏性特征参数服务器,能够支持万亿计模型参数量和千亿级训练数据,有数百个节点的训练能力,并且也实现了终生流式学习。也就是说像这些万亿级模型参数量是在线上进行实时的更新迭代的。所以对于飞桨来说,持续地进行更强的分布式计算能力、异构计算能力,就是我们的方向之一。
    刚刚说到的是训练层面的,另外一个角度是在预测、推理和部署角度的。我们知道模型训练出来之后,最终能不能发挥作用,还是要放到场景当中,我拿人脸识别举例子,我们可以看到人脸识别已经在非常多场景在用,像人脸考勤、人脸闸机、监控等等一系列场景,每一个场景都有自己独特的要求,相应的硬件设备都有对安全性、能耗、性能等等不一样的一系列要求,在这样一些场景去部署的时候,对于算法工程师来说,每个场景都进行适配,这个工作量其实是非常大的,同时对算法工程师的能力要求也太高了,所以我们也在想,在飞桨平台上能否为大家提供更强的在硬件平台和在场景当中的集成能力,所以飞桨的第二个重要方向是持续地去进行全硬件平台的支持,研究端、云、边结合的完美方式。
    今天我们的人工智能技术在和实体经济进行深度的融合,应用于传统行业的时候,也有一系列的难题,比如说质检领域,之前这个领域在应用传统视觉算法,而传统视觉算法有很多的不足,在深度学习技术下是可以解决的。在迁移的过程当中,对于很多的企业来说,有三个难题,首先是问题定义、技术选型的难题,把这个问题怎么样能够界定成一个可解的问题,它就是我们有好的方法或者模型能够适用上来,在产线上是不是能获取到足够好的异常样本,还有最终的容错情况等等,这一系列的问题对于企业来说都会带来困扰。所以对企业来说其实也是需要有好的一系列的方案能够去进行案例的投射。
    第二个难题是,即使选定了模型,真正验证的时候,成本也是很高的,研发周期也很长,在我们的开源项目中没有新的模型产生的时候,其实是有新的相应的模型代码产生的,但是它常常和实际的产业应用结合的时候,还会存在一些标准,存在一些和自己的应用结合时连接的适配的问题。当然这些模型也很纷繁复杂,有些就是在特定数据集上开展的,对于企业进行选择的时候需要很长的量的周期进行验证。
    第三个难题是传统行业在应用的时候,设备本身是有成本的限制,以及特定的性能要求的,比如说有可能流水线上对于这一块就是需要做一次推理预测,在很短的时间内要完成,流水线产线上本来的设备也没有那么高级,这个时候也会有一系列问题产生。所以基于此,飞桨也构建了一套端到端的开发套件,来解决这些场景当中的问题,基于这样一套开发套件,首先可以进行案例的投射,让开发者可以在丰富的案例当中去选择最适合场景的方案,再加上数据的标注、增强等等一系列的工具箱以及开发训练的整套工具,可以让开发者很快速进行验证,因为这样一整套工具本身都是开源的,所以也很方便进行深度定制,最后可以整个环路快速的实现,能够进行最后的系统集成。
    这里大家也会发现,我们有专门的预训练模型+迁移学习工具的模式,这个模式我们称为飞桨Master模式。深度学习在学习的时候,大算力、大数据和大模型的要求,往往会成为很多使用者的一个壁垒和们不单单是很多企业,对于大量的开发者和各位同学来说,我们在使用的时候,算力资源、数据资源都是不够的,包括调模型的经验都是不足的,飞桨这样一套模式把百度的算力和数据,以及模型设计和调优的能力集成进去,我们提供了丰富的预训练模型,现在在飞桨上开放出来的预训练模型已经达到了100个以上,举个例子,在利用的百度的知识增强的语义理解模型的基础上,可以把一个分类的任务从原来7人天的工作量降低到1人天以内,并且效果可以做到从原来对场景来说几乎不可用,到一个非常高的效果。这样一系列的工作都会有助于开发者和同学们使用。
    飞桨上已经形成了四大领先技术:一是融合了静态图和动态图开发便捷的深度学习框架,在我们的设计中,兼备了动态图和静态图的底层设计,使得可以兼顾性能和易用性。二是超大规模深度学习模型训练技术,第三是多端多平台部署的高性能推理引擎,第四是产业级开源模型库,这里面有基础模型库,也有预训练模型库。
    基于飞桨的AI开放能力非常丰富,能看到主流的AI方向我们都可以有非常多的场景上的尝试。现在在飞桨平台上已经凝聚有150万以上的开发者,服务了6.5万以上的企业,累计创造了16.9万个模型,覆盖到各行各业,包括工业、农业、教育等等行业,有大量的场景都在使用。
    启智飞桨这样一个项目,希望飞桨就像一艘快艇,在启智平台这样一个大海上借力助势,能够快速发展,能够为我国的人工智能技术发展,为我们的产学研的综合性发展带来帮助,加速整个产业智能化。