OpenI 启智社区

启智社区,确实给力

当前位置:首页 > 资讯 > 社区动态 >

混迹过超多开源社区的黄之鹏老师,为你解码AI开源的技术应用与未来趋势

  • 发布时间:2022-04-18

近年来,随着深度学习和云计算的不断发展,AI开源逐渐成为众多开发者谈论的核心,其重要性显著提升。AI开源引领着各项技术应用向前,而技术应用又进一步促进AI开源的发展。

4月11日,OpenI启智社区特邀本社区技术委员会委员、华为昇腾开源生态总监黄之鹏老师作客由OpenI和InfoQ联合推出的《人工智能开源录》直播访谈栏目,解码“AI开源的技术应用与未来趋势”。


一、个人经历及对开发者的建议


黄之鹏老师介绍自己接触过很多开源社区,初入华为公司时接触的是云计算开源的相关社区,比如OpenStack,OpenDaylight,OpenVswitch,以及云原生Kubernetes社区。从2019年下半年开始,便开始负责MindSpore整个开源社区的建设。


阴错阳差与AI结缘

做通信出身的黄老师介绍自己一开始接触的是比如快速傅里叶变换的这些领域,本应该是去到华为的无线部门,却阴差阳错与云计算结缘。


黄老师说数学是他与AI之间的一个连接点。早在他读硕士期间,他接触过一个无线传感网的项目,为了设计一套比较好的预测网络拥塞的协议,当时在用卡尔曼滤波器(Kalman Filter)的工具去实现算法过程中,黄老师发现它与深度学习的很多原理有着类似。四五年前的AI热潮下,黄老师开始正式接触AI。由于曾经深入地看过一系列AI相关的论文,黄老师发现,人工智能研究涉及的很多关于数学的推导、演算,与做通信出身的他所接受到的数学的训练非常类似。这些经历促使黄老师比较快速的从一个门外汉入门AI。


开源初心不能忘

黄老师认为,目前国内很多企业没有特别处理好的一个问题是做开源社区的初心和期望不够明确。大家普遍认为做开源社区是通过四处宣讲布道来得到影响力,然而,在与开源社区真实参与过开发的人进行交流时,会发现做开源的初心最终还是会回到“人”这个命题上


相比有些公司为开源设定的商业KPI这冷冰冰的数字而言,黄老师通过分享社区一个身处东北的开发者在东北去年初雪时,为从未见过雪的社区运营助手“小猫子”在雪地上写上她名字的有趣故事,来表达自身更关注开源的人情温度,也让他感觉这是2021年成就感最强的事情。


同时,黄老师也认为,开源最主要的在于动作,一定要发自内心地做对很多事,目标自会水到渠成。黄老师回忆他接触开源社区初期,在北美曾发生过一件让他印象深刻的事情,为了打造一个全球化的社区,需要大家克服时差导致的晚睡早起、精力有限的困难。然而,美国开发者们在面对来自有着时差的日本、英国和印度等国用户的提问时,却响应非常快。大家在开源时的忘我拼搏精神颠覆了对“美国人习惯懒惰,华人非常刻苦”的惯有刻板偏见。


开发者建议 | 新手小白如何选择适合自己的开源项目

黄老师结合他本人的个人经历,建议大家选择一个自己最熟悉或擅长的领域,去尝试做第一个开源项目。而他当时虽然踏进了全然不懂的云计算行业中,但也是选择他最熟悉的协议设计作为他第一个开源项目的切入点,然后查看相关的论文,跟随项目开例会,慢慢熟悉和参加进去。


开发者建议 | 人工智能能量补给站

关于人工智能,黄老师推荐了一本由作者侯世达写的新书《我是个怪圈》,以及他之前最有名的、非常集大成的一本书《GEB》(集异壁),介绍三个看似不太关联的艺术家,通过一系列问答故事,将很多关于人工智能的理解传承到了《GEB》书中,可以很好的帮助大家补充一些关于人工智能的人文周边背景


 


二、人工智能开源生态


浅谈深度学习领域的技术应用与突破

深度学习框架是推动AI应用大规模落地的关键力量,在人工智能技术体系中占据非常重要的地位。那么,如何选择一个得心应手的深度学习框架,以及目前主流的开源开源的深度学习框架有哪些?


黄老师基于个人角度浅谈了框架的发展简史,比如,最初的框架为浅层框架,由于大家最始接触到的是类似Theano、Caffe这一代的框架,然而它们更多属于工具类而非如今的框架。


从2016年开始,大家就迎来了第二代浪潮即通用框架或较深层框架时代里的熟悉框架,比如Tensorflow, PyTorch, 和李沐老师的Apache MXnet,这一批的框架可以提供一套完整的语义描述,基于这些框架可以写出某一类任务的若干模型。


第三次浪潮便是以昇思MindSpore、谷歌的Jax为代表,而第三代框架有几个特点,首先是AI+科学计算的强能力,未来框架必备的一个能力便是能支撑深度学习和科学计算的结合。其次是基础模型的研发,作为新一代的框架,它需要能支持训练基础模型,且是面对某一领域具备很强泛化性和基础能力的模型。第三个是全场景,由于整个AI应用的范畴在多个场景都会出现,新一代的框架需要在很多个不同的场景下,基于一套框架便可以支持开发AI应用。


总的来说,就是经过三波浪潮,目前,深度学习框架的已经发展到了能够与科技深度结合,支持基础模型的研发,支持全场景,面对不同场景具备生成能力


支持全场景覆盖的MindSpore版本迭代经历

MindSpore目前已经到了1.6版本,黄老师介绍版本迭代的时间比较固定,大致有两个阶段,而在开源的第一年,也就是2020年是最疯狂的时候,基本一个月就发布一个可商用的版本。在发布了1.0这个对用户而言可以放心使用的版本之后,从2021年开始,MindSpore基本上保持稳定的一个季度发布一个版本的节奏。


目前,MindSpore可以说是国产开源项目的代表性案例。在这两年的发展过程中,MindSpore都是从完全原创的角度为每一个版本不断添加新的功能特性,比如图学习、联邦学习、增量学习等。MindSpore在过去的2年里,以尽可能最短的时间迅速夯实基础,同时也在不断推出非常有竞争力的东西。


MindSpore开源治理经验分享

根据最新报道,昇思MindSpore今年将融入鸿蒙和欧拉生态,成为内置的 AI 引擎。昇思MindSpore 到目前,已突破140万用户下载量,服务了5000+ 企业,短短2年取得了傲人的成绩,这都跟MindSpore开源社区的运作与管理分不开。


黄老师分享治理社区经验时,指出治理是一个非常专业的领域,并介绍了它的三个维度


最重要的维度是开放性,而MindSpore算是企业推动开源AI框架里,第一个采用开放治理模式的社区。比如,社区不仅有大家都能看到的指导各机构运作的章程,还有14名横跨中国、欧洲、英美等代表组成的全球性的技术委员会,而MindSpore版本特性模块的开发是通过SIG(Special Interest Group)组织,所有需要跨模块合作以解决场景性问题的是通过WG(Working Group)来承载,同时也会通过大量的投票活动收集大家的意见。


第二个维度是多样性。MindSpore的多样性体现在很多方面,比如,面向国内外不同城市、不同企业、不同高校的MSG(MindSpore Study Group)这一类的开发者社群,把开发者都组织起来参加社区的活动。多样性也体现在社区很多的专题活动,比如,科技从业女性主题的自由分享和交流经验的Women In Tech。


第三个维度是可信,企业对很多开源软件的使用是基于一定信任的,所以MindSpore也跟国内很多标准组织、产业组织进行了合作。通过社区治理推动开源项目和开源社区更值得信赖。


为OpenI启智社区深度打Call

提到OpenI启智社区,黄老师在线为它打Call。MindSpore与OpenI启智社区有着非常紧密的合作,共同举办过诸如集结号这样的开发者活动,邀请来自各个高校的学生利用假期的时间集中在一起进行MindSpore相关模型的开发活动。


黄老师说他跟启智的渊源其实要比MindSpore还要久,并介绍OpenI启智是以鹏城实验室等科研机构进行支撑和推动建设的国内第一个专注人工智能开源的非常好的社区。这对于推动科研工作者们进行开源是非常难能可贵的,同时,OpenI启智社区的章程设计也有这很高的完备度,欢迎大家通过访问官网(www.openi.org.cn)进行查看。


社区也经常邀请人工智能开源相关的专家学者进行开源与知识产权结合的讲座分享,这在国内目前依旧是非常小众的领域,而它对科研院校和企业的开源应用非常重要。为了保护知识产权,启智社区在初期还建立了自己的开源许可证,希望能探索更多符合我国国情的开源知识产权管理方法。同时,启智社区有着非常多种类且名字非常有趣的开源项目,比如启智章鱼、启智珊瑚等很有深圳特色的项目名称,对人工智能感兴趣的人,可以在启智社区里找到自己非常喜欢或者感兴趣的项目。另外,OpenI启智社区也经常举办各种跟开源相关的活动,除了集结号,还有校园行系列分享活动、开发者大会、全国人工智能大赛等多样化活动,推动我国人工智能开源发展。


三、人工智能开源的未来发展


开源越趋年轻化之象

目前,MindSpore社区中的布道师以及开发者,普遍存在年轻化的趋势,且很多来自在校大学生,对于这种年轻化趋势的现象,黄老师非常赞同,认为开源本就应该为年轻人提供一个更广阔的舞台,让他们更愿意去讲述分享自己的故事,让开源更具朝气。同时,也因为目前人工智能是处于起飞状态的朝阳产业,越来越多的高校开设人工智能的专业以及人工智能学院,吸引了更多年轻人踏入到人工智能学科与行业。


同时,黄老师也指出其中的挑战,即在跟商业接轨这块,需要他们更加认真、严肃对待开源。尤其在打造专业的开源社区时,日常涉及的工作虽然枯燥,但为开发者和企业提供的每一项服务都类似于在精心打造一款产品,需要严肃认真交付和不断迭代、复盘,希望更多年轻人关注开源是一件很专业也很严肃的事情


四、直播互动精选问答


自动驾驶的全面发展

直播间有小伙伴提问关于“AI驾驶是否会全产业链发展”的问题,黄老师认为,对于跟人工智能或者深度学习的结合来说,自动驾驶算得上是最全面的一个场景。因为它要涉及深度学习几大类任务,比如对图像做大量处理的cv类的任务,以及nlp类的任务去做很多跟自动驾驶相关的功能,还有类似交规遵从这类强化学习方面的任务。由于自动驾驶本身是一个会把很多领域的深度学习技能都集合到一起的领域,所以自动驾驶将来会形成一种全面的发展。


CV和NLP模型最终将实现统一

有小伙伴提问黄老师如何看待CV和NLP模型统一的发展方向,黄老师提到最近比较火的、业界也有不少专家很看好的transformer,认为它非常有希望能提供一套把cv类的任务和nlp类任务最终实现统一的架构。黄老师还回忆他们之前在做有关论文的分享时,发现如果transformer作为大一统架构,则意味着语义可以作为描述包括视觉、自然语言处理等一系列广泛任务的基础,将很多此前只在书本上的哲学讨论,一下子拉进了现实,它也将带来更深远的影响。不过基于其他研究,除了transformer,也将有其他的方式来实现统一。


开源是否能帮助国产深度学习框架在通往主流道路上实现跨越式发展

黄老师谈起了他在InfoQ发布的第一篇关于“对开源的作用应该如何认知”的文章,他认为无论是深度学习框架还是人工智能,能植根于中国的依然是技术创新,但它还要依靠大量的科学家、工程师踏踏实实的不断研究算法、做工程实现,来弥补当前国产技术的不足,推动国产深度学习框架不断迭代发展。而开源是目前能够看到的帮助创新的最佳方式,虽然它并不能帮助跨越式发展,但它能加速整个生态的成长。如果用开源的方式去帮助核心技术发展生态,它带来的最大好处就是不确定性,通过不断引入这些规划之外的不确定性,才能不断加速技术创新和生态的成长。


MindSpore的一些优势及差异点

黄老师以Jax为例与MindSpore做对比,指出Jax的主要目的是为了让NumPy在GPU和谷歌的TPU上跑得更好,而MindSpore的优化对象则是昇腾,这个国产自主研发的AI硬件。MindSpore本身支持主流的CPU、GPU,以及昇腾,尤其对昇腾有深度的优化。它与Jax的区别在于,MindSpore优先支持自主生产的AI硬件平台性能,而MindSpore也是昇腾平台上跑同类任务最优的框架。其次,MindSpore是一个比较通用的支持全场景的框架,JAX从它的定位出发,在全场景相关支持上目前尚未有很成熟的思路。


黄老师心得总结

黄老师结合自身从门外汉攻入人工智能领域的经验,建议想从事人工智能开源相关的非AI专业的小伙伴们,在掌握人工智能基础必备的数学技能、读Paper的能力、找到好的工具(比如昇思MindSpore社区团队开发的TinyMS)的同时,排除对未知的恐惧,选择一个像MindSpore这样的开源社区参与进去,与社区专家多交流多学习,从而加速自身入门人工智能的速度。