智东西3月19日(美国圣何塞时间3月18日)报道,今天,一年一度的AI与深度学习盛会——由NVIDIA举办的2019 GTC(GPU技术大会)在美国加州圣何塞举行,本次大会为期4天,围绕AI/深度学习、图形/建模、智能机器/物联网、高性能计算、数据中心与云计算等热门话题开展600多场技术演讲和座谈。
其中最受期待的环节毫无疑问是NVIDIA CEO黄仁勋(粉丝爱称“老黄”)的主题演讲。和往年一样,本次主题演讲依然干货满满,老黄在3小时内宣布了该公司在芯片、AI、云基础设施、IoT与机器人、自动驾驶上的一系列新动作。
本次主题演讲分为三个部分:主打实时光线追踪的计算图形、AI与高性能计算、自动驾驶。
核心亮点包括:
1、计算图形:推出端到端平台CUDA-X AI,宣布图灵RTX将于4月4日登陆Unity,发布全新协作平台NVIDIA OMNIVERSE,发布拥有40个图灵GPU的8U RTX服务器和RTX POD。
2、AI和HPC:使用Omni-Sci数据库快速将原生数据转换为可视化数据,发布售价99美元的CUDA-X AI小型计算机Jetson Nano,开放ISAAC机器人堆栈SDK,宣布AWS上线最新的EC2 G4实例。
3、自动驾驶:推出DRIVE AP2X Release 9.0,介绍防止碰撞的安全力场,发布NVIDIA Constellation虚拟汽车。
此外,老黄还在演讲开场时就声明他爱PRADA(猜猜是不是那个奢侈品牌)。
有意思的是,在本届GTC大会举办前一周,NVIDIA发布2019年震动芯片界的大消息——宣布就69亿美元收购以色列企业Mellanox事宜达成最终协议,在本次主题演讲中,Mellanox CEO Eyan Waldman也来到现场和老黄聊了会儿天。
一、推出CUDA-X AI,表白PRADA
在本次大会上,老黄不负众望地穿着一身黑色皮衣帅气登场,首先晒出GTC和GPU的成绩单,说相比上一届大会,GTC 2019的参会人员增长约50%,GPU开发人员从2018年的80万增长到2019年增长为120万人。
在介绍了NVIDIA加速计算的一系列成果后,老黄开始进入本次主题演讲的一大重点——端到端平台NVIDIA CUDA-X AI,通过将所有NVIDIA库集成在一起,加速深度学习、深度学习和数据分析工作流程,提高开发人员工作效率。老黄表示,要用尽可能少的工作流程达到最大成效,买的越多,省的越多。
在演讲期间,老黄突然对“PRADA”表白,不过,这可不是大洋彼岸那个著名的奢侈品牌,老黄用它代指CUDA-X库的关键特征,即PRogrammable + Acceleration + Domain + Architecture。
二、计算图形:实时光线追踪仍是主题
光线追踪一直是GTC的一个重要话题,在第一个环节,老黄先展示左右看起来相似的图片,让观众去猜哪张图是真的。
同样,Tensor Core通过深度学习降低绘图工作的负载并提高绘图性能表现的功效也再度被提及。相比过去只是用GPU的计算方式,TensorCore 和光线追踪计算单元能带来更低成本和更高功效。
NVIDIA已与Adobe、Autodesk等多家3D软件制造商建立合作伙伴关系,将实时光线追踪带入游戏作品。全球顶级的应用程序供应商正采用NVIDIA RTX为900万设计师和艺术家提供先进的AI和光线追踪功能。
其中,Unity为NVIDIA的实时光线追踪(RTX)技术增加了预览支持。现场展现的《雷神之锤2(Quake 2)》游戏等场景逼真度令人惊艳,这些虚拟图像与真实场景何其相似,模糊了虚拟与现实的界限。
老黄表示,图灵RTX仿真将于4月4日登陆Unity。另外Unreal Engine和Vulkan都将支持Direct-X 12(DXR)中的实时光线追踪。
“图灵RTX架构是15年来GPU架构的最大的飞跃。”老黄如是说。他着重讲了RTX和图灵架构的亮点,展示的RTX服务器在渲染方面节省能耗的数据令人难以置信。另外,RTX开关时的照明变化也非常明显。
随后,老黄宣布发布一款全新协作平台NVIDIA OMNIVERSE,适用于由NVIDIA RTX提供支持的3D制作流程。
另外在流媒体视频服务领域,NVIDIA 与日本软银集团在日本构建合作伙伴关系,与 LG 在韩国构建合作伙伴关系。
在计算图形这一环节,老黄最后发布的是拥有40个图灵GPU的8U RTX服务器和RTX POD,其中包括为Optix渲染完全优化的软件堆栈、VR/AR及专业视觉化应用。
NVIDIA RTX服务器将帮助5G运营商,以低延迟的特点为用户带来强大、灵活、随需应变的图形渲染、虚拟化和云游戏服务,
一周前NVIDIA刚刚宣布达成收购协议的Mellanox的技术也排上了用场,Mellanox的高性能智能互联技术Infiniband将帮助RTX服务器实现在10个机架中为1万位用户同时提供服务。
NVIDIA Quadro虚拟数据中心数据站现在支持NVIDIA RTX服务器,可在任何设备上随时随地为设计人员提供加速渲染能力。
三、AI & HPC:围绕CUDA-X AI构建全面生态
第二板块是AI和高性能计算(HPC)。老黄认为,数据科学已成为继理论(爱因斯坦)、实验(牛顿)、模拟之后的工程领域的第四大支柱。
围绕CUDA-X AI,NVIDIA构建从设备、框架到服务的完整生态系统。CUDA X 可以通过NGX 平台免费获得。
老黄再次强调了Tensor Core的重要性,他认为Tensor Core会成为未来在专业计算中极为重要的角色,重要性不亚于GPU架构,NVIDIA希望可将偏推理的AI任务更快的转移到Tensor Core上。
另外,现场还演示了微软正与NVIDIA提供的实时语音驱动推荐功能,微软的算法将端到端延迟减少5倍。
在医疗方面,老黄宣布Clara AI使世界各地的放射科医生能够构建和部署AI应用程序,辅助阅读X射线和其他图像,并使用Clara工具包帮助注释图像,同时确保患者数据安全。
随后,老黄演示使用Omni-Sci来精确定位网络运营商应该放置WiFi接入点的位置。Omni-Sci是一个GPU驱动的数据库,包含可视化引擎,用于可视化来自该网络服务提供商的数据。
QminSci全球社区副总裁Aaron Williams现场展示了如何使用OmniSci加速数据处理。一个网络提供商,该提供商每天产生约1TB的WiFi新数据。
据他介绍,在过去将1T数据转化为可视化数据需要几十个数据科学家花8天时间。而使用OminSci,仅用4分钟就能完成这一转换,然后对该数据集进行预测分析。
另外,老黄还在演讲中提到将RAPIDS视作Hadoop和Spark的继任者,不过不确定这是老黄随性评论还是正式声明。微软Azure也在博客中宣布其机器学习服务现支持NVIDIA RAPIDS。
AI和HPC板块自然少不了数据科学家的福利,老黄发布一种新型数据科学工作站。这一工作站包含NVIDIA Quadro RTX-8000 GPU,并预装了CUDA-X加速平台。
加上一周前,NVIDIA刚刚宣布就收购以色列企业Mellanox事宜达成最终协议,将以约69亿美元的现金价格将这个高性能互联技术InfiniBand的龙头企业收入麾下。
随着Mellanox超强的智能互联技术、解决方案及现有客户并入NVIDIA,NVIDIA在优化整体计算、网络和网络和存储堆栈的数据中心级工作负载将取得新的提升。例如NVIDIA的数据科学服务器就采用最新的4x NVIDIA T4 GPU和Mellanox网络。
Mellanox CEO Eyan Waldman和老黄同台了,两人讨论了在数据中心和超大规模计算的紧密合作,Mellanox的技术在许多NVIDIA产品中得到应用。
另一个前来捧场的重量级嘉宾是亚马逊AWS计算服务副总裁Matt Garman,NVIDIA和AWS建立长期合作伙伴关系,率先推出GPU及服务并采用一些最新的高端GPU。
Matt Garman称AWS已经使用GPU预览了最新的EC2 G4实例,G4非常适用于部署经济高效的机器学习、深度学习和图像处理。
TensorRT 5.1现已支持在AI上部署20多个新层,激活和操作TensorFlow和OnnxAI。
在本次主题演讲开始前几个小时,NVIDIA还在GTC大会上公布了其最新的图像处理研究工作——GauGAN,这是一种基于生成对抗网络(GAN)的技术,能够将分割图转换为逼真的照片。该GauGAN研究论文已被CVPR 2019收录为口头报告。
四、机器人与自动驾驶:Jetson Nano售价99美元
经过两个小时的演讲,终于到了最后一个版块——机器人与自动驾驶。
老黄宣布了一个面向机器人开发者的好消息——新的Jetson Nano计算机来了!这款小而强大的CUDA-X AI计算机售价99美元,大小近似于一个乐高小人,可以创建数百万个智能系统,并将能运行CUDA上的所有内容,为机器人提供感知、规划和推理能力。
现场参加主题演讲的观众就有福了,出门即可购买Jetson Nano开发套件。
此外,ISAAC机器人堆栈SDK现已开放,这是一个机器人开发者工作箱,可为自主机器引入现代AI,让自研机器人变得更加简单。NVIDIA现已支持AWS RoboMaker,可在云中轻松完成机器人仿真和开发,并部署在由Jetson提供支持的数百万台机器人中。
“我们和未来互动最重要的机器人设备就是我们的汽车。”老黄表示,Drive Initiative并非将自动驾驶作为产品,而是建立工具和基础设施,帮助其他人制造自动驾驶汽车。
老黄在现场演示了最新版本的NVIDIA自动驾驶系统,并宣布和丰田合作进行自动驾驶的研发。
首先被发布的是DRIVE AP2X Release 9.0,DRIVE AP2X是世界上最完整的Level 2+自动驾驶汽车平台。
NVIDIA宣布正与TRIAD Global合作开发、训练和验证自动驾驶车辆,与ToyotaMotor合作提供未来的自动驾驶。
老黄还介绍了NVIDIA安全力场,这是一种可以防止自动驾驶车辆碰撞的计算防御性驾驶政策,通过安全立场驱动AV路径规划和预测,从而提供更加安全的驾驶体验。
NVIDIA DRIVE Constellation虚拟AC测试车队现已上市,提供具有比特精度和精确定时的“硬件在环”测试,由两个不同服务器组成的数据中心解决方案。
结语:NVIDIA的核弹未发
在AI飞速发展的过程中,NVIDIA无疑是其中最为耀眼的明星企业之一。自2009年首次举办以来,GTC大会已经陪着英伟达走过了第十个春秋,成为AI领域举足轻重的一大盛事。
回顾一下过去2年GTC大会上发布的重点内容:
GTC 2017:全新Volta架构GPU Tesla V100,GPU云,虚拟机器人产品Project Holodeck,主要针对自动驾驶的轻量化平台Xavier DLA,深度学习学院进展,
GTC 2018:光线追踪RTX技术,首款Volta架构的Quadro GV100 GPU,首医学成像超级计算机平台Clara,32G内存Tesla V100,深度学习超级计算机DGX-2,新版机器学习应用平台TensorRT,下一代DRIVE Orin自动驾驶芯片,3D仿真自动驾驶测试平台DRIVE Constellation,ISAAC机器人仿真训练平台SDK。
此前受到虚拟货币泡沫破裂的影响,加之图灵显卡销量不佳,NVIDIA因此出现营收下滑,股价下跌现象。本以为NVIDIA会在本届GTC 2019释放大招,就现在来看,相比过去2年,本次GTC大会稍有“雷声大,雨点小”之感,既没有发布新架构,也没有新GPU或者显卡的出炉,但好在今天公布的各项升级和合作都非常具体落地,将是英伟达全线产品助推AI技术产业落地的新阶段。
当前NVIDIA最新GPU是12nm图灵架构GPU,此前盛传的7nm安培架构GPU并没有像众人所猜测的那样如期而至。NVIDIA的7nm显卡姗姗来迟,而AMD代号为Navi的7nm显卡被传即将浮出水面,NVIDIA新的竞争才刚刚开始。
来源:智东西(公众号:zhidxcom)
作者:心缘