首页 > 活动 > 比赛 > 旷视人工智能开源大赛:视频超分辨率

旷视人工智能开源大赛:视频超分辨率

随着人工智能与各个行业的加速融合,如何快速、高效地进行算法开发已经成为AI行业落地的驱动力。一直以来,无论是学术界的研究者、需求AI技术的企业、个人AI开发者还是在校学生,都为开发和应用人工智能算法付出大量冗余的时间、资源和成本。2020年3月,旷视科技开源了在内部工程实践超过 6 年的深度学习框架天元(MegEngine),助力开发者实现深度学习,简单开发。

我们期望通过此次大赛,鼓励参赛者借助天元深度学习框架实现算法创新,汇聚才智,为现实问题寻找最优解决方案。

一、 比赛背景

视频是当前网络媒体主要形式,也是网络带宽资源的主要消耗者。新冠疫情带来的对网络直播、在线教育等在线业务的需求增长,其核心也是如何高效进行视频的传输以及高质量的进行视频呈现。

现实环境中,视频质量会受到网络带宽资源的制约。通过视频压缩技术,我们可以使视频能以较小的网络带宽消耗进行传输,但我们也希望传输后的压缩视频能尽可能的恢复到原有的画面质量。因此,压缩视频的画面质量恢复对于改善在网络带宽受限环境或者高分辨率显示设备上的视频观看体验有现实的价值和积极的作用。

在此背景下,我们希望通过此次大赛,鼓励高校科研人员、学生、初创企业以及企业人工智能算法工程和开发者利用深度学习技术,挑战压缩图像的画面质量恢复任务,探索基于深度学习的视频质量提升的上限。

二、 比赛任务

本次比赛的任务为视频超分辨率。比赛中,参赛团队通过训练深度学习模型,针对给定的被降分辨率并压缩后的视频,尽可能保真的恢复压缩前的视频。

本次比赛提供的所有待恢复视频都是由原视频进行了4倍的下采样以及重新编码后的结果,比赛要求参赛团队提交对测试视频恢复后的结果。

三、 比赛数据

本次比赛中,主办方提供训练集,请见 这里 。

对于训练集中的数据,有对应的原视频和压缩后的视频;对于测试集中的数据,只有压缩后的视频。为方便起见,训练集以mp4和png的格式提供,测试集以png图片序列的方式提供。您可在比赛关联的MegStudio项目的./dataset/game1/train_png/目录找到数据集,也可在 这里 下载训练集。

对于部分解码软件,训练集视频解码的结果可能是不一样的(甚至总帧数都会不一样),主办方提供的基线方法将展示一个用以参考的解码方法。同时,您也可以直接用png格式的训练集进行训练,避免出现帧数不同的问题。

对于测试集中的图片序列,以tar包的形式提供,即,对于一个图片序列文件test.tar,里面按视频帧的顺序存储了所有的图片文件,图片文件的格式都是png。

四、 比赛要求

训练框架:本次比赛要求使用开源的旷视天元深度学习框架MegEngine做为模型训练的框架,关于MegEngine的信息和参考资料请访问 天元官网

训练数据:参赛者应当只使用提供的数据作为训练的数据,在训练和测试的过程中不得使用其他来源的视频或者图片。

参赛提交:本次竞赛要求选手将测试视频的恢复结果以tar包的格式提交,里面按视频帧的顺序存储了所有的结果图片文件,文件名以及文件夹结构和测试输入的tar内的文件名以及文件夹结构保持相同。结果图片的尺寸应当刚好是测试输入图片尺寸的4倍(也就是,对于h x w的输入,应当输出4h x 4w的结果)。

比赛期间,参赛团队每24小时可在比赛平台上进行一次有效提交。(所谓有效提交,指格式正确、可产生测评分数的提交。)

代码审核:本次竞赛主办方有权要求所有进入决赛的参赛者提交源代码供审查。确认参赛者工作的独创性和以及是否符合其他比赛要求,审查不通过者,取消名次。

五、 比赛平台

MegStudio比赛模块 为此次比赛参赛平台,参赛团队需要在此平台上完成报名,组队、提交等比赛任务。同时比赛相关数据、脚本和其他相关资源也会通过此平台提供。

六、 算力平台

本次比赛旷视为参赛团队提供MegStudio作为算力平台,供有需要的参赛选手选用。

在MegStudio提供的30小时GPU算力基础上,在参赛期间每支团队从第二次提交开始,每完成一次提交且得分较前一次提交有提高的,团队可以再申请50小时GPU算力。在需求合理的前提下,每支团队初赛阶段最多可以申请三次,决赛阶段不受次数限制。

MegStudio的详细信息,请访问 MegStudio

七、 评分标准

本次竞赛采用Peak Signal to Noise Ratio(PSNR)指标作为评价指标。

参赛选手提交的结果将与原视频进行比较,计算所有输出像素的误差的平方的平均,并换算为PSNR值。PSNR越大的方法的排名越靠前。

主办方将提供基线方法和验证脚本,帮助选手在线下测试模型效果。基线方法、验证脚本以及详细使用方法,将与数据集同时发布。

八、 报名方法

大赛面向全社会开放,个人、高等院校、科研单位、企业、创客团队等人员均可报名参赛。

大赛组织单位赛题组相关人员禁止参赛。

报名方法:

  1. 报名开始时间:2020年8月10日(UTC+8)。

  2. 截止报名及组队变更时间:2020年8月31日(UTC+8)。

  3. 选手可单人成队或组队参赛,每位选手只能加入一支队伍,每支参赛团队最多不超过5个人。

  4. 报名方式:登录比赛指定平台,完成个人信息注册,提交相关材料即可报名参赛。

  5. 选手需确保报名信息准确有效,主办方有权取消不符合条件队伍的参赛资格及奖励。

九、 比赛设置

比赛设初赛和决赛两个阶段:

初赛时间为2020年9月1日00:01(UTC+8) 到2020年9月14日23:59(UTC+8)。初赛采用大赛提供测试数据集作为测试数据进行评分,比赛期间参赛团队可多次提交,以团队在初赛阶段取得的最佳成绩做为初赛最终得分,初赛团队成绩最高的前十支团队进入决赛。

决赛时间为2020年9月16日00:01(UTC+8) 到2020年9月24日23:59(UTC+8)。决赛采用大赛提供测试数据集作为测试数据进行评分,以团队在决赛阶段取得的最佳成绩最为决赛最终得分,决赛以团队最终得分高低进行排名和奖项评比。

十、 奖项设置

大赛设置如下奖项:

第一名:团队奖金人民币5万

第二名:团队奖金人民币2万

第三名:团队奖金人民币1万

第四到十名:团队奖金人民币1千

(所有奖金额为税前奖金额)

参与奖:所有参加初赛,并且提交了有效结果的团队,纪念T-Shirt衫

大赛前三名团队的成员将获得旷视校招面试直通卡,在旷视招聘中直接进入面试环节

十一、 大赛支持方式

邮箱:比赛支持邮箱为: mgesupport@megvii.com 比赛全程如有任何问题或者需要帮忙可以通过此邮箱联系我们。我们也会通过这个邮箱向你发送比赛相关信息,敬请关注

讨论区:欢迎在MegEngine社区为比赛设立的 讨论区 中讨论大赛相关事宜

关于MegEngine的讨论,大家可以加入“天元开发者交流群”(QQ群号:1029741705)

使用手机QQ扫码加入QQ群: