60篇论文入选,两度夺魁,“史上最难ECCV”商汤再攀高峰

8月23-28日,全球计算机视觉三大顶会之一,两年一届的欧洲计算机视觉国际会议ECCV(European Conference on Computer Vision) 正式召开。

与今年六月举办的CVPR 2020类似,本届ECCV 2020也堪称“史上最难ECCV”——有效投稿5025篇,比ECCV 2018的两倍还多,最终被接受发表论文1361篇,录取率为27%,较上届下降约5%。

虽然竞争加剧,但商汤科技在ECCV 2020依然斩获傲人成绩,商汤及联合实验室一共有60篇论文入选,涵盖对抗式生成模型、三维点云理解与分析、视频理解与分析、目标检测等热门及前沿领域,再次展示了商汤在计算机视觉领域的科研及创新实力。 

不仅在论文总数上引领行业,商汤还斩获ECCV LVIS Challenge 2020冠军,以及由苏黎世联邦理工学院(ETH)主办的ECCV AIM 2020冠军。

深耕研究,做真正具有行业价值的学术研究,是商汤在AI顶级会议上屡创佳绩的根源。 

ECCV 2020斩获两项世界冠军

 ECCV LVIS Challenge 2020是本届ECCV最重磅的竞赛之一,LVIS 是 FAIR (Facebook人工智能实验室) 在2018年提出的一个用于长尾识别的实例分割数据集,其有超过1000个类别,同时类别具有长尾分布的特性,此外,LVIS的标注相比COCO也更加精细。

商汤科技研究团队在今年针对这两个特性创新地使用了一个二阶段的训练策略,特征学习阶段和微调阶段,以更加高效地解决类别不均衡和高质量Mask预测问题。

除算法改进之外,基于商汤内部的SenseSpring商汤深泉模型生产平台实现了灵活高效和更高精度的模型训练。最终在LVIS Challenge 2020上获得了第一名的好成绩,实现了LVIS比赛的两连冠。

由ETH主办的AIM比赛,来自商汤科技-中科院深圳先进研究院的XPixel团队获得了视频插帧(Video Temporal Super-Resolution)冠军。这也是商汤连续两届在AIM VTSR项目中夺冠。 

视频插帧是一种可以提升视频帧率,改善视频流畅度的技术。

XPixel团队从原有模型出发,改进了对视频运动的建模,使得模型更加贴合真实运动轨迹;并且针对生成帧提出了新的改善模块,使效果获得了进一步的提升。