武汉大学智能感知与机器学习组

课题组本科生一篇论文被ICCV 2019接收

2019年07月29日

国际计算机视觉大会IEEE International Conference on Computer Vision由IEEE主办，与计算机视觉模式识别会议(CVPR)和欧洲计算机视觉会议(ECCV)并称计算机视觉方向的三大顶级会议，被澳大利亚ICT学术会议排名和中国计算机学会(CCF)等机构评为最高级别学术会议，在业内具有极高的评价。不同于在美国每年召开一次的CVPR和只在欧洲召开的ECCV，ICCV在世界范围内每两年召开一次。ICCV论文录用率非常低，是三大会议中公认级别最高的。

本届ICCV会议投稿量创下历史新高，收到了4303份有效的论文申请，比相比上一届增加了100%，其中1076篇被大会接收，录用率仅25.0%。本次会议收录的论文为小组本科三年级学生李靖元的“Progressive Reconstruction of Visual Structure for Image Inpainting”。论文提出了“视觉结构重建”模块，该模块可以在图像修复过程中渐进式地加入图像结构信息，显式地使深度图像补绘模型学习到图像结构的生成。论文将这一模块应用在了现有的主干模型U-Net上，取得了图像补绘任务当前的最优结果（图1，图2）。论文以及相应的代码将会公开。

近年，小组在计算机视觉领域取得了较多高水平成果，在计算机视觉三大顶会（CVPR，ICCV，ECCV）均有发表。在今年另一计算机视觉顶级会议CVPR 2019上，课题组研究生黎圣的视频超分辨率论文也被收录，该论文针对视频超分辨率方法，提出了一种高效的基于3D卷积的时空学习模型，该方法基于矩阵分解的思想，通过使用时空分步的卷积方法降低计算消耗，结合多层次的残差学习构建了深度残差网络，实现了更优的视频超分辨率效果。同时，文章在理论上证明了方法的泛化边界，为准确复原图像提供了理论支撑。论文与代码地址如下：

Fast Spatio-Temporal Residual Network for Video Super-Resolution”, Sheng Li, Fengxiang He, Bo Du, Lefei Zhang, Yonghao XU, Dacheng Tao, CVPR 2019, https://arxiv.org/abs/1904.02870, https://github.com/lsmale/FSTRN

下图为黎圣同学在CVPR2019现场为参会者介绍自己的工作：

此外，课题组已连续三年有本科生在CCF A类期刊/会议上以第一作者身份发表文章，分别如下：

“Robust Dual Clustering with Adaptive Manifold Regularization”, Nengwen Zhao, Lefei Zhang, Bo Du, Qian Zhang, Jane You, Dacheng Tao, TKDE 2017

“Self-Representative Manifold Concept Factorization with Adaptive Neighbors for Clustering”, Sihan Ma, Lefei Zhang, Wenbin Hu, Yipeng Zhang, Jia Wu, Xuelong Li, IJCAI 2018

“MUSICAL: Multi-Scale Image Contextual Attention Learning for Inpainting”, Ning Wang, Jingyuan Li, Lefei Zhang, Bo Du, Chaoyue Wang, IJCAI 2019

“Progressive Reconstruction of Visual Structure for Image Inpainting”, Jingyuan Li, Fengxiang He, Lefei Zhang, Bo Du, Dacheng Tao, ICCV 2019

图1 “视觉结构重建”示意图

图2 完整模型结构图