课题组七篇论文被 CCF A 类会议 IJCAI-PRICAI2020录用

  • 2020年05月06日
  • 我组以博士生常世帧、万国佳、黄新建、兰猛以及硕士生陈紫业、邹丹冰和叶健为第一作者的七篇论文被人工智能领域顶级会议IJCAI-PRICAI2020录用。此次会议接受有效投稿4717篇,接收592篇,接受率为12.6%。

    国际人工智能联合大会IJCAI (International Joint Conference on Artificial Intelligence)始于1969年,每两年一次(2016年起一年一次),涵盖了自然语言处理、机器学习、人工智能理论与架构、机器人科学等领域。会议具有很高的学术水平和影响力,受到学术界和产业界的高度关注。IJCAI和ICCV、CVPR、ICML、AAAI等会议被中国计算机学会(CCF)认定为A类会议。

    2017级博士研究生常世帧同学的论文“Positive Unlabeled Learning with Class-prior Approximation”[1] 提出了一种基于类先验估计的PU学习(positive unlabeled learning)模型,该模型结合凸优化公式与类先验估计理论,在估计和逼近正类概率的同时求解、优化数据,求取分类参数。文章通过理论分析与组织实验验证了方法的收敛性与优越性。

    2018级博士研究生黄新建的论文“Multichannel Color Image Denoising via Weighted Schatten p-norm Minimization”[2] 针对彩色图像中R,G,B三通道中所含噪声的强度和统计特性不同,提出一种多通道加权Schatten p范数最小化算法。根据图像的非局部相似性,在适当大小的搜索窗内寻找局部噪声块的相似块,向量化后将其堆叠成一个低秩矩阵,采用Schatten p范数最小化模型来求解去噪后噪声块。此外,考虑不同通道间噪声强度不同,引入一个权值矩阵来平衡每个通道对最后去噪结果的影响。同时证明了算法的收敛性,分析了算法复杂性。实验验证了所提算法的有效性。

    2018级博士研究生万国佳的论文“Reasoning Like Human: Hierarchical Reinforcement Learning for Knowledge Graph Reasoning”[3] 受人类认知决策的分层推理原理启发,提出一个基于分层强化学习的知识图谱推理模型,用于解决知识图谱多跳推理过程的多语义问题。该模型通过一个高层策略网络和一个低层的策略网络进行协同决策。其中,高层的策略网络负责学习推理过程中的序列信息。低层策略网络负责学习语义关系的层次信息。实验证明该模型在标准知识图谱数据集上取得了提升,尤其在多语义问题严重的任务中表现较现有算法更好。

    2020级博士研究生兰猛的论文“E3SN: Efficient End-to-End Siamese Network for Video Object Segmentation”[4] 针对基于tracking的视频分割baseline模型SiamMask存在的二阶训练gap和单级特征信息表达不充分等问题,提出了有监督抽样策略和多级特征融合模块。有监督抽样策略缓解了训练过程中对显存的巨大消耗,使得网络得以端到端的进行训练。多级特征融合模块通过融合多级特征来丰富特征表达并最终提高目标分割的精度。在两个标准数据集上的实验结果验证了方法的有效性。

    2018级硕士研究生陈紫业的论文“Compressed Self-Attention for Deep Metric Learning with Low-Rank Approximation”[5] 针对自注意力机制会资源消耗大而无法作用于缺乏长范围依赖的高分辨率浅层特征图从而导致性能提升受限等问题,提出了一个基于低秩估计的压缩自注意力机制(CSALR),它通过一种采样的方法将原始的自注意力图分解为基注意力图和组合系数图,可以在不损失精度的前提下大大减小计算量和内存占用。基于CSALR,我们为深度度量学习提出了一个通用的框架。其中,我们将CSALR应用于主干网络的每一级,并对每个CSALR模块应用通道分组操作,从而最大程度地利用自注意力机制。实验结果证明了CSALR的优越性

    2018级硕士研究生邹丹冰的论文“Unsupervised Domain Adaptation with Dual-Scheme Fusion Network for Medical Image Segmentation”[6] 针对医学数据打标签会耗费大量的人力和成本等问题,提出了一种双策略融合网络来解决无监督领域自适应的问题。网络由两个联合网络组成,其中联合网络是一个多任务的分割和生成网络,这两个任务共享一个encoder,在decoder部分形成两个分支,一个分支进行分割任务,另一个进行生成任务。其中一个联合网络对源域数据进行分割并迁移到目标域,另一个联合网络对生成的目标域数据进行分割并重建回源域。最后通过对source-to-target和target-to-source两种策略的结果进行融合,进一步缩小domain gap,得到一个精度更高的结果。

    2019级硕士研究生叶健的论文“extFuseNet: Scene Text Detection with Richer Fused Features”[7] 提出了一种基于丰富融合特征的场景文本检测算法TextFuseNet,包含多层次特征表示和多路特征融合两个模块。多层次特征表示模块使用字符、单词以及全景三个层次的语义特征来描述文本,能够更充分地感知文本区域。多路特征融合模块对齐和融合不同层次的文本特征,生成具备丰富语义信息的融合特征用于实现文本实例分割。此外,对于缺乏字符级标注的数据集,TextFuseNet可以通过弱监督机制生成伪标签进行训练。实验证明我们的方法可以有效抑制误报,生成准确的文本轮廓,并且在多个场景文本公开数据集中实现最优效果。

    [1] Shizhen Chang, Bo Du, and Liangpei Zhang, “Positive Unlabeled Learning with Class-prior Approximation,” IJCAI, 2020.

    [2] Xinjian Huang, Bo Du and Weiwei Liu, “Multichannel Color Image Denoising via Weighted Schatten p-norm Minimization,” IJCAI, 2020.

    [3] Guojia Wan, Shirui Pan, Chen Gong, Chuan Zhou, Gholamreza Haffari, “Reasoning Like Human: Hierarchical Reinforcement Learning for Knowledge Graph Reasoning,” IJCAI, 2020

    [4] Meng Lan, Yipeng Zhang, Qinning Xu, Lefei Zhang, “E3SN: Efficient End-to-End Siamese Network for Video Object Segmentation,” IJCAI, 2020.

    [5] Ziye Chen, Mingming Gong, Lingjuan Ge and Bo Du, “Compressed Self-Attention for Deep Metric Learning with Low-Rank Approximation,” IJCAI, 2020.

    [6] Danbing Zou, Qikui Zhu and Pingkun Yan, “Unsupervised Domain Adaptation with Dual-Scheme Fusion Network for Medical Image Segmentation,” IJCAI, 2020.

    [7] Jian Ye, Zhe Chen, Juhua Liu, Bo Du. “TextFuseNet: Scene Text Detection with Richer Fused Features,” IJCAI, 2020.