大连理工大学3项科研成果被国际顶级会议录用

浏览:72 作者: 来源: 时间:2023-06-20 分类:新闻中心
大连理工大学-立命馆大学国际信息与软件学院几何计算与智能媒体技术研究所三项科研成果被CVPR 2020录用。

  近日,大连理工大学-立命馆大学国际信息与软件学院几何计算与智能媒体技术研究所三项科研成果被CVPR 2020 (IEEE Conference on Computer Vision and Pattern Recognition)录用。CVPR是计算机视觉领域最顶级会议。根据谷歌2019学术影响力榜单:CVPR跃升总榜前10,H5-index:240,在计算机学科所有期刊/会议中排名第1。本届CVPR大会共收到6656篇论文投稿,录用1420篇,录用率仅为22%。

  论文“Discriminative Feature-oriented Gaussian Mixture Model for Fine-grained Image Recognition”由大连理工大学-立命馆大学国际信息与软件学院王智慧副教授、研究生王世杰和李豪杰教授共同完成。在细粒度图像识别的任务中,如何准确的挑选出细粒度图像间的判别性区域是核心问题之一。该工作发现深度神经网络在深层的特征图上会产生判别性区域扩散问题,增加基于深层特征图准确挑选判别性区域的难度,从而影响图像识别的准确性。针对上述问题,该研究进一步提出了将高斯混合模型嵌入到深度神经网络中的DF-GMM模型。模型使用高斯混合模型来获得深层特征图的一组低秩的特征表示,然后将低秩的特征表示恢复到原始的坐标空间来得到低秩的特征图,缓解深层特征图上的判别性区域扩散问题。与直接在深层特征图上挑选判别性区域相比,在低秩特征图上挑选的判别性区域将更加准确。实验表明该研究提出的模型在细粒度图像识别准确性和效率方面都达到了目前最优的结果。

  论文“A2dele: Adaptive and Attentive Depth Distiller for Efficient RGB-D Salient Object Detection”由大连理工大学-立命馆大学国际信息与软件学院张淼副教授与信息与通信工程学院卢湖川教授团队合作完成。该工作针对现有RGB-D显著性检测方法中存在高计算/内存消耗和在测试时对深度图的依赖问题,设计了一个深度蒸馏器,将网络的预测图及注意力图作为传输深度知识的桥梁。首先,提出一个自适应深度蒸馏策略来自适应地最小化RGB流与深度流预测图之间的差异,该策略可以实现深度知识传输的有效控制。其次,提出一个注意力深度蒸馏策略来促进RGB流与深度流注意力图的一致性,该策略可以将深度图所包含的定位信息有效传输至RGB流的图像特征中。此外,该研究提出的深度蒸馏器可用于大幅提高现有RGB-D模型的大小和速率,提升了其实际应用性。实验证明该研究提出的网络结构在5个RGB-D的数据库取得目前最优的结果,并且与目前最优的RGB-D方法相比,测试速率快12倍,模型大小减少76%。

  几何计算与智能媒体技术研究团队依托于辽宁省泛在网络与服务软件重点实验室。研究课题包括机器学习、深度学习、计算机视觉、多媒体技术、优化方法等当前最前沿的领域。近年来在IEEE TPAMI、TIP、TNNLS、TMM、NeurIPS、IJCAI、AAAI、CVPR、ECCV、ACM MM等人工智能、多媒体技术等多方领域的重要期刊及会议上发表论文达100余篇。

  作为教育部直属全国重点大学、国家“211工程”和“985工程”重点建设高校、世界一流大学A类建设高校,大连理工大学以培养精英人才、促进科技进步、传承优秀文化、引领社会风尚为宗旨,秉承“海纳百川、自强不息、厚德笃学、知行合一”为基本特质的大工精神,致力于创造、发现、传授、保存和应用知识,勇于担当社会责任,服务国家,造福人类。面向未来,学校将传承大工红色基因,发扬大工精神,以建设特色鲜明的世界一流大学为目标,践行“四个服务”历史使命,深化综合改革,强化内涵特色,努力推动学校发展实现新的历史跨越。