电子信息学院吴瑞旭博士在国际期刊《Engineering Applications of Artificial Intelligence》上发表学术论文

发布时间:2023-10-17 发布者:潘帅豪 来源:电子信息学院 浏览次数:3011

近日,我校电子信息学院吴瑞旭博士作为第一作者,我校作为第一单位,在国际知名期刊Engineering Applications of Artificial Intelligence上发表题为“Visual Tracking based on deformable Transformer and spatiotemporal information”的学术研究论文。该论文由电子信息学院吴瑞旭博士、刘艳丽教授与天津理工大学计算机视觉与系统省部共建教育部重点实验室团队合作完成。Engineering Applications of Artificial Intelligence是中国科学院二区TOP期刊,当前影响因子为7.802,主要关注人工智能方法以及相关工程分支中的实际应用,刊发人工智能与机器学习等相关领域的最新科研成果。



目前,基于Transformer的孪生网络视觉跟踪方法已经在各种实验上显示出强大的影响力并取得了显著的效果。特别是在大规模数据集上进行训练的前提下,基于注意力的Transformer结构得到了广泛应用。然而,许多跟踪器忽略了局部和全局特征的融合增强,缺乏时空信息的提取。同时,原始Transformer结构特征是冗余的,并且会受到感兴趣区域以外不相关部分的影响。为了解决这些问题,提出了一种基于可变形Transformer和时空信息的新方法(DTS)。作为孪生网络结构,它包含了多个模块。模板帧通过2D CNNSelf Attention获得从局部到全局的重要特征。搜索帧通过3D CNNSFMDAM获得感兴趣的时空信息,然后使用交叉注意建立它们之间的相关性,最后通过角点预测目标的边界框。为了验证该方法的有效性,在LaSOTGOT-10KTrackingNetVOT2018OTB100VAU123基准数据集上进行了实验,实验指标比基准方法高出2%-3%。在不影响性能的情况下简化了模型结构,FPS达到50。结果表明,与其他最先进的方法相比,该跟踪方法具有很强的竞争力。




近年来,吴瑞旭老师在计算机视觉领域不断进行探索,并结合人工智能,在目标分类、检测、跟踪等方向开展研究。在202120222023年分别以第一作者在SCI期刊(Multimedia SystemsCCF C类,中国科学院 4区;Knowledge-Based SystemsCCF C类,中国科学院 1区;Complex & Intelligent Systems,中国科学院 2区)上连续发表了目标跟踪领域3篇高水平文章,本项研究工作是前期工作的延续,系列相关研究工作的创新性获得了期刊主编和审稿专家的一致认可。(供稿:电子信息学院


最新导读