电子信息学院智能检测与视觉团队在多模态检测、视觉跟踪等方向持续攻关

发布时间:2026-05-19 发布者:郭晓蓉 来源:电子信息学院 浏览次数:10

近日,上海电机学院电子信息学院智能检测与视觉团队科研工作再传捷报,团队围绕目标多模态检测及视觉跟踪方向持续攻关,两项创新成果相继发表于国际权威期刊《Signal, Image and Video Processing》。黎明副教授为第一作者,24级电子信息专业研究生严旭同学为第二作者,发表研究成果“DM-FDA: a dual-modal feature detection algorithm for microscopic impurities吴瑞旭博士为第一作者,刘艳丽教授为通讯作者发表研究成果“Visual tracking based on spatiotemporal deformable mamba,两项成果均以上海电机学院为第一单位。

成果一:DM FDA双模态融合算法,攻克食用油微小杂质智能检测难题

团队提出DM FDA双模态特征检测算法,首创事件相机+可见光图像融合检测范式,解决低光照、高黏度、弱纹理场景下微小杂质漏检、误检痛点。算法采用BiFPN双向特征金字塔实现跨模态加权融合、SPPCSPC增强多尺度上下文、IF MPDIoU精准回归微小目标框,最小可检尺寸0.2mm。在14520张样本数据集上,毛发检测精度100%、金属碎片89.40%、原料碎屑76.10%。为食品工业自动化质检提供核心技术支撑。

论文链接https://doi.org/10.1007/s11760-025-05004-8


成果二:SDM时空可变形Mamba,打造超高效鲁棒视觉跟踪器

针对现有Mamba模型在视觉跟踪中时空特征利用不足、空间结构信息提取能力弱等问题,课题组创新性地提出SDMSpatiotemporal Deformable Mamba跟踪框架。该框架通过融合时序特征增强定位预测能力,引入可变形Mamba模块动态调整扫描路径以捕获关键特征,并采用多尺度分层结构提升计算效率。在GOT-10KLaSOTTrackingNetVOT2020等权威基准数据集上的实验表明,SDM在保持高跟踪精度的同时有效降低了模型复杂度,为实时视觉跟踪提供了新的技术路径,可广泛应用于自动驾驶、安防监控、人机交互等领域。

论文链接https://doi.org/10.1007/s11760-025-05068-6

未来团队将继续深耕智能视觉与信息处理核心赛道,聚焦行业关键技术难题,勇攀科研高峰,力争产出更多具有原创性与实用性的高水平成果,助力国家新质生产力发展与产业升级。(供稿:电子信息学院)


最新导读