电子信息学院机器人与智能技术研究团队题为“MLFMNet: A Multi-level Feature Mining Network for Semantic Segmentation on Aerial Images”的学术研究论文被遥感领域知名期刊《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》(JCR 1区,中国科学院2区TOP,影响因子4.7)录用。该研究成果以上海电机学院为第一单位,作者为魏新雨(在读研究生)、饶蕾老师(通讯)、范光宇老师、陈年生老师。
航空技术的飞速发展使得航空影像的获取手段更加多样化。航空影像对于评估城市发展、交通规划和基础设施建设至关重要,因此从航空影像中分析影像内容并得到关键目标信息成为当前的研究的一个热点。
在航空影像的解译中,图像语义分割是实现解译的关键技术之一。然而,由于航空图像的独特拍摄角度,准确分割对象存在显著挑战,包括对象尺度的变化、变形和小目标特征不清晰等问题。为了解决这些问题,论文提出了一种基于编码器-解码器架构的多级特征挖掘网络,称为MLFMNet,旨在挖掘和融合航空图像中的多级特征信息,以提高分割的准确性和鲁棒性。MLFMNet利用跳跃连接从编码器中获取多级的特征表示。随后,通过所提的解码器中的可学习融合模块(Learnable Fusion Module,LFM)和特征重建模块(Feature Reconstruction Module,FRM),逐步融合和重建这些特征,从而实现准确的语义分割。为了解决对象尺寸变化显著和变形的问题,论文在编码器底部设计了一个不规则金字塔感知场(Irregular Pyramid Receptive Field,IPRF)模块,以捕获来自多个特征向量的感知场,进一步挖掘抽象特征。此外,为了解决小型目标的分割和检测精度低的挑战,在解码器底部嵌入了一个细粒度特征挖掘(Fine-grained Feature Mining,FGFM)模块,以捕获空间细节特征。
为了验证MLFMNet系列的性能,论文在UAVid、LoveDA和Potsdam等三个航空遥感数据集上进行了实验,图像语义分割精度分别达到了70.8%、53.3%和87.7%的mIoU,高于UperNet等SOTA算法。文章研究成果可广泛应用于航空航天领域对地观测、城市土地规划、自然环境保护等场景。
机器人与智能技术研究团队由1名教授、2名副教授、1名高级实验师、13名在读研究生以及9名合作企业导师组成。团队的研究方向主要涵盖智能感知与控制技术、移动机器人导航技术、无线网络优化和机器学习以及特定场景下的语音识别技术。团队承担着国家自然科学基金项目、上海市闵行区科委产学研项目、上海高校选拔培养优秀青年教师科研专项基金项目以及20多项企业委托科研项目。在《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》《IEEE Robotics and Automation Letters》《IEEE Transactions on Vehicular Technology》《机器人》等国内外学术期刊和会议上发表30多篇论文,并获得多项国家授权发明专利。(供稿:电子信息学院 饶蕾 魏新雨)