华南理工大学学报(自然科学版) ›› 2020, Vol. 48 ›› Issue (1): 60-69,83.doi: 10.12141/j.issn.1000-565X.190388
刘建国 冯云剑 纪郭 颜伏伍 朱仕卓
LIU Jianguo FENG Yunjian JI Guo YAN Fuwu ZHU Shizhuo
摘要: 为了解决双目视觉中的立体匹配问题、减少立体匹配网络的参数数量、降低算法的计算复杂度、提高算法的实用性。在 PSMNet 立体匹配网络的基础上进行改进,提出了一种具备浅层结构与宽阔视野的立体匹配算法——SWNet。浅层结构表示网络层数更少、参数更少、处理速度更快; 宽阔视野则表示网络的感受野更宽广,能够获取并保留更多的空间信息。SWNet 由特征提取、3D 卷积和视差回归 3 个部分构成。在特征提取部分,引入了深色空间金字塔结构 (Atrous Spatial Pyramid Pool,ASPP),用于提取多尺度的空间特征信息,设计了特征融合模块,将不同尺度的特征信息有效地融合起来以构建匹配代价卷; 3D 卷积神经网络利用堆叠的编码解码结构进一步对匹配代价卷进行规则化处理,获得不同视差条件下特征点之间的对应关系; 最后,采用回归的方式得到视差图。SWNet 在 SceneFlow 和 KITTI 2015 两个公开的数据集上均取得了优异的表现,与参考算法 PSMNet 相比,参数数量下降了 48. 9%,且误匹配率仅有 2. 24%。
中图分类号: