一种基于 PSMNet 改进的立体匹配算法

doi:10.12141/j.issn.1000-565X.190388

华南理工大学学报（自然科学版） ›› 2020, Vol. 48 ›› Issue (1): 60-69,83.doi: 10.12141/j.issn.1000-565X.190388

一种基于 PSMNet 改进的立体匹配算法

刘建国冯云剑纪郭颜伏伍朱仕卓

武汉理工大学现代汽车零部件技术湖北省重点实验室∥汽车零部件技术湖北省协同创新中心∥湖北省新能源与智能网联车工程技术研究中心，湖北武汉 430070

收稿日期:2019-06-27 修回日期:2019-08-06 出版日期:2020-01-25 发布日期:2019-12-01
通信作者: 刘建国 (1971-)，男，博士，副教授，主要从事机器视觉、智能驾驶研究。 E-mail:ljg424@163.com
作者简介:刘建国 (1971-)，男，博士，副教授，主要从事机器视觉、智能驾驶研究。
基金资助:
国家自然科学基金资助项目 (51975434); 新能源汽车科学与关键技术学科创新引智基地资助项目(B17034); 武汉理工大学研究生优秀学位论文培育项目 (2018-YS-033)

Improved Stereo Matching Algorithm Based on PSMNet

LIU Jianguo FENG Yunjian JI Guo YAN Fuwu ZHU Shizhuo

Hubei Key Laboratory of Advanced Technology for Automotive Components∥Hubei Collaborative Innovation Center for Automotive Components Technology∥Hubei Research Center for New Energy ＆ Intelligent Connected Vehicle，Wuhan University of Technology，Wuhan 430070，Hubei，China

Received:2019-06-27 Revised:2019-08-06 Online:2020-01-25 Published:2019-12-01
Contact: 刘建国 (1971-)，男，博士，副教授，主要从事机器视觉、智能驾驶研究。 E-mail:ljg424@163.com
About author:刘建国 (1971-)，男，博士，副教授，主要从事机器视觉、智能驾驶研究。
Supported by:
Supported by the National Natural Science Foundation of China (51975434)

摘要/Abstract

摘要： 为了解决双目视觉中的立体匹配问题、减少立体匹配网络的参数数量、降低算法的计算复杂度、提高算法的实用性。在 PSMNet 立体匹配网络的基础上进行改进，提出了一种具备浅层结构与宽阔视野的立体匹配算法——SWNet。浅层结构表示网络层数更少、参数更少、处理速度更快; 宽阔视野则表示网络的感受野更宽广，能够获取并保留更多的空间信息。SWNet 由特征提取、3D 卷积和视差回归 3 个部分构成。在特征提取部分，引入了深色空间金字塔结构 (Atrous Spatial Pyramid Pool，ASPP)，用于提取多尺度的空间特征信息，设计了特征融合模块，将不同尺度的特征信息有效地融合起来以构建匹配代价卷; 3D 卷积神经网络利用堆叠的编码解码结构进一步对匹配代价卷进行规则化处理，获得不同视差条件下特征点之间的对应关系; 最后，采用回归的方式得到视差图。SWNet 在 SceneFlow 和 KITTI 2015 两个公开的数据集上均取得了优异的表现，与参考算法 PSMNet 相比，参数数量下降了 48. 9%，且误匹配率仅有 2. 24%。

关键词: 立体匹配, PSMNet 立体匹配网络, 卷积神经网络, 深度学习, 深色空间金字塔结构, 空间特征信息, 特征融合模块

Abstract: Based on PSMNet stereo matching network，an improved stereo matching algorithm with shallow struc-ture and wide receptive field -SWNet was proposed，in order to solve the stereo matching problem in binocular vi-sion，reduce the number of parameters of the stereo matching network，reduce the computational complexity of the algorithm，and improve the practicability of the algorithm． The shallow structure means fewer layers，fewer pa-rameters and faster processing speed，while wide receptive field means that the network is more receptive and can acquire and retain more spatial information． SWNet consists of three parts: feature extraction，3D convolution and disparity regression． In the aspect of feature extraction，Atrous Spatial Pyramid Pool (ASPP) was introduced，which was used to extract multi-scale feature information． Feature fusion module was designed to fuse multi-scale feature information and build matching cost volume． The 3D convolutional neural network use the stack encoding
and decoding structure to further regularize the matching cost volume and obtain the corresponding relationship be-tween the feature points under different disparity conditions． Finally，the disparity map was obtained by regres-sion． SWNet performed well on both SceneFlow and KITTI 2015 public datasets，with a 48. 9% reduction in the number of parameters and a 2. 24% mismatching rate compared to the reference algorithm PSMNet．

Key words: stereo matching, PSMNet stereo matching network, convolutional neural network, deep learning, At-rous Spatial Pyramid Pooling, spatial feature information, feature fusion module

中图分类号:

TP391

刘建国, 冯云剑, 纪郭, 等. 一种基于 PSMNet 改进的立体匹配算法[J]. 华南理工大学学报（自然科学版）, 2020, 48(1): 60-69,83.

LIU Jianguo, FENG Yunjian, JI Guo, et al. Improved Stereo Matching Algorithm Based on PSMNet[J]. Journal of South China University of Technology (Natural Science Edition), 2020, 48(1): 60-69,83.

[1]	李方, 郭炜森, 张平, 等. 基于时空双细胞状态的轴承剩余使用寿命预测方法[J]. 华南理工大学学报(自然科学版), 2023, 51(9): 69-81.
[2]	苏锦钿, 余珊珊, 洪晓斌. 一种面向中文拼写纠错的自监督预训练方法[J]. 华南理工大学学报(自然科学版), 2023, 51(9): 90-98.
[3]	李家春, 李博文, 林伟伟. AdfNet：一种基于多样化特征的自适应深度伪造检测网络[J]. 华南理工大学学报(自然科学版), 2023, 51(9): 82-89.
[4]	马晓亮, 安玲玲, 邓从健, 等. 基于行业词表的自动语音转写后优化技术[J]. 华南理工大学学报(自然科学版), 2023, 51(8): 118-125.
[5]	郭恩强, 符锌砂. 基于特征相似性学习的抛洒物检测方法[J]. 华南理工大学学报(自然科学版), 2023, 51(6): 30-41.
[6]	赵建东, 焦岚馨, 赵志敏, 等. 考虑侧向车换道影响的理论和数据组合驱动的车辆跟驰模型[J]. 华南理工大学学报(自然科学版), 2023, 51(6): 10-19.
[7]	朱铮宇, 罗超, 贺前华, 等. 基于唇重构与三维耦合CNN的多视角音唇一致性判别[J]. 华南理工大学学报(自然科学版), 2023, 51(5): 70-77.
[8]	叶峰, 陈彪, 赖乙宗. 基于特征空间嵌入的对比知识蒸馏算法[J]. 华南理工大学学报(自然科学版), 2023, 51(5): 13-23.
[9]	侯力玮, 王恒升, 邹浩然. 基于深度学习的玻璃基板铲起过程作用力预测[J]. 华南理工大学学报(自然科学版), 2022, 50(8): 71-81.
[10]	莫建文, 朱彦桥, 袁华, 等. 基于神经元正则和资源释放的增量学习[J]. 华南理工大学学报(自然科学版), 2022, 50(6): 71-79,90.
[11]	陆璐, 钟文煜, 吴小坤. 基于多尺度视觉Transformer的图像篡改定位[J]. 华南理工大学学报(自然科学版), 2022, 50(6): 10-18.
[12]	张勤, 胡嘉辉, 任海林. 饲喂辅助机器人的智能推料方法与试验研究[J]. 华南理工大学学报(自然科学版), 2022, 50(6): 111-120.
[13]	杨春玲, 凌茜, 吕泽宇. 特征域多假设预测视频压缩感知重构神经网络[J]. 华南理工大学学报(自然科学版), 2022, 50(6): 80-90.
[14]	沃焱, 梁籍云, 韩国强. 基于度量学习的跨模态人脸检索方法[J]. 华南理工大学学报(自然科学版), 2022, 50(6): 1-9.
[15]	赵建东, 朱丹, 刘佳欣. 基于时间序列分解与门控循环单元的地铁换乘客流预测 [J]. 华南理工大学学报(自然科学版), 2022, 50(5): 22-31.

一种基于 PSMNet 改进的立体匹配算法

Improved Stereo Matching Algorithm Based on PSMNet

RichHTML

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价