基于 Tiny-yolo 的网络压缩与硬件加速方法

doi:10.12141/j.issn.1000-565X.180360

华南理工大学学报(自然科学版) ›› 2019, Vol. 47 ›› Issue (6): 51-56.doi: 10.12141/j.issn.1000-565X.180360

基于 Tiny-yolo 的网络压缩与硬件加速方法

黄智勇吴海华虞智仲元红

重庆大学微电子与通信工程学院，重庆 400044

收稿日期:2018-07-08 修回日期:2018-11-13 出版日期:2019-06-25 发布日期:2019-05-05
通信作者: 黄智勇(1978-)，男，博士，副教授，主要从事无线传感器网络建模和高效能嵌入式计算研究． E-mail:zyhuang@cqu.edu.cn
作者简介:黄智勇(1978-)，男，博士，副教授，主要从事无线传感器网络建模和高效能嵌入式计算研究．
基金资助:
国家自然科学基金资助项目(61501069)

Method of Network Compression and Hardware Acceleration Based on Tiny-yolo

HUANG Zhiyong WU Haihua YU Zhi ZHONG Yuanhong

School of Microelectronics and Communication Engineering，Chongqing University，Chongqing 400044，China

Received:2018-07-08 Revised:2018-11-13 Online:2019-06-25 Published:2019-05-05
Contact: 黄智勇(1978-)，男，博士，副教授，主要从事无线传感器网络建模和高效能嵌入式计算研究． E-mail:zyhuang@cqu.edu.cn
About author:黄智勇(1978-)，男，博士，副教授，主要从事无线传感器网络建模和高效能嵌入式计算研究．
Supported by:
Supported by the National Natural Science Foundation of China(61501069)

摘要/Abstract

摘要： 针对 Tiny-yolo 网络模型规模大、占内存多、计算量大、不易在嵌入式端实现的问题，提出了网络压缩、结合硬件加速的方法对其进行优化．首先，分析网络连接关系，对网络贡献较小的连接进行裁剪实现网络压缩，裁剪后的权值矩阵采用稀疏化存储方式减少内存占用;其次，对权值进行量化，通过改变数据的位数，在保证精度误差范围内进一步减小内存占用量和计算复杂度;最后，根据 Tiny-yolo 网络结构特点提出了深度并行－流水的 FPGA 加速优化方案，最终实现了 Tiny-yolo 网络运算的硬件加速．通过实验验证，网络裁剪结合量化可以实现 36X 左右的压缩比率，通过硬件加速优化，相比在最大频率为 667 MHz 的 AＲM Cortex-A9 上运算实现了 7X 左右的运算加速．

关键词: 神经网络, Tiny-yolo, 压缩, 硬件加速, FPGA

Abstract: Existing works based on Tiny-yolo often need large-scale network model，occupy more memories，rely on massive calculation and are not easy to deploy on embedded devices． To solve these problems，an efficient optimi- zation method on network compression and hardware acceleration was proposed． Firstly，connections which have less contribution to the network was pruned after analyzing the network connection relationship and sparse storage was adopted for the clipped weight matrix to reduce the memory consumption． Secondly，memory footprint and com- putational complexity within the guaranteed accuracy error was further reduced through quantifying the weight data and changing the number of digits． Finally，according to the characteristics of the Tiny-yolo network structure，a deep parallel-stream FPGA acceleration optimization scheme was proposed and the hardware acceleration of the Ti- ny-yolo network computation was achieved． Experiments demonstrate that the purposed method based on network pruning and quantization can achieve about 36X compression for network model and approximately 7X speedup compared with CPU by hardware acceleration．

Key words: neural network, Tiny-yolo, compression, hardware acceleration, FPGA

中图分类号:

黄智勇吴海华虞智仲元红. 基于 Tiny-yolo 的网络压缩与硬件加速方法[J]. 华南理工大学学报(自然科学版), 2019, 47(6): 51-56.

HUANG Zhiyong WU Haihua YU Zhi ZHONG Yuanhong. Method of Network Compression and Hardware Acceleration Based on Tiny-yolo[J]. Journal of South China University of Technology(Natural Science Edition), 2019, 47(6): 51-56.

[1]	杨春玲, 梁梓文. 特征域近端高维梯度下降图像压缩感知重构网络[J]. 华南理工大学学报(自然科学版), 2024, 52(3): 119-130.
[2]	蔡晓东, 周青松, 叶青. 基于动态邻域采样的社交推荐模型[J]. 华南理工大学学报(自然科学版), 2024, 52(2): 32-41.
[3]	方港, 袁珑华, 王晓明, 等. 基于集合卡尔曼-Elman网络的软测量建模方法[J]. 华南理工大学学报(自然科学版), 2023, 51(8): 126-136.
[4]	马晓亮, 安玲玲, 邓从健, 等. 基于行业词表的自动语音转写后优化技术[J]. 华南理工大学学报(自然科学版), 2023, 51(8): 118-125.
[5]	林志坚, 黄萍, 郑明魁, 等. 基于FPGA的HEVC熵编码语法元素硬件加速设计[J]. 华南理工大学学报(自然科学版), 2023, 51(8): 110-117.
[6]	韩乐, 江怡华. 鲁棒截断L1-L2全变分稀疏恢复模型[J]. 华南理工大学学报(自然科学版), 2023, 51(5): 45-53,140.
[7]	朱铮宇, 罗超, 贺前华, 等. 基于唇重构与三维耦合CNN的多视角音唇一致性判别[J]. 华南理工大学学报(自然科学版), 2023, 51(5): 70-77.
[8]	叶峰, 陈彪, 赖乙宗. 基于特征空间嵌入的对比知识蒸馏算法[J]. 华南理工大学学报(自然科学版), 2023, 51(5): 13-23.
[9]	刘怡俊, 曹宇, 叶武剑, 等. 基于FPGA并行加速的脉冲神经网络在线学习硬件结构的设计与实现[J]. 华南理工大学学报(自然科学版), 2023, 51(5): 104-113.
[10]	冷晟, 付有为, 马万太, 等. 基于GA-BP神经网络的喷射成形锭坯形貌调控技术[J]. 华南理工大学学报(自然科学版), 2023, 51(2): 27-34.
[11]	翟敬梅, 路东伟. 按摩机器人优化示教策略及BPNN-DMPs轨迹学习模型[J]. 华南理工大学学报(自然科学版), 2023, 51(12): 1-8.
[12]	赵荣超, 吴百礼, 陈祝云, 温楷儒, 张绍辉, 李巍华. 多尺度时空信息融合驱动的图神经网络故障诊断方法[J]. 华南理工大学学报(自然科学版), 2023, 51(12): 42-52.
[13]	罗玉涛, 高强. 基于通道注意力和特征增强的交通标志检测[J]. 华南理工大学学报(自然科学版), 2023, 51(12): 64-72.
[14]	杨旭锋, 刘泽清, 张懿. 基于贝叶斯神经网络的金属材料P-S-N曲线估计[J]. 华南理工大学学报(自然科学版), 2023, 51(11): 82-92.
[15]	许伦辉, 余佳芯, 裴明阳, 等. 基于几何路网结构和强化学习的车辆重定位策略[J]. 华南理工大学学报(自然科学版), 2023, 51(10): 99-109.

基于 Tiny-yolo 的网络压缩与硬件加速方法

Method of Network Compression and Hardware Acceleration Based on Tiny-yolo

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价