丁丹丹1 陈靖森1 费加罗1 佟骏超1 潘志庚1,2 姚争为1
DING Dandan1 CHEN Jingsen1 FEI Jialuo1 TONG Junchao1 PAN Zhigeng1,2 YAO Zhengwei1
摘要: 新一代视频编码标准 H. 265/HEVC 采用了去方块滤波与样点自适应补偿滤波 技术来去除视频重建图像的块效应并降低失真. 这两种技术都源于信号处理理论,依赖人 工设计相关算法与参数,并不能充分挖掘自然视频丰富而复杂的特性. 本文将视频编码的 环路滤波问题转化为端到端的回归问题,借助于卷积神经网络,自动学习重建视频图像与 原始图像的复杂映射关系,降低两者的误差,进而提升编码效率. 所提出的多特征增量学 习网络模型共 35 层,整个网络采用全局残差学习方式,通过依次串联多特征增量学习块, 不断提取、筛选,加强有用特征,提升网络的感知能力与学习能力;在局部的每个增量学习 块内,设计了多尺度的卷积核,借助于稠密网络的思想,充分利用各个层次的特征,使得信 息在各层间充分传递. 实验结果表明,这种稠密与稀疏结合的网络结构有效地提高了网络 的学习能力,并具备良好的泛化性,对视频编码重建图像的质量增强有明显效果. 所提出 的网络模型用于取代 H. 265/HEVC 的环路滤波,在 All Intra Main 配置下,亮度分量获得 最高 -11. 12%,平均 - 6. 32% 的 BD-rate 节省. 该模型用于 H. 265/HEVC 的环路滤波, BD-rate 平均可降低 5. 24%.