SVAC 标准技术特点1.SVAC 标准的技术创新简介(1)支持高精度视频数据,在高动态范围场景提供更多图像细节,减少编解码环节的图像信息损失2)采用帧内 4×4 预测与变换、上下文自适应二进制算术编码(CABAC)等技术提高编码效率,在获得更好图像质量的同时也能获得更高的编码效率3)支持感兴趣区域(ROI)变质量编码,在网络带宽存储空间有限的情况下,提供更符合监控需要的高质量视频编码4)支持可伸缩视频编码(SVC),满足不同传输网络带宽和数据存储环境的需求5)支持代数码书激励线性预测(ACELP)和变换音频编码(TAC)切换的双核音频编码,保证对语音和环境(背景)声音均有较好的编码效果6)支持声音识别特征参数编码,避免编码失真对语音识别和声纹识别的影响7)支持监控专用信息(绝对时间、智能分析结果、报警信息),便于视音频内容的有效管理和综合利用8)支持加密和认证,保证监控数据的保密性、真实性和完整性2.SVAC 标准的技术特点详解(1)SVAC 标准主要技术特点-支持高精度视频数据监控场景图像动态范围往往很大,低精度视频数据会导致图像对比度下降、图像细节和层次丢失,造成图像原始内容的损失;SVAC 视频压缩编码支持高精度视频数据,可以保证视频编解码环节尽量少的损失图像信息,保证存储的视频数据尽可能真实、完整的保留拍摄场景的信息和图像细节,对后期的综合研判以及作为法律证据意义重大;按照 SVAC 标准中的量化方法,采用高精度视频数据不会降低编码效率,不会增加码率,采用 10-bit 数据同样码率下 PSNR 好于 8-bit 数据;标准的技术框架保留未来扩充至支持更高数据位宽(如 16-bit)的可能。
(2)SVAC 标准主要技术特点-支持先进编码工具SVAC 标准可以在获得更好图像质量的同时获得较高编码效率,一是采用 CABAC 获取更高编码效率,上下文自适应二进制算术编码CABAC)是一种先进高效的熵编码技术,大量研究结果表明,CABAC 比VLC 有更高的编码效率(减小码率约 10%);二是采用 Intra4x4 以更好地保持图像细节,在采用 8x8 预测和变换的基础上,增加帧内 4x4(Intra4x4)预测和变换,更好地保持图像细节,大量测试结果表明,采用 Intra4x4 可以有效降低细节丰富、边缘锐利区域附近的噪声3)SVAC 标准主要技术特点-感兴趣区域(ROI)变质量编码监控应用中,通常总是对场景中的某些区域更关心--感兴趣区域(Regions of Interest : ROI);图像被分为若干个 ROI 区域和一个背景区域,在网络带宽或存储空间有限的情况下,优先保证 ROI 图像质量,节省非 ROI 的开销;每个 ROI 的图像质量分别控制,支持 ROI 部分比非 ROI 部分采用更高码率(图像质量更好);码率受限时,优先降低非 ROI 部分的码率,支持非 ROI 部分图像可丢弃或不编码,以适应传输带宽的要求。
(4)可伸缩视频编码 SVC可伸缩视频编码(Scalable Video Coding)通过对视频数据的分层次压缩(分为基本层和增强层),一个编码器可以输出不同分辨率/帧率/质量的多个编码视频流SVC 主要包括: 空间 SVC(Spatial SVC)时间 SVC(Temporal SVC)质量 SVC(Quality SVC)空间可伸缩视频编码 SVC基本层由低分辨率编码图像构成,对基本层单独解码可以获得一个低分辨率的视频序列,对基本层和增强层联合解码可以获得高分辨率的视频序列,空间 SVC 比简单的双码流具有更低的总体码率 可伸缩视频编码 SVC 应用示例-更好的网络适应性SVC 应用示例:更好的存储适应性(5)ACELP 和 TAC 切换的双核音频编码低频信号采用 ACELP 和 TAC 双核编码,ACELP 适合语音信号编码,TAC 适合环境或背景声音编码高频信号采用 BWE 编码利用低频解码信号和极少高频参数来重建高频信号,同全带编码技术相比,可以节省近 50%码率 (6)声音识别特征参数编码在音频编码的基础上,支持识别特征参数编码,避免编码失真对语音/声纹识别的影响,识别特征参数采用 MFCC 方案,识别特征参数编码支持两种模式;直接编码模式:无需计算重建信号,直接编码原始信号特征矢量,计算复杂度低,码率 4.8kbps。
预测编码模式:原始信号和重建信号分别提取特征,编码特征残差矢量,计算复杂度高,码率 3.2kbps7)支持监控专用信息绝对时间信息通过专门语法与视音频压缩数据一起传输和存储,便于检索查询、视音频同步和多路视频同步,还可以避免在图像上叠加 OSD 破坏图像原始内容;特殊监控事件类型及参数通过专门语法与视音频压缩数据一起传输和存储,便于检索查询,对于大规模监控网络和数据库更为重要 (8)支持监控数据加密和认证利用安全参数集定义加密和认证的方法及保护范围,可以实现不同级别保护;利用 NAL 单元头中特定标志位标记加密和认证是否生效;以统一的语法格式支持多种加密和认证算法,具备灵活的可扩展性视频档次和级别的划分SVAC 视频划分为简单、主要、高级 3 个档次(profile):简单档次支持帧模式编码、4:2:0 数据采样格式、8-bit 数据精度、帧内预测和前向预测(I/P-pic)、VLC 编码、监控专用信息等,满足监控视频编解码的基础应用;主要档次增加支持场模式编码、4:0:0 数据采样格式、9/10-bit 数据精度、双向预测(B-pic)、CABAC 编码、ROI、加密和认证等,满足典型监控应用的视频编解码需求;高级档次进一步增加支持 4:2:2 数据采样格式、SVC 等, 功能更强大。
SVAC 视频主要根据图像分辨率、数据格式和最大编码比特率划分为 8 个级别(level)音频档次和级别的划分SVAC 音频划分为简单、主要、高级 3 个档次(profile):简单档次支持 ACELP 和 BWE 编码,可满足一般监控场景对语音信号的编码需求;主要档次增加支持识别特征参数的直接编码,实现复杂度有所增加;高级档次进一步增加支持 TVC 编码和识别特征参数的预测编码,实现复杂度高,但编码效率更高SVAC 音频主要根据采样频率划分为 3 个级别(level)。