非线性编辑系统中的数字视频压缩技术

发布日期：2015-04-06　来源: 中国压缩机网　查看次数: 2607

核心提示：　　数字视频技术已广泛地应用于演播室节目制作，例如编辑、特技效果等。但视频数字化后的数据量非常巨大，例如1秒NTSC制式视频

　　数字视频技术已广泛地应用于演播室节目制作，例如编辑、特技效果等。但视频数字化后的数据量非常巨大，例如1秒NTSC制式视频流的数据量为超35格式的电影数据量约为9G bit字视频的存储、处理和传输来说，视频压缩是一项非常关键的技术。

　　视频压缩技术除了利用空间冗余、频谱冗余和心理视觉冗余对视频图像进行帧内压缩外，还利用相邻图像帧之间的相似性而产生的时间冗余对视频图像进行帧间压缩，进一步提高压缩效率节目制作要求达到广播级质量视频数据进行精确到帧的随机访问频压缩标准虽然较多，但多数是用于视频数据的传输一些标准可以用于节目制作，但仅为少数公司所支持（例如BetacamSX、DV DVCPRO等）。压缩格式的兼容性给节目制作系统的设计和实现带来较大的问题，本文主要分析了适用于节目制作的视频压缩技术Motion JPEG和MPEG2 PML的特点，以及方正视音频制作系统中针对压缩格式兼容性问题的解决方案。

　　2基本概念2.1非线性编辑通常将基于计算机、专业视频卡、高速硬盘的节目制作系统称为非线性编辑系统，非线性编辑（以下简称NLE）是相对于线性编辑而言。

　　人眼对亮度的敏感程度高于对色度的敏感程度，当观看图像的细节时，人眼对亮度差别较敏感，而对色度的差别较不敏感。ITUR BT.601演播室数字电视编码参数建议标准利用了这一特点，将电视信号分解为一个亮度分量（Y）和两个色度分量（CrCb），并给亮度分量分配更高的采样频率，亮度色度空间YCrCb形式与彩色空间RGB形式的关系为：计算机应用Motion JPEG是一种帧内压缩算法，采用JPEG压缩标准对视频图像序列中的每一帧图像进行压缩。

　　YCrCb空间中对视频数据进行压缩处理，它采用两个量化矩阵，一个量化矩阵对应亮度分量，另一个量化矩阵对应2个色度分量，并分配更多的数据位来表示视觉上更重要的亮度系数，从而把人眼的视觉特点融入到压缩处理中。

　　MPEG2主要是为视频传输开发的，应用于节目制作还有许多问题，例如：图像数据流的一个个GOP（图像组）中包含具有独立整帧信息的I帧和预测信息的P帧及B帧，存在多帧传输延时问题，难以实现帧精度视频编辑处理*大数据传输率为15Mbps ，即使采用较小的GOP（图像组），也难以提供演播室要求的节目质量4∶2∶0采样需对色度数据进行插值，这样经过多代（这里一代表示一个压缩解压缩周期）之后，图像质量无法满足节目制作的要求。

　　MPEG2标准中增加了MPEG2 P ML子集，功能包括：通过缩短MPEG2数据流的GOP（*短时只有I帧），以满足演播室对帧精度视频编辑的要求保持了全色度带宽，纳入消隐行，每帧由576行增加到608行，突破15Mb s的限制，*高码率增加到50Mb s ，能够提供节目制作要求的广播级质量同时支持4∶2∶2和4∶2∶0采样，经过多代编解码后，图像质量仍能达到广播级。

　　3压缩算法性能分析Motion JPEG是目前节目制作中使用*广泛的压缩标准，我们采用Matrox公司的DigiLE视频卡实现视频流的实时Motion JPEG压缩解压缩功能，组成原型系统以测试Motion JPEG压缩算法的性能，得到如下结果。

　　压缩比对应的模拟视频指标每GB存储的视频时间1分37秒由于仅采用帧内压缩，便于进行帧精度的编辑，可以实现质量可调的有损压缩。但由于没有利用视频流的时间冗余，因此压缩比受到限制，当压缩比较大时，图像有明显方块效应。压缩比小于8∶1时可以达到演播室要求的广播级节目质量，为保证经过多次压缩解压缩后节目质量仍保持广播级，压缩比应小于4∶1.表1是Motion JPEG压缩比、视频质量、以及存储空间之间的关系。

　　对于图像数据交换而言， Motion JPEG不是一个完整的结构， Motion JPEG数据流的定义是根据译码器为解压缩数据流所需要的内容来定义的，因此Motion JPEG没有标准的文件格式。例如ReelTime卡产生的压缩数据不能由DigiLE卡解压缩，反之亦然，这样造成了不同数字视频制作系统间数据交换的困难（注：ReelTime为Pinnacle公司生产的视频卡，采用MotionJPEG压缩算法，视频质量达到广播级，并且提供实时双通道视音频I O和标准的实时切换特技）。

　　由于目前市场上还没有支持MPEG2 PML压缩标准的视频卡，我们无法直接测试MPEG2 PML压缩算法在节目制作方面的性能，这里仅引用Tek tronix公司提供的实验数据对MPEG2 PML压缩算法的性能做一个比较。

　　MPEG2 PML的图像质量数据率曲线存在一个拐点，当数据率小于8Mbps时，图像质量下降将加快。在提供同样图像质量的情况下，MPEG2 PML用于多代编解码的应用时（例如节目制作），4∶2∶2采样提供比4∶2∶0更好的性能。

　　只要遵守MPEG2 PML压缩标准，基于不同视频卡的节目制作系统间可以进行数据交换。在节目制作中采用MPEG2 PML压缩标准还可以使节目采集（摄制）、存储、传输、制作的数据格式统一起来，通过选择不同数据率和GOP中的I P B帧结构，来适应不同的应用范围，以减少因格式转换造成的质量损失和时间延迟。

　　4非线性编辑系统的设计根据以上分析，要解决视频压缩格式的不兼容性，*好办法是使系统具有较强的硬件独立性。我们设计并实现了一个基于Motion JPEG的非线性编辑系统，采用Matrox公司的DigiLE卡提供实时双通道视音频IO和实时切换特技，在系统设计中加入一统对特定视频卡的依赖性，便于以后使系统能够支持多种视频硬件和压缩格式，能够随着视频硬件的发展，迅速地将系统移植到性能更好的视频卡上，系统总体框架如图1所示，应用层是NLE系统应用程序，硬件平台层包括硬件厂家提供的视频卡以及开发程序包，在我们的系统里是DigiLE和DigiLE API.

　　硬件抽象层（HAL）采用部件对象模型（COM）技术实现，将视频卡（DigiLE）提供的所有功能以面向对象的方法进行封装。应用层不直接与DigiLEAPI打交晏阳：非线性编辑系统中的数字视频压缩技术先考虑它。它包括以下两条：devClass定义了驱动程序的类，包括NIC driver vice），例如NT转向器。

　　bindable指定了ndisTransport类组件可以绑定到ndisdriver类组件， LmNetService类组件可以绑定到各组件的NetRules定义的是组件特定的绑定规则，它包括：class允许组件定义一个或多个新的组件类bindable允许组件定义更多可能的绑定组合type指明该组件所属的类（或多个类），它使得NCPA判断该组件属于绑定层次的哪一层。

　　当NCPA根据上述规则确定完所有的绑定关系后，就创建或更新键HKEY Linkage下的值，包括：Bind该组件将要绑定到的下层组件的设备名Export列出将要由该组件增加到NT对象名空间的设备名，以便其它组件存取Route这是一个字符串列表，每一个串描述了穿过由绑定形成的组件堆栈的确切通路。

　　在系统启动时， NT服务控制器使用注册表中的信息，根据绑定的层次，从底端向上加载网络组件。

　　在每个组件被加载的时候，它们有机会进行初始化，它们通过读取Bind子键下的信息知道应该绑定到哪一个下层组件上。

　　4结语对于广大志在从事NT网络工作的计算机爱好者，本文给出了一个切入内幕的介绍，描述了组成一个NT网络的各个部分，它们的功能，相互关系，它们是如何构成一个整体并向外提供系统服务的。由于NT网络组成的复杂性，建议在实际工作中多借助有价值的参考资料北京：机械工业出版社， 1997.

　　邵元庆。WindowsNT网络系统[ M] .北京：电子工业出道，而是通过HAL提供的接口调用视频卡的功能。

　　这样系统移植时只需修改硬件抽象层，而无需改动NLE系统应用程序的代码，保证了移植的效率和系统的稳定性。

　　硬件抽象层（HAL）包括播放、采集、压缩解压缩和HAL接口4个部件（component），如图2所示，播放部件提供对视音频素材和图文字幕素材的播放功能，播放时可以加入多种实时特技，包括切换特技、位移、放缩、抠像、动态背景等，播放画面同时在计算机屏幕和专业监视器上显示采集部件提供手动采集和批处理采集功能，可以分别通过人工控制录像机（VTR）或计算机遥控录像机进行视音频信号采集压缩解压缩部件可以将播放的视音频信号通过压缩生成视音频文件存储到硬盘上，便于以后的反复使用。HAL接口部件对播放、采集、压缩解压缩三个部件提供的功能进行封装，为应用层提供一个统一的接口，由于部件对象模型（COM）中不同的部件可以独立进行升级而不会互相影响，将HAL接口做为一个独立的部件保证了面向应用层接口的一致性。

　　5结束语数字视频压缩是非线性编辑系统中的关键技术，Motion JPG和MPEG2 PML是两种使用于节目制作的视频压缩格式，由于Motion JPEG不同硬件平台之间的不兼容性以及不同压缩格式之间的不兼容性，为非线性编辑系统的设计和实现带来较大的困难，针对这一问题在非线性编辑系统的设计中加入硬件抽象层，减少应用系统对视频硬件的依赖性，是较好的解决办法。