浅谈多媒体数据压缩技术方法--中国期刊网

字体：大中小

首页> 原创作品> 正文

浅谈多媒体数据压缩技术方法

发表时间：2020/5/15 来源：《基层建设》2019年第34期作者：张钊毓

[导读] 摘要：随着多媒体技术的发展，多媒体计算机系统要传输、处理、存储的数据量日益增多，这使得多媒体数据压缩显得尤为重要。

        南宁富桂精密工业有限公司广西南宁 530000
        摘要：随着多媒体技术的发展，多媒体计算机系统要传输、处理、存储的数据量日益增多，这使得多媒体数据压缩显得尤为重要。而数据压缩技术又使数据压缩成为可能，高效的数据压缩技术是目前要研究的一个重要方向。本文主要探讨多媒体数据编码和压缩技术，侧重于数字图像压缩技术的分析。
        关键词：多媒体；数据编码；数据压缩；算法
        在多媒体计算机系统中，要传输，处理，存储文本、图形、图像、音频、视频在内的多种多媒体数据形式，而经过采样，量化，编码后，信息量相当巨大。虽然目前计算机计算速度、数据存储技术和网络传输技术都迅速发展，但数据压缩技术仍然是要重点解决的问题，是多媒体计算机系统的关键技术，而目前尚未出现一种理想的数据压缩算法可以彻底解决多媒体数据传输、处理、存储的瓶颈问题。
        1数据压缩的可能性和必要性
        一幅1024×76、由24位真彩色构成的图像，未经压缩需要2.25M存储空间，而一分钟24位真彩色、320×240分辨率、25帧／秒的PAL制式的视频需要的存储空间高达29.6M。由此我们得知，未经压缩的多媒体数据量非常大，如果不对如此巨大的数据量进行压缩处理，无疑将给存储器的存储、网络的传输、数据的携带和计算机的处理速度带来极大的压力。
        2数据压缩编码方法分类
        数据压缩如此重要，经过长期对多媒体数据压缩方法研究，目前已经出现了多种逐渐趋于成熟的压缩算法。按照不同的分类方法，可以将多媒体压缩编码方法进行划分。根据基本原理划分，压缩编码方法可以分为依赖于对人类感知特性研究的压缩编码方法和基于像素或波形的编码方法两大类；根据压缩后数据质量损失与否来划分，压缩编码方法又分为无损压缩编码和有损压缩编码。
        2.1无损压缩编码
        无损压缩编码，也称熵编码，就是指还原压缩后的数据与未压缩之前的原数据完全相同，不存在数据丢失的压缩编码方式，也就是说无损压缩编码是可逆，可恢复的。典型的无损压缩编码有行程编码、统计编码(包括霍夫曼编码、算术编码)、不进行量化处理的预测编码、LZW编码。
        2.2有损压缩编码
        有损压缩编码是指还原压缩后的数据存在与未压缩的原数据有不同的地方，存在数据丢失的压缩编码方式，有损压缩编码是不可逆和不可恢复的。主要的有损压缩编码包括模型编码、变换编码、预测编码以及混合编码等。
        3静态图像压缩标准JPEG
        3.1 JPEG标准的主要内容
        JPEG标准，即ISO/IECl0918号“多灰度连续色调静态图像压缩编码”标准，是一种适用于彩色和单色多灰度或连续色调静止数字图像的压缩标准。本标准包括基于DPCM（差分脉冲编码调制）和DCT（离散余弦变换）的无损压缩算法，及基于Huffman编码的有损压缩算法两部分。
        3.2 JPEG静态图像压缩算法
        基于DPCM的无失真编码。为了满足无失真压缩的需要，JPEG选择采用预测编码及Huffman编码，源数据依次进入无失真预测器和熵编码器进行无失真预测和熵编码，整个压缩过程无信息丢失，可保证重建图像数据与原始图像数据完全相同。这种编码的优点是重建图像质量好，硬件容易实现，缺点是压缩比太低，大约是2:1。
        基于DCT的有失真压缩编码。基于DCT的压缩编码算法包括基本系统和增强系统两种层次，顺序方式和累进方式两种工作方式。基本系统采用顺序工作方式，只采用哈夫曼编码。增强系统在基本系统的基础上，还采用自适应二进制算术编码。DCT编码的基本过程：首先进行正向离散余弦变换，再进行量化，Z字形编码，并分别对量化后的系数进行差分脉冲编码调制和行程长度编码，最后再进行熵编码。
        基于DCT的累进操作方式编码。累进模式是将DCT系数按照一定的顺序进行编码和传输，以达到随着解码的进展，图像逐渐清晰的效果。累进操作方式需增加一个足以存储量化后DCT系数的缓冲区在量化器的输出与熵编码的输出之间，对缓冲区中存储的DCT系数多次扫描，分批编码。累进操作方式包括频谱选择法和按位逼近法。

期刊文章分类查询,尽在期刊图书馆

        基于DCT的分层操作方式。基于DCT的分层方式是将一副原始图像的空间分辨率分成多个分辨率进行“锥形”的编码方法，水平(垂直)方向分辨率的下降以2的倍数因子改变。
        4动态图像压缩标准MPEG
        4.1 MPEG-1系统
        MPEG-l标准是“用于大约高达1.5Mbps速率的数字存储媒体的运动图像及其伴音编码”。MPEG-l压缩的基本方法如下：首先在单位时间内采集并保存第一帧图像信息，接着在对单帧进行有效压缩的基础上，只存储其余帧图像中相对第一帧图像发生变化的部分，以达到图像数据压缩的目的。MPEG-l采用的是有损图像质量的非对称压缩算法，压缩需进行图像的比较分析等大量运算，只有一次，大约要几十小时，而解压运算量较少，可有上千次，只需一个多小时。
        4.2 MPEG-2数据压缩标准
        MPEG-2是一种高质量的运动图像及其伴音压缩标准，它建立在MPEG-1的基础上，以提高图像质量为目标的通用国际编码标准，共包括系统、音频、视频、符合性测试、非向后兼容音频、10比特视频、软件、数字存储媒体的指令和控制、实时接口等9个项目。其中第1到3部分作为MPEG2的核心。MPEG-2的传输码率可以调整，支持从可视电话到HDTV多种应用，针对不同的用途，MPEG-2标准又分为4个等级和5个档次。
        4.3 MPEG-4数据压缩标准
        MPEG-4即“甚低速率视听编码”标准，是针对低速率下的音频、视频编码和交互播放开发的算法和工具，基于内容/对象编码是其显著特点。为了能够单独对视频对象进行解码，MPEG-4对每个视频对象的形状、运动和纹理信息进行编码形成单独的视频对象。与MPEG-l和MPEG-2相比，MPEG-4更适合于交互视听服务，它的设计目标使其具有通用性和可扩展性，能够更广泛应用在数字电视、实时多媒体监控、交互式图形应用、移动多媒体通信、可视游戏Internet/Intranet上的视频流传输、交互多媒体服务等方面。
        5多媒体数据压缩的未来
        动态图像专家组制定的标准具有系统化的特征，而对使用过程中的具体情况并没有做出明确规定，因此在MPEG的研究过程中需要注意以下两点：（1）MPEG的实现；（2）深入探究图像的压缩方法，在保证获取数据压缩比率最大化的前提下最终达成人机对话。
        从现有的MPGE标准看，多媒体数据压缩主要解决方案是基于对象的处理方案，即根据不同的内容、数据、要求等具体情况选择不同的处理方法。一方面，这是实现人机对话的必然要求，人们结合自身实际需要来选择可用的处理办法；另一方面，也是深入获取图像、数据压缩比率最大化的需要。在原先的压缩方式下无法实现高速数据流，需要在对象处理方法的基础上，针对性地对不同对象使用不同的压缩方法，进一步实现模型的压缩方法，从而获得更大的压缩比并满足人的视觉要求。该问题引出了MPEG-7标准，MPEG-7是针对媒体内容检索而提出的多媒体内容描述接口，它的目标是建立一套视听特征的量化标准描述器、结构以及它们之间相互关系，这被称为描述方案，其关键是对影音相关内容的描述、定义。
        针对内容的压缩是多媒体数据压缩的必然趋势，这种趋势必然导致对信息的高级处理方式更接近人们自主的处理方法。此外，在与现代网络技术相互融合的条件下，未来图像和视频压缩技术的应用必然会得到更好的发展，例如动态视频传输系统、远程图像、电视会议系统、可视电话系统等。
        6结语
        本文对当下的多媒体数据压缩技术的压缩标准、压缩方法及数据压缩编码的算法进行了探究，并对多媒体数据压缩技术的重要意义进行了分析。我们应当综合考虑数据处理方式的难易、数据的压缩比率、压缩数据或信息恢复的效果等这些因素来判断各种压缩方法的不足与优势。综上所述，静止图像采用联合图像专家组压缩标准JPEG，而动态视频与音频则采用MPEG的压缩标准。
        参考文献：
        [1]沈丰.浅谈多媒体数据压缩技术[J].长江科学院院报,1999(5).
        [2]陈明编.多媒体技术基础实验[M].北京:中央广播电视大学出版社,2000.
        [3]熊伟等编著.多媒体技术应用基础[M].西安:西安电子科技大学出版社,2000.