浅谈广播音频S48格式(转)

大家好，欢迎来到IT知识分享网。

一关于音频压缩格式

     1．MPEG-1音频压缩与专业广播领域内的数字音频文件格式
众所周知，音频数字化是通过声卡对模拟音频信号进行每秒上千次的采样，然后把每个采样值按一定的比特数量化。对CD音质的信号来讲，每秒要44100次的采样，每个采样值是16比特的量化，最后得到标准的数字音频的码流。记录数字音频码流的文件格式很多，Microsoft定义的用于Windows PC的数字化音频的文件格式扩展名为WAV，是一种应用较广的线性的、非压缩的数字化声音文件格式。立体声CD 音质信号每秒的码流是44.1k×16×2≈1.4Mb/s，或者存储容量每分钟为10M。这样高的码流和容量，虽然具有很好的音质，但占用较多的磁盘空间，对于数字音频的存储、处理和网络传输提出了很高的要求。因此对数字音频进行压缩具有非常重要的意义，只有这样系统才具有更好的可用性。
     对于专业广播领域内的数字音频文件格式，除了音质方面的要求，对编辑性能也有一定的要求，在广播数字化浪潮席卷全国的今天，统一的格式还给广播电台、电视台、唱片社及其它节目录制单位基于不同计算机平台的音频工作站之间的数字音频文件录制和无缝交换提供方便。
    在音频压缩标准化方面取得巨大成功的是MPEG-1音频（ISO/IEC11172-3）。MPEG音频压缩的原理很简单，首先是利用编码技术，将源文件(Wave格式)重新进行编码压缩，其次是利用数据缩减，将人类听觉中的不敏感部分删除，从而达到缩小文件尺寸的目的。在MPEG-1中，对音频压缩规定了三种模式，即层Ⅰ（MP1）、层Ⅱ（即MUSICAM，又称MP2），层Ⅲ（又称MP3）。
     Wave没有经过压缩，文件的尺寸非常大，而MP1和MP2分别有1:4和1:6～1:8的压缩比例。MP2由于其适当的复杂程度和优秀的声音质量，以及高质量的压缩和高效率的编辑性能正在数字演播室、DAB、DVB等数字节目的制作、交换、存储、传送中得到广泛应用，成为数字音频工作站和自动播出领域内事实上的标准。
2．具体的压缩原理
       MPEG-1的压缩技术方案是子带压缩，子带分割的实现是通过时频映射，采用多相正交分解滤波器组将数字化的宽带音频信号分成32个子带；同时，信号通过FFT运算，对信号进行频谱分析；子带信号与频谱同步计算，得出对各子带的掩蔽特性，由于掩蔽特性的存在，减少了对量化比特率的要求，不同子带分配不同的量化比特数，但对于各子带而言，是线性量化。加上CRC校验码，得到标准的MPEG码流。在解码端，只要解帧，子带样值解码，最后进行频时映射还原，最后输出标准PCM码流。

心理声学模型：使用1024点的FFT变换得到信号的短时频谱功率信息，输出的电平和时频映射的子带样值同步计算，得到每个子带的掩蔽阈值。最后将该子带的最大信号/掩蔽阈值率输入给量化器。MP2使用的FFT精度比MP1（512点）高一些，提高了频率的分辨率，得到原信号的更准确瞬间频谱特性。

量化/编码：首先检测每个子带的样值，找到最大相对值，并且将它6比特量化，对该子带来讲叫比例因子，MP2的帧长度码流是MP1的3倍，允许每个子带有三个连续的比例因子，但编码时用一、二个或者三个，由它们之间的差别来定。通过最小化噪音/掩蔽值，由比例因子决定动态量化比特数，将该子带样值线性量化。量化比特数用一个4位码来描述，4位码可以用来描述24=16bit，最大16bit的量化。比例因子用6位码来描述，最大26=64的子带样值的系数。这样每个子带用的量化比特数和每个子带的最大样值都在MPEG的码流里，在接收端再按照这些信息还原原信号的幅值。MP2子带内有三个比例因子，这就意味着带内再进行动态比特分配，更增加了MPEG-1的压缩率。

帧形成：每一帧的开始都有一个同步的信息，还有CRC的循环冗余纠错码。帧是MPEG-1处理的最小单元，一帧信号处理1152个PCM的样值，因为要检测每个样值的大小后，才能开始处理，所以延时时间为1152/48k=24ms。一帧相当于24ms 的声音样本。这样Mp2的精确度为24ms，而MP1的精确度为8ms，如果用于编辑的话，MP1更精确。MP2描述比特分配的比特位数不是固定的，在低端子带用4位码来描述，相对低端子带量化比特数最大为24=16bit，在中间子带用3位码描述，相对中间子带比特最大为23=8bit，高端子带用2位码来描述，相对最大比特为22=4bit，这种分频率不同而比特率不一样的做法，也是关键带宽的应用之一。

MP2具有多种多样的比特率，对于 2×128 kb/s或以上比特率的音频数据是无损质量的压缩，比特率的大小显示了编码的质量和压缩比。例如：对于比特率为256kb/s,采样率48kHz，其压缩比为256/48=5.3，声音质量高于CD质量。而对于比特率32kb/s,采样率32kHz，其压缩比为32/32=10,但声音质量远低于CD质量。

转载于:https://www.cnblogs.com/jdmei520/archive/2009/06/29/1513348.html

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。本文来自网络,若有侵权，请联系删除，如若转载，请注明出处：https://haidsoft.com/128371.html

浅谈广播音频S48格式(转)

相关推荐

发表回复