模拟音频数字化过程

声波是随时间而连续变化的物理量,可用随声波变化而改变的电压或电流信号来模拟。传统的声音记录方式就是将模拟信号直接记录下来随着计算机技术的发展,特别是海量存储设备和大容量内存在计算机上的实现,对音频媒体进行数字化处理便成为可能。

1939年,法国工程师A.里弗斯发明了将连续的模拟信号变换成时间和幅度都离散的二进制码代表的脉冲编码调制( Pulse Code Modulation, PCM)信号,并申请了专利。

1962 年,美国Bell实验室为ATT制成了国际上第一套商用PCM电话系统,标志着通信开始步入数字化。计算机技术的发展更加促进了通信的数字化,并逐步与通信相结合。为使计算机能处理音频,必须对声音信号进行数字化。

如同在时间和幅度 上都连续的模拟声音信号,经过采样、量化和编码后,即成为离散的数字信号。

数字音频
声明:部分内容及图片来源于网络,如有侵权请联系删除。

1、采样

采样也称为抽样,是将时间上、幅值上都连续的模拟信号在采样脉冲的作用下,转换成时间上离散(时间上有固定间隔)但幅值上仍连续的离散模拟信号。所以采样又称为波形的离散化过程。 能音具体方法是:每隔相等或不相等的一小段时间采样一次。相隔时间相等的采样为均匀采样,也称为线性采样;相隔时间不相等的采样为不均匀采样,又称为非线性采样;声音数字化过程中通常采用均匀采样。 每秒钟的采样次数称为采样频率,采样频率越高,数字化后声波就越接近于原来的波形,即声音的保真度越高,但量化后声音信息量的存储量也越大。采样必须遵循奈奎斯特采样定理,即只有当采样频率高于声音信号最高频率的2倍时,才能保证模拟信号经过采样后仍然包含原信号中的所有信息,也就是说能无失真地恢复原模拟声音信号。完成声音数字化所用到的主要设备是模拟数字转换器( Analog to Digital Converter ,ADC)。

目前,在多媒体系统中捕获声音的标准采样频率有44.1 kHz,22. 05 kHz和11.025 kHz三种。而人耳所能接收声音的频率范围为20 Hz ~ 20 kHz,在实际应用中,音频的频率范围是不同的。例如,根据CITT公布的声音编码标准,把声音根据使用范围分为以下三级:

①电话语音级:300 Hz ~3.4kHz。
②调幅广播级:50 Hz-7 kHz。
③高保真立体声级:20Hz - 20 kHz。

采祥频率11.025 kHz,22.05 kH,44.1 kHz正好与电话语音、调幅广播和高保真立体声(CD音质)三级使用相对应。DVD标准的采样频率是96 kHz。

模拟音频
声明:部分内容及图片来源于网络,如有侵权请联系删除。

2、量化

声音信号经过采样,成为时间上离散、幅度上连续的瞬时值,进一步通过量化将其幅度离散,即用一组规定的电平把瞬时采样值用最接近的电平值来表示,通常是用二进制表示。

量化后的信号和采样信号存在差值,称为量化误差。量化误差是不能完全消除的,在接收端表现为噪声,称为量化噪声。量化级数越多误差越小,相应的二进制码位数越多,要求传输速率越高,频带越宽。为使量化噪声尽可能小而所需码位数又不太多,通常采用非均匀量化的方法进行量化。非均匀量化根据 幅度的不同区间来确定量化间隔,根据声音 幅度普遍偏低的特点,在幅度小的区间量化间隔取得小,幅度大的区间量化间隔取得大。

一个模拟信号经过采样和量化后,得到已量化的脉冲幅度调制信号,它仅为有限个数值。

3、编码

编码就是用一组二进制码组来表示每一个有固定电平的量化值。PCM编码将量化和编码在一个过程中同时完成。

对于电话语音,国际电报电话咨询委员会(CCITT)规定采样率为8 kHz,每个采样值编码位数为8 bit,即共有28即256个量化值,因而每路PCM编码后的标准数码率是64 kbit/s。为解决均匀量化时小信号量化误差大、音质差的问题,在实际中采用不均匀选取量化间隔的非线性量化方法,使用两种对数形式的压缩特性:A律和μ律。A律PCM用于欧洲和中国,主要用于30/32路一次群系统;μ律PCM用于北美和日本,主要用于24路一次群系统。