随笔-80  评论-22  文章-0  trackbacks-0

音频

现实世界的音频是模拟量,我们要将这个量转化为数字量的方法是三步:

抽样,量化,编码。

抽样,就是一秒钟要抽取的模拟量的数目,这里就完成了模拟量的时间离散,一秒抽几次 就是sample rate 抽样率 单位是Hz,这里得到的是离散模拟信号,常用的音频抽样率如下:

8KHz;16KHz;32KHz;44.1KHz;48KHz;

量化就是从空间上离散,对上边每个抽样的sample进行量化,将离散模拟信号转化为离散数字信号,比如将一个sample转化为16bit,采样深度 就是 bits per sample。

那么 最后数字信号的码率 = 采样率*采样深度    bits/second = samples/second  * bits/sample

比特率就表示一秒钟传输的音频的1 ,0比特数目。一般有率都是表示一秒钟内传输的数据量。

 

音频的其他参数:声道可以分为2,5.1声道

第三步就是编码,根据有损无损方式,可以分为两类,

audio code:

PCM-A Law;PCM-Mu Law;G.723.1;G.729;MPEG Audio;G.726@40K;G.726@32K;G.726@24K;G.726@16K

下面对各种音频格式做以介绍(一般音频格式都是与它的编码格式有关的):

常用的有wav,pcm这两个是无损压缩方式,wav就是记录了音频的wave的波形,pcm是Pulse code modulation.

1wma(windows media audio)视窗媒体音频。微软的音频压缩技术,音质类似mp3,能以mp3一半的技术完成。通过安装wmp(windows media player)来播放。 

2mp3应用最广的有损压缩(MPEG Audio Layer 3),它使用了CBR,VBR,ABR.

CBR(constant bit rate)整个文件的比特率都是一样的。不同复杂程度的音频都用相同的码率,缺点视复杂段落音质差,优点是文件尺寸固定。

VBR(virable bit rate)将一首歌的复杂部分用高比特率编码,简单部分用低比特率编码,使复杂程度与体积之间平衡。优点是整首歌都能达到我们的音质要求,缺点是编码无法估计压缩出来的体积大小。

ABR(average bit rate)以每秒50帧为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量,可以作为VBR和CBR的一种这种选择。

3.ADPCA(adaptive differential pulse code modulation)自适应差分脉冲编码。有损压缩。压缩比很高。当音质一般。

4.AAC(advanced audio coding 高级音频编码)mpeg2一部分,它对立体声,噪音优化,多媒体控制,码流效果音扫描高级特性。支持多种语言和比特率,更高解码效率,acc可以在比mp3文件缩小30%前提下提供更好的音质。

5asf(advanced streaming format 高级流动格式)主要时支持音频网络传输

 

ps:视频格式常用的size有

80x60;88x72;160x120;176x144;320x240;352x240;352x288;640x480;704x480;704x576;720x576;

posted on 2009-07-18 19:42 Bluesea 阅读(513) 评论(0)  编辑 收藏 引用 所属分类: DTV

只有注册用户登录后才能发表评论。
【推荐】超50万行VC++源码: 大型组态工控、电力仿真CAD与GIS源码库
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理