织梦CMS - 轻松建站从此开始!

罗索

多媒体测试库建设之音频部分

jackyhwei 发布于 2011-09-20 11:34 点击:次 
最近要为公司写多媒体式样书,并建立一个多媒体测试库,说实话以前一直做codec,却从没有写过对整个一个产品的式样书,也不知道是否符合标准规范,现 在把一些操作过程记录下来,如果有高人觉得不适合或者有误的地方,还请多指点~
TAG:

原文地址:http://blog.csdn.net/yili_xie/archive/2009/11/12/4803596.aspx

多媒体 测试库建设 之音频 部分

最近要为公司写多媒体式样书,并建立一个多媒体测试库,说实话以前一直做codec,却从没有写过对整个一个产品的式样书,也不知道是否符合标准规范,现 在把一些操作过程记录下来,如果有高人觉得不适合或者有误的地方,还请多指点~

先说明一下我压制测试文件 选择编码器的标准:如果有官方提供的标准编码器,就使用标准的编码器,如果没有就使用现在在压制音视频上比较广泛使用的codec。

1、AMR

对MID而言,AMR的要求并不是很高,因为AMR作为人声编解码相对来说复杂度较低,没有太多复杂而庞大的计算,所以AMR暂时就不作测试要求了,使用google 本身提供的codec就可以了。

2、MP3

现 在比较广泛使用的还是mpeg-1 layer |/II/III,在实际使用过程中发现mpeg-2 layer |/II/III还比较广泛地作为着mp4,3gp的音频压缩格式,因此必须提供对mpeg-2的支持。对mpeg-1 layer ||/|||我使用的是开源的编码器lame,对mpeg-2 layer ||/|||也是使用的开源编码器twolame。另外所有的音频源都是使用Audacity从FLAC文件中取得的,在重新采用和还原raw数据上我还 使用了sox。

基本上整个编码过程没有朋到什么问题,头一次使用sox和Audacity,没想到linux 还有这么强大的音频处理工具~~值得推荐。

3、AAC

对 AAC现在觉得只需要考虑对MPEG-4 AAC的支持,MPEG-2 AAC暂时不在考虑范围之内。在MID上必须支持AAC的全部3个profile : LC /HE /HEv2 。这里的编码器选择一般有两个:Nero AAC和Faac。Faac只支持LC,虽然介绍上说还支持main,LTP等编码模式,但在实际使用过程中发现好像并不支持。因此这次压制的文件都是使 用的Nero AAC,另外发现Nero AAC对于一些非工程规范的采用率好像不支持,因此在提供源数据 的时候尽量是标准工程采样的数据。

4、wma/real audio/ac-3/dts

对这些的支持,我都是根据wiki以及官方协议 的版本来写的式样书,现在还没有制作相关的测试文件

mp3 简介:

1、我们熟悉的MP3的全称是MPEG-1 Audio Layer III ,是一种有损音频编码格式,属于MPEG-1 Audio部分。

2、 实际上MPEG-1在Audio部分包含三个版本,分别是Audio Layer I/II/III ; Layer I已经基本过时不用了,现在使用得比较多的是Layer II 和 Layer III, Layer II现在主要用在广播上面,我们熟悉的VCD实际上也是采用的这种音频编码方式,而Layer III现在则广泛应用 在各方面。

3、另外MPEG-2对MPEG-1 Audio进行了扩展,这就是我们现在熟知的MPEG-2 Layer I/II/III, MPEG-2广泛用在数字电视信号传输,卫星广播等各方面 ,我们熟知的DVD也是采用了MPEG-2的音视频编码方式。

4、还有一种MPEG-2.5,这只是一种私有格式,用得很少,提供了很高的压缩率。

相关参数:

MPEG-1 Layer I is defined in ISO/IEC 11172-3, which first version was published in 1993.

    * Sampling rates: 32, 44.1 and 48 kHz

    * Bitrates: 32, 64, 96, 128, 160, 192, 224, 256, 288, 320, 352, 384, 416 and 448 kbit/s

An extension has been provided in MPEG-2 Layer I and is defined in ISO/IEC 13818-3, which first version was published in 1995.

    * Additional sampling rates: 16, 22.05 and 24 kHz

    * Additional bitrates: 48, 56, 80, 112, 144 and 176 kbit/s

MPEG-1 Layer II is defined in ISO/IEC 11172-3

    * Sampling rates: 32, 44.1 and 48 kHz

    * Bitrates: 32, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320 and 384 kbit/s

An extension has been provided in MPEG-2 Layer II and is defined in ISO/IEC 13818-3

    * Additional sampling rates: 16, 22.05 and 24 kHz

    * Additional bitrates: 8, 16, 24, 40 and 144 kbit/s

MPEG-1   layer III sample frequencies (kHz):  32  48  44.1

bitrates (kbps): 32 40 48 56 64 80 96 112 128 160 192 224 256 320

MPEG-2   layer III sample frequencies (kHz):  16  24  22.05

bitrates (kbps):  8 16 24 32 40 48 56 64 80 96 112 128 144 160

MPEG-2.5 layer III sample frequencies (kHz):   8  12  11.025

bitrates (kbps):  8 16 24 32 40 48 56 64

常见名词:

VBR : Variable Bitrate  Bit率是可变的

CBR : Constant Bitrate  Bit率是固定的

ABR : Average  Bitrate  平均Bit率,这是MP3的3种编码的比特率模式

mono :单声道

Dual channel : 双声道,每个声道是比特率的一半,双声道不一定是立体声 。

Stereo : 立体声,包括两个和两个以上的声道,每个声道的码率根据它所承载的信息量而定

Joint Stereo : 立体声编码的一种实现方式

Surround Audio : 环绕立体声,一般包含六个以上的声道

Sample Rate : 声音编码时候的采样率,一般用Hz或者KHz为单位,即每秒里面采样的Sample数

Sample Size : 每个采样的深度,即每个采样的bit数

Data encoding : 编码以后的bit流顺序,经常用到的是floating-point

BitRate :这个是上面的这些参数的一个综合反应,即每秒的bit数

Moving Picture Experts Group (acronym:MPEG) was formed by the ISO to set standards for audio and video compression and transmission

AAC简介

1、AAC全称Advanced Audio Coding,是一种有损的音频编码格式,更高范围的采样率(8khz-96khz)以及多音轨(up to 48)以及高性能的编码效率,被誉为mp3的继任者。

2、AAC的基础 成形于MPEG-2 AAC,MPEG-4在MPEG-2的基础上加入一些新的特性(比如SBR),就形成了MPEG-4的音频标准,定义为 MPEG-4 part3,我们一般所说的AAC,都是指MPEG-4 AAC。

3、AAC有3个标准,分别是LC[Low Complexity],He[high efficiency](add SBR),HeV2(add SBR and PS)。LC是基础配置,SBR是频带复用技术 ,而PS是参数立体声,其中后面两个标注又称为 AAC Plus和AAC Plus V2。

4、AAC在编码模块上还使用到一些技术,比如SRS,LTP等等。

相关参数:

比特率:超过400kbps    (mp3: 32-320kbps)

采样率:8khz-96khz    (mp3: 16khz-48khz)

常用名词:

2 pass: 在编码中使用的一项技术,就是先对要编码的文件进行一次pass,观察码流的特性,保存下来,第二次pass根据第一次的码流特性进行编码,应该来说也间 接实现了VBR。

声道和音轨:音轨是一种录音技术,就是将不同的音乐录制在不同的音轨上,然后将多个音轨合成一个声道,或者一个立体声音轨。声道是衡量声卡的一个性能指 标,声卡解析出文件的各个声道然后送到各个音箱。可以把声道理解成播放时候的音轨,因为声道的原理 也是将各个声道的数据送到音箱,从而呈现出一种声音的立体感。

单轨和整轨:比如将一个CD压制成一个APE文件,则就是整轨,而单轨就是将CD按曲目压制成多个文件。

附:

1.1 MP3 Decode

Mp3 Decode 必须提供对Mpeg-1 layer I/II/III 以及Mpeg-2 layer I/II/III 标准的完整支持,对Mpeg-1 layer II/III 的优先级最高,然后是Mpeg-2 layer II/III ,最后是Mpeg1/2 layer I 。

对以上规格下的各种Sampling rates 和Bitrates 的文件都能提供完整的解码支持,并且能够提供对VBR/CBR/ABR 以及Mono/Stereo/Joint Stereo/Surround 的解码支持。

1.2 AAC Decode

AAC Decode 必须提供对Mpeg-4 Part 3 标准下LC/HE/HEv2 这3 个profile 的完整支持,对AAC LC 的优先级最高,然后是AAC HE/HEv2 。

对以上规格下的8khz-96khz 采样率以及400kbps 以上的比特率都能提供完整的解码支持,并且能够提供对VBR/CBR/ABR 以及Mono/Stereo/Joint Stereo/Surround 的解码支持。

1.3 AMR

现阶段对AMR-nb/wb 的codec 没有什么特别的要求,使用Google 自带的codec 即可,将来如果有特别的需要将会以补充要求的方式提供。

1.4 WMA Decode

Wma Decode 必须提供对Microsoft WMA 和WMA professional 的完整支持,其中WMA1/2 的优先级最高,其次是WMA pro 。

1.5 Real Audio Decode

Real Audio Decode 必须提供对Real Audio 1-10 的完整支持,支持RDT 协议以实现流媒体的在线播放。

1.6 AC-3 Decode

        AC-3 Decode 必须提供对Dolby Digital EX 和Dolby Digital Surround EX 规格的完整支持。

(yili_xie)
本站文章除注明转载外,均为本站原创或编译欢迎任何形式的转载,但请务必注明出处,尊重他人劳动,同学习共成长。转载请注明:文章转载自:罗索实验室 [http://www.rosoo.net/a/201109/15025.html]
本文出处:blog.csdn.net/yili_xie/ 作者:yili_xie
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
栏目列表
将本文分享到微信
织梦二维码生成器
推荐内容