音视频开发-全网最全常用音视频编码和格式汇总

音视频开发-全网最全常用音视频编码和格式汇总

2023年6月27日发(作者:)

⾳视频开发-全⽹最全常⽤⾳视频编码和格式汇总现在⽹上很多技术想学点东西太难了,要收钱才能看!技术是⽆界限的!恼⽕了我⾃⼰整理,全⽹最全、最厚道的技术开发者:编码格式汇总:⾳频编码:AAC、AC-3、Revision A、ALAC、AMR、ATRAC 、APE、DTS、FLAC、MP3、Ogg、PCM、RealAudio、WMAMPEG Audio Layer 1/2MPEG Audio Layer 3(MP3)MPEG2 AACMPEG4 AACWindows Media audeo v1/v2/v3/7/8/9MRealAudio cook/sipro(real media series)Real Audio AAC/AACPlus(real media series)QDesign Music 2(apple series)(是 QDesign公司开发的⽤于⾼保真⾼压缩率的编码⽅式,类似于MP3,不过⽐MP3要先进。⽀持流式播放)Apple MPEG-4 AAC(apple series)ogg( ogg vorbis⾳频)AC3(DVD专⽤⾳频编码)DTS(DVD专⽤⾳频编码)APE( monkey's⾳频)AU(sun格式)FLAC( fress lossless⾳频)M4A(mpeg-4⾳频)(苹果改⽤的名字,可以改成mp4)MP2( mpeg audio layer2⾳频)AWMA⾳频容器格式:很多,列举常⽤和主流的:wav、aiff、mp3、m4a、amr、wma、⽆压缩⽆损:WAV⽂件以最⾼质量捕获并重新创建原始⾳频波形,⽽不会以任何⽅式影响或改变声⾳的声⾳特征。WAV使⽤PCM(脉冲编码调制)对数据进⾏编码,⽅法是将数据切成⼩块以提供最⾼质量。这是⼀种⽆损⽂件格式,意味着没有任何数据丢失。因此,捕获和记录的是原始⾳频波形的最接近的数学/数字表⽰形式,在此过程中不会发⽣明显的⾳频质量损失。WAV⽂件也未压缩,这意味着数据以完全原始格式原样存储,不需要解码。这提供了巨⼤的多功能性,可以进⾏出⾊的编辑和操作。.aif⽆压缩⽆损:AIFF(⾳频交换⽂件格式)是在WAV之后不久创建的,其⼯作原理相同:它提供录⾳棚级的⾳频记录和播放。AIFF提供与WAV⽂件⼀样的采样率和位深选项,AIFF使⽤PCM将⾳频波形注册为准确的采样(切⽚),以提供尽可能⾼的⾳频录制质量和声⾳复制。就像WAV⼀样,AIFF也以未压缩的⽆损格式存储数据,这意味着您不会损失任何质量,⽽只会获得纯净的⾳质。。.mp3有损压缩:未压缩的⾳频格式(例如WAV和AIFF)可提供出⾊的⾳质,但要付出⾼⽂件⼤⼩的代价。随着90年代中期互联⽹⽂件共享的兴起,⼈们很快意识到通过拨号连接发送未压缩的⽂件是不切实际的,⽽且常常是不可能的。这就是MP3(MPEG-2⾳频第III层)诞⽣的原因。⼀⾸三分钟的歌曲以WAV或AIFF格式平均需要30MB,⽽转换为MP3的那⾸歌曲则占⽤了⼗分之⼀的空间-仅约3MB。借助能够实现令⼈惊讶的⼩⽂件⼤⼩的压缩算法,MP3成为互联⽹时代的主要内容,并⼀直保持着强⼤的地位。.m4a有损压缩:M4A(MPEG-4第14部分)⽂件是Apple对MP3的回应。这种以Mac为中⼼的压缩⾳频格式通常被视为MP3的继任者,随着iTunesStore的诞⽣,它找到了真正的位置,在iTunes Store中,它成为通过在线⾳乐商店购买的所有⾳乐的主要格式。对于Mac和iOS App Store以及Nintendo和PlayStation产品中发布的应⽤程序中包含的所有⾳频,它仍然是⾸选格式。随着越来越多的开发⼈员(包括对M4A的⽀持),它已迅速成为压缩⾳频⽂件的⾸选⾳频格式。M4A⽂件使⽤有损⾼级⾳频编码(AAC)编解码器进⾏编码,该编解码器能够提供与MP3相同的⽐特率,但压缩效果更严格。这样可以减⼩⽂件⼤⼩,同时提供更⾼的⾳频质量。就像⾦⾊的独⾓兽⼀样,这就是为什么它成为轻量级⾳频交付的如此流⾏的格式的原因。主流视频编码:H.264、H.265、MPEG4、FLVMPEGI(VCD)MPEG2(DVD)MPEG4(divx, xvid)MPEG4 AVC/h.264H.261H.262H.263H.263+H.263++MPEG4 v1/v2/v3(微软 windows media系列)Windows Media Video 7/8/9/10Sorenson Video3(⽤于QT5,成标准了)( apple series)Real Video G2(real media series)RealVideo 8/9/10(real media series)Apple MPEG-4(apple series)Apple H.264(apple series)flash video视频容器格式:淘汰的就不说了、当前主流的有:mp4、wmv、avi、rvmb、wkv、flv、webm、mov、m4vm4v和mp4两种格式的区别M4V 是⼀个标准视频⽂件格式,由苹果公司创造。此种格式为 iPod 、 iPhone 和 PlayStation Portable 所使⽤,同时此格式基于 MPEG-4 编码第⼆版。其视频编码采⽤H264或H264/AVC,⾳频编码采⽤AAC。采⽤H264⾼清编码,相⽐于传统On2 VP6、H263、Divx等,能够以更⼩的体积实现更⾼的清晰度。 M4V格式也称作苹果的视频Podcast 格式。是MP4的特殊类型,M4V是MP4格式⾼清的代表应⽤MP4是⼀套⽤于⾳频、视频信息的压缩编码标准,由国际标准化组织(ISO)和国际电⼯委员会(IEC)下属的“动态图像专家组”(Moving PictureExperts Group,即MPEG)制定,第⼀版在1998年10⽉通过,第⼆版在1999年12⽉通过。MPEG-4格式的主要⽤途在于⽹上流、光盘、语⾳发送(视频电话),以及电视⼴播

如果我们不是专业搞影视类的,不⽤考虑太多容器格式,从后端、移动端、前端开发⾓度来说,考虑多端兼容和通⽤,优先选择多端能够兼容的通⽤编码和容器格式,HTML5⽬前只⽀持:MP4、WebM、Ogg对于前端来说、还要考虑浏览器兼容性问题,请看,现在很多主流⾳视频相关企业⽤的都是mp4, m4v,m4a苹果公司iPhone、iPad等,⽬前⽤的是 m4a、m4v、mp4、mov、wav格式,安卓也⽀持⾳乐和⾳效等场景⼀般使⽤wav、mp3编码,⾳质好、⼤量软件⽀持, ⽬前m4a更优秀,MP3的替代者,;在视频应⽤场景中,⼀般⽤mpeg4 和 H.264标准来做编码,如果要⽀持4k等超⾼清之类的就⽤H.265编码。在视频中的⾳轨编码⼀般⽤AAC编码更适合;在语⾳聊天场景中⼀般是⽤ogg编码;所以我们当下选择的通⽤⽀持跨平台、应⽤更⼴泛的标准:⾳频使⽤m4a,ogg, 视频使⽤mp4 , m4v

⾳频编码格式详解:AAC(Advanced Audio Coding)⾼级⾳频编码是⼀种⾮常常见⾳频编码格式,出现于1997年,基于MPEG2的⾳频编码技术。由 Fraunhofer IIS、杜⽐实验室、AT&T、Sony(索尼)等公司共同开发,⽬的是取代MP3格式2000年,MPEG-4标准出现后,AAC重新集成了其特性,加⼊了SBR技术和PS技术,为了区别于传统的MPEG-2 AAC⼜称为MPEG-4 AAC。相关的规范标准分别是 ISO/IEC13818-7, ISO/IEC14496-3作为⼀种⾼压缩⽐的⾳频压缩算法,AAC压缩⽐通常为18:1,也有数据说为20:1,远胜mp3;

在⾳质⽅⾯,由于采⽤多声道,和使⽤低复杂性的描述⽅式,使其⽐⼏乎所有的传统编码⽅式在同规格的情况下更胜⼀筹。AAC可以⽀持多达48个⾳轨,15个低频(LFE)⾳轨,51多声道⽀持,更⾼的采样率(最⾼可达96kH,⾳频CD为441kH)和更⾼的采样精度(⽀持8it、16it、24bit、3bi,⾳频CD为16t)以及有多种语⾔的兼容能⼒,更⾼的解码效率,⼀般来说,AC可以在对⽐MP3⽂件缩⼩30%的前提下提供更好的⾳质AAC包含了如下9种规格:2 AAC LC低复杂度规格( Low Complexity)2 AAC Main主规格2 AAC SSR可变采样率规格( Scaleable Sample Rate)-4 AAC LC低复杂度规格( Low Complexity),现在的⼿机⽐较常见的MP4⽂件中的⾳频部份就包括了该规格⾳频⽂件4 AAC Main主规格4 AAC SSR可变采样率规格( Scaleable Sample Rate)4 AAC LTP长时期预测规格( Long Term Predicition)-4 AAC LD低延迟规格( Low Delay)4 AAC HE⾼效率规格( High Efficiency)

AC-3(Digital Audio Compression Standard)、Revision A(ATSC Doc. A/52A)⾳频编码格式,传说中的杜⽐实验室的杰作,著名的有损数据压缩的多媒体储存格式。可以包括多达6个独⽴的声道。最知名的是5.1声道技术。在5.1声道技术中,5代表着5个基本声道,独⽴连接⾄五个不同的喇叭(20⾄2000Hz),分别是右前(RF),中(C),左前(LF),右后(RR),左后(LR);⽽1则代表1个低频声效,连接⾄低⾳辅助喇叭(20⾄120Hz)每个AC-3的⾳频帧都是以0x0B77为同步头。开源库解码库liba52。

ALAC(Apple Lossless Audio Codec)苹果的⽆损⾳频压缩编码格式,ALAC与MP3的主要分别在于编码过程中,MP3会取消⼩部分⾼频及低频部分的⾳频数据,⽽ALAC则会如实记录,不会删除⾳频中任何细节数据。由于资料⽆损,ALAC⾳频⽂件⼤⼩会⽐MP3⼤,通常每⽚⾳乐CD(约70⾄80分钟)经ALAC编码后,⾳频⽂件⼤⼩约300MB。

AMR( Adaptive Multi-Rate)⾃适应多速率⾳频压缩⾳频编码格式,是⼀个使语⾳编码最优化的专利。AMR被标准语⾳编码3GP在1998年10⽉选⽤,现在⼴泛在GSM和UMTS中使⽤。它使⽤1-8个不同的位速编码。之前的⼿机⾥有很多amr的⾳频⽂件,可分成:-WB, Adaptive Multi-Rate -Wideband Speech -WB+, Extended Adaptive Multi-Rate -Wideband Speech Codec

ATRAC (Adaptive Transform Acoustic Coding)是Sony公司开发的⼀种相对⽼的⾳频编码格式,⼜细分成 ATRACI、 ATRAC2、ATRAC3、 ATRAC3plus,这些都是独⽴的技术,后来Sony把这些技术统称为ATRAC。在rmvb的封装格式中也能看到这种⾳频编码格式。

APEAPE是 Monkey's Audio提供的⼀种⽆损压缩格式APE可以⽆损失⾼⾳质地压缩和还原。APE的压缩率相当⾼,并且⾳质保持得很好获得了不少发烧⽤户的青睐

DTS(Digital Theater Systems)⼤名⿍⿍的DTS(数码影院系统)是由DTS公司开发,⼀种多通道的⾳频技术,低损,环绕⽴体声,被⼴泛的应⽤在DVD等⾼清⽚源上。同样也需要授权,与杜⽐公司是竞争对⼿。最常见的是DTS5.1:保存5条⾳频通道的数据⽤于环绕⽴体声分别是 center, left-front, right-front, left-rear, andright-rear除此之外DTS公司还开发了DTS70mm、DTS70ES、 DTS NEO:6、DTS9624、 DTS-HD MasterAudio、 DTS-HD High Resolution Audio、DTS Connect、 DTS Surround Sensation等技术。由于版权⽐较严格,⽽且⽂档很难从⽹上找到。

FLAC(Free Lossless Audio Codec)

MP3(MPEG-1 or MPEG-2 Audio Layer III)MPEG1 or MPEG2 Audio LayerⅢ经常被称作MP3,是⽬前最流⾏的⾳频编码格式,有损压缩,相关的规范标准在 ISO/EC11723, ISOAIEC13818-3。它是在1991年,由位于德国埃尔朗根的研究组织 Fraunhofer-Gesellschaft的⼀组⼯程师发明和标准化的,它设计⽤来⼤幅度地降低⾳频数据量,将⾳乐以1:10甚⾄1:12的压缩率,压缩成容量较⼩的⽂件。bit rates对MP3来说是可变的,原则是 bit rates越⾼声⾳⽂件中包含的原始声⾳信息越多,这样回放时声⾳品质也越⾼。 就 bit rates来说MP3可以分为2种MP3CBR: Constant Bit Rate在MP3编码的早期,整个⽂件使⽤⼀个固定的位元率MP3VBR: Variable Bit Rate可以让MP3⽂件的每⼀段甚⾄每⼀帧都可以有单独的 bitrate,这样做的好处就是在保证⾳质的前提下最⼤程度的限制了⽂件的⼤⼩。这个⽅法类似于声⾳控制的磁带录⾳机不记录静⽌部分节省磁带消耗。

Ogg

Ogg是⼀个⾃由且开放标准的容器格式,由 Xiph. org基⾦会所维护,“ogg意指种⽂件格式,可以纳⼊各式各样⾃由和开放源代码的编解码器,包含⾳效、视频、⽂字(像字幕)与元数据的处理。1 Ogg_vorbis:这就是咱们常见的ogg结尾的⾳频⽂件, Vorbis是⼀种有损⾳讯压缩格式,由 Xiph。 Org基⾦会所领导并开放源代码。 Vorbis通常以ogg作为容器格式,所以常合称为 Ogg Vorbis

PCM (Pulse Code Modulated Audio)⽬前计算机应⽤中,最⾼保真⽔平的⾳频编码格式。PCM约定俗成了⽆损编码能做到最⼤程度的⽆限接近绝对保真。被⼴泛⽤于素材保存及⾳乐欣赏,CD、DVD以及我们常见的WAV⽂件中均有应⽤,优点是⾳质好,缺点是体积⼤。做嵌⼊式⾳视频产品时,⼀般情况的⾳视频都是芯⽚负责解码。如果遇到版权问题,例如AC3DTS,有些时候芯⽚⼚商要求很严格,⽤户会采取软解的⽅法,软解也就是把AC3 DTS等⾳频解成PCM,然后在送给芯⽚。

RealAudio⽹络中⾮常常见,在rmvb、rm封装格式中,或者是 .ra .ram⾳频⽂件,由RealNetworks发展的⼀种多媒体⾳频⽂件格式,⽬前已有很多版本:1、lpc, 14-4: IS-54 VSELP(RealAudio 1)2、28-8: G728 LD-CELP (RealAudio 2)3、dnet: Dolby AC3(RealAudio 3)4、sipr: Sipro Lab Telecom ACELP-NET(RealAudio 4/5)5、cook: G2/Cook Codec(RealAudio 6)6、atrc: Sony ATRAC3(RealAudio 8)7、raac: MPEG-4 LC-AAC (RealAudio 9)8、racp: MPEG-4 HE-AAC (RealAudio 10)9、ralf: RealAudio Lossless Format( RealAudio 10)

WMA (Windows Media Audio)是微软公司开发的⼀种数字⾳频压缩格式,WMA7之后的WMA⽀持证书加密,未经许可(即未获得许可证书),即使是⾮法拷贝到本地,也是⽆法收听的。⽬前⽐较流⾏的是WMA9:WMA9, Windows Media 9 Audio CodecWMA9 PRO, Windows Media 9 Professional Audio CodecWMA9_ LL, Windows Media 9 Lossless Audio Codec

发布者:admin,转转请注明出处:http://www.yc00.com/xiaochengxu/1687821521a48099.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信