音频编码格式介绍

系列文章目录

音频格式的介绍文章系列:
音频编解码格式介绍:音频编码格式介绍
https://blog.csdn.net/littlezls/article/details/135862140
音频编解码格式介绍(1) ADPCM:adpcm编解码原理及其代码实现
https://blog.csdn.net/littlezls/article/details/83501580
音频编解码格式介绍(2) MP3 :音频格式之MP3:(1)MP3封装格式简介
https://blog.csdn.net/littlezls/article/details/135705670
音频编解码格式介绍(2) MP3 :音频格式之MP3:(2)MP3编解码原理详解
https://blog.csdn.net/littlezls/article/details/135458169
音频编解码格式介绍(3) AAC :音频格式之AAC:(1)AAC简介
https://blog.csdn.net/littlezls/article/details/135692305
音频编解码格式介绍(3) AAC :音频格式之AAC:(2)AAC封装格式ADIF,ADTS,LATM,extradata及AAC ES存储格式
https://blog.csdn.net/littlezls/article/details/135705383
音频编解码格式介绍(3) AAC :音频格式之AAC:(3)AAC编解码原理详解
https://blog.csdn.net/littlezls/article/details/135777833


文章目录

  • 系列文章目录
  • 前言
  • 1、PCM
  • 2、APE
  • 3、FLAC
  • 4、 ALAC(Apple Lossless Audio Codec)
  • 5、ADPCM
    • 5.1、G726
  • 6、 G711A/MU
  • 7、MP3
  • 8、MFC
  • 9、AAC
  • 10、OGGVorbis
  • 11、OPUS
  • 12、SPEEX
  • 13、AMR( Adaptive Multi-Rate)自适应多速率音频压缩
  • 14、WMA
  • 15、RealAudio系列
  • 16、AC3
  • 17、DTS(Digital Theater Systems)
  • 18、DRA
  • 19、MIDI
  • 补充、CUE
  • 音频编码比较


前言

本文简单介绍一下目前常用的音频编码格式,编码格式包括无损压缩和有损压缩。
无损压缩包括PCM,APE,FLAC,ALAC.而蓝光中的杜比AC3的TrueHD,和DTS中的DTS-HD也属于无损压缩。
其余格式为有损压缩。
本文尽量介绍全部音频编码格式,可以留言漏了那种格式,再进行补充。
后续将详细介绍最常用的音频编码格式ADPCM,MP3,AAC。如果读者有要求讲解其他格式,麻烦留言一下,可以进行其他格式的详细介绍包括算法。

本文网址:https://blog.csdn.net/littlezls/article/details/135862140


1、PCM

最原始的音频数据存储方式。
特点:
音质还原最好,声音基本无损;
软件支持最好,便于音频编辑;
文件体积最大,不利网络传输;

文件封装格式:
1、cda格式(即CD光盘音轨)文件不能复制到硬盘。可以使用抓音轨软件把CD格式的文件转换成WAV。
2、wav格式:大量用于多媒体开发、保存音乐和音效素材、音频编辑、非线性编辑等领域。
3、AIFF与AU格式是苹果和unix上的文件封装格式

2、APE

APE由软件Monkey’s audio压制得到,开发者为Matthew T. Ashland,APE属于个人作品,源代码开放,因其界面上有只“猴子”标志而出名。相较同类文件格式FLAC,ape有查错能力但不提供纠错功能,以保证文件的无损和纯正;其另一个特色是压缩率约为55%,比FLAC高,体积大概为原CD的一半,便于存储。
APE包含fast,normal,high,extra_high,insane五种编码格式,复杂度从容易到难,一般便携式设备只支持前4种格式的解码,网上绝大多数ape文件为normal格式。

特点:
音质与CD一样,无损音频压缩,2:1;
可无损还原为WAV,可直接刻成CD。
APE编码开源有限/转码速度比FLAC慢。
文件封装格式:
.ape。最高品质的音乐欣赏及收藏。网络资源较多。

3、FLAC

无损音频压缩编码(Free Lossless Audio Codec,简称FLAC)是一套自由音频压缩编码,其特点是无损压缩。FLAC项目由Josh Coalson于2000年启动,2003年1月29日, "Xiph. Org"基金会和FLAC项目宣布FLAC成为"Xiph. Org"旗下的独立公司 banner. 除此之外,"Xiph. Org"还对许多免费压缩格式提供支持,如Vorbis、Theora、Speex等等。
特点:
音质与CD一样,无损音频压缩,2:1;
可无损还原为WAV,可直接刻成CD。
FLAC编码完全开源/转码速度比APE快。
数据流的损坏,损失会被限制在受损伤的数据帧之内。

文件封装格式:
.flac:最高品质的音乐欣赏及收藏。跨平台支持。

4、 ALAC(Apple Lossless Audio Codec)

ALAC 即Apple lossless audio codec的缩写,是苹果公司开发的一种无损音频格式。ALAC与MP3的主要分别在于编码过程中,MP3会取消小部分高频及低频部分的音频数据,而ALAC则会如实记录,不会删除音频中任何细节数据。由于资料无损,ALAC音频文件大小会比MP3大,通常每片音乐CD(约70至80分钟)经ALAC编码后,音频文件大小约300MB。
2011年11月2日,苹果宣布无损音频压缩格式ALAC开源。


5、ADPCM

ADPCM, Adaptive Differential Pulse Code Modulation, 自适应差分脉冲编码调制.压缩比4:1。
ADPCM算法是一个统称, 有 YAMAHA, Microsoft, IMA 等标准, 开发中最常见的 IMA ADPCM 。

5.1、G726

G.726,是ITU-T定义的音频编码算法,1990年 CCITT(ITU前身)在G.721和G.723标准的基础上提出,可将64kbps的PCM信号转换为40kbps、32kbps、24kbps、16kbps的ADPCM信号。

文件封装格式:
.wav:广泛地应用于电话通信网。

6、 G711A/MU

G.711是一种由国际电信联盟(ITU-T)制定的音频编码方式,又称为ITU-T G.711。压缩比2:1。
G.711 标准下主要有两种压缩算法。一种是µ-law algorithm (又称often u-law, ulaw, mu-law),主要运用于北美和日本;另一种是A-law algorithm,主要运用于欧洲和世界其他地区。其中,后者是特别设计用来方便计算机处理的。
文件封装格式:
.wav:广泛地应用于电话通信网。

7、MP3

MP3是一种音频压缩技术,其全称是动态影像专家压缩标准音频层面3(Moving Picture Experts Group Audio Layer III),简称为MP3。它被设计用来大幅度地降低音频数据量。利用 MPEG Audio Layer 3 的技术,将音乐以1:10 甚至 1:12 的压缩率,压缩成容量较小的文件,而对于大多数用户来说重放的音质与最初的不压缩音频相比没有明显的下降。它是在1991年由位于德国埃尔朗根的研究组织Fraunhofer-Gesellschaft的一组工程师发明和标准化的。
mp3标准参见ISO/IEC 11172-3,ISO/IEC 13818-3
mp3包含mp1,mp2,mp3三种格式。
Fraunhofer的专利在2010年4月已经到期,MP3算法不受专利保护。
特点:
音质还原较好,压缩比比较高:10:1~12:1;
软硬件支持好,应用领域广泛:随声听、MP3;
文件体积较小,有利网络传输:网络主流音频格式;
多次编辑后,音质会急剧下降。
文件封装格式:
.mp3:mp3并不适合作为素材格式保存。

8、MFC

Musepack(早前称作MPEGplus、MPEG+或MP+)是一种基于MP2算法的有损压缩音频格式。它的编码方式着重听觉上的穿透感,在160kbit/s或以上的表现尤为出色。
MPC(MusePaCk)是由德国人Andree Buschmann开发的一种完全免费的高品质音频格式。在其问世之前,Lame MP3是公认音质最好的有损压缩方案,追求音质的人对它趋之若鹜。但现在这个桂冠无疑该让给MPC了,在中高码率下,MPC可以做到比MP3更好音质。在高码率下,MPC的高频要比MP3细腻不少,可以在节省大量空间的前提下获得最佳音质的音乐欣赏,是目前最适合用于音乐欣赏的有损编码。
文件封装格式:
.mfc

9、AAC

AAC(Advanced Audio Coding),中文名:高级音频编码。出现于1997年,基于MPEG-2的音频编码技术。由Fraunhofer IIS、杜比实验室、AT&T、索尼等公司共同开发,目的是取代MP3格式。压缩比可以达到20:1
2000年,MPEG-4标准出现后,AAC重新集成了其特性,加入了SBR技术和PS技术,为了区别于传统的MPEG-2 AAC又称为MPEG-4 AAC。
特点:
相对于mp3,音质更佳,文件更小;
支持多种声道组合,提供优质的音质;
文件封装格式:
.aac:使用MPEG-2 AAC编码的容器,传统的AAC编码
.mp4:使用MPEG-4 AAC编码的容器;
.m4a:其本质与音频MP4相同,苹果公司为区别视频mp4故改名为m4a,这个扩展名变得流行了。

10、OGGVorbis

特点:
音质还原比MP3好,压缩比比MP3高;
完全免费开发编码,没有专利限制;
HTML5支持的格式,应用潜力很大;
文件封装格式:
.ogg:用更小的存储空间获得更好的音质(相对MP3)。

11、OPUS

Opus是一个有损声音编码的格式,由Xiph.Org基金会开发,之后由IETF(互联网工程任务组)进行标准化,目标是希望用单一格式包含声音和语音,取代Speex和Vorbis,且适用于网络上低延迟的即时声音传输,标准格式定义于RFC 6716文件。Opus格式是一个开放格式,使用上没有任何专利或限制。
Opus集成了两种声音编码的技术:以语音编码为导向的SILK和低延迟的CELT。Opus可以无缝调节高低比特率。在编码器内部它在较低比特率时使用线性预测编码在高比特率时候使用变换编码(在高低比特率交界处也使用两者结合的编码方式)。Opus具有非常低的算法延迟(默认为22.5 ms),非常适合用于低延迟语音通话的编码,像是网上上的即时声音流、即时同步声音旁白等等,此外Opus也可以透过降低编码码率,达成更低的算法延迟,最低可以到5 ms。在多个听觉盲测中,Opus都比MP3、AAC、HE-AAC等常见格式,有更低的延迟和更好的声音压缩率。

文件封装格式:
.ogg:

12、SPEEX

Speex是一套主要针对语音的开源免费,无专利保护的音频压缩格式。
Speex是基于CELP并且专门为码率在2-44kbps的语音压缩而设计的。
文件封装格式:
.ogg:

13、AMR( Adaptive Multi-Rate)自适应多速率音频压缩

音频编码格式,是一个使语音编码最优化的专利。AMR被标准语音编码3GP在1998年10月选用,现在广泛在GSM和UMTS中使用。它使用1-8个不同的位速编码。之前的手机里有很多amr的音频文件,可分成:
AMR-NB,AMR-WB和AMR-WB+三种不同的协议。AMR-NB应用于窄带,而AMR-WB和AMR-WB+则应用于宽带通信中。
AMR声码器采用ACELP (Algebraic Code Excited Linear Prediction)编码方式,提供了8种编码速率(4.75~12.20kbit/s) ,每种速率都有不同的容错率。
1.AMR-NB
2.AMR-WB, Adaptive Multi-Rate -Wideband Speech Codec
3.AMR-WB+, Extended Adaptive Multi-Rate -Wideband Speech Codec

14、WMA

特点:
低码音质比MP3好,压缩比比MP3高:18:1;
编码标准不开发,专利由微软掌握;
支持音频流技术,能实现在线广播。
文件封装格式:
.wma:支持防复制功能,可以限制播放时间与次数。

15、RealAudio系列

cook,cook multichannel、atarac3、sipr
网络中非常常见,在rmvb、rm封装格式中,或者是 .ra .ram音频文件,由RealNetworks发展的一种多媒体音频文件格式,目前已有很多版本:

1、lpc, 14-4: IS-54 VSELP(RealAudio 1)

2、28-8: G728 LD-CELP (RealAudio 2)

3、dnet: Dolby AC3(RealAudio 3)

4、sipr: Sipro Lab Telecom ACELP-NET(RealAudio 4/5)

5、cook: G2/Cook Codec(RealAudio 6)

6、atrc: Sony ATRAC3(RealAudio 8)
ATRAC (Adaptive Transform Acoustic Coding)是Sony公司开发的一种相对老的音频编码格式,又细分成 ATRACI、 ATRAC2、ATRAC3、 ATRAC3plus,这些都是独立的技术,后来Sony把这些技术统称为ATRAC。在rmvb的封装格式中也能看到这种音频编码格式。
7、raac: MPEG-4 LC-AAC (RealAudio 9)

8、racp: MPEG-4 HE-AAC (RealAudio 10)

9、ralf: RealAudio Lossless Format( RealAudio 10)

特点:
音质比WMA稍差,压缩比与WMA差不多:18:1;
编码标准不开发,专利由Real Networks掌握;
支持音频流技术,能实现在线广播。
随着网络带宽的不同而改变声音的质量。
文件封装格式:
.144:144后缀
.288:288后缀
.ra,ram,rm,rmvb:支持防复制功能,可以限制播放时间与次数。

16、AC3

(Dolby Digital AC-3)是杜比公司开发的新一代家庭影院多声道数字音频系统。1994年,日本先锋公司宣布与美国杜比实验室合作研制成功一种崭新的环绕声制式,并命名为“杜比AC-3”(Dolby Surround Audio Coding-3)。1997年初,杜比实验室正式将“杜比AC-3环绕声”改为“杜比数码环绕声”(Dolby Surround Digital),我们常称为Dolby Digital。

AC3编码格式分为AC3,EAC3,TrueHD三种格式。
特点:
音质还原好,DVD使用;
环绕立体音效;
支持多声道。
文件封装格式:
.ac3:蓝光DVD。

17、DTS(Digital Theater Systems)

DTS(数码影院系统)是由DTS公司开发,一种多通道的音频技术,低损,环绕立体声,被广泛的应用在DVD等高清片源上。同样也需要授权,与杜比公司是竞争对手。最常见的是DTS5.1:保存5条音频通道的数据用于环绕立体声分别是 center, left-front, right-front, left-rear, and right-rear除此之外DTS公司还开发了DTS70mm、DTS70ES、 DTS NEO:6、DTS9624、 DTS-HD MasterAudio、 DTS-HD High Resolution Audio、 DTS Connect、 DTS Surround Sensation等技术。由于版权比较严格,而且文档很难从网上找到。

DTS编码格式分为DTS,DTS-HD两种格式

文件封装格式:
.dts:蓝光DVD。

18、DRA

特点:
DRA 是Digital Rise Audio的缩写。是广州广晟数码技术有限公司(Digital Rise Technology)开发的一项数字音频编码技术。DRA音频标准的全称为《多声道数字音频编解码技术规范》,2007年1月被批准成为中国电子行业标准(标准号SJ/T11368-2006),2009年2月又进一步被批准成为我国音频国家标准(标准号GB/T22726-2008)。DRA音频标准是我国具有完全自主知识产权的新一代数字音频编解码技术标准,目前已在国内外共申请了36件发明专利。
DRA音频标准可应用于数字电视、数字音频广播、数字电影院、激光视盘机、网络流媒体、CMMB、IPTV及移动多媒体等领域。
文件封装格式:
.dra:主要用于CMMB,DTMB等。

19、MIDI

MIDI(Musical Instrument Digital Interface)乐器数字接口 ,是20 世纪80 年代初为解决电声乐器之间的通信问题而提出的。MIDI是编曲界最广泛的音乐标准格式,可称为“计算机能理解的乐谱”。它用音符的数字控制信号来记录音乐。一首完整的MIDI音乐只有几十KB大,而能包含数十条音乐轨道。几乎所有的现代音乐都是用MIDI加上音色库来制作合成的。MIDI 传输的不是声音信号, 而是音符、控制参数等指令, 它指示MIDI 设备要做什么,怎么做, 如演奏哪个音符、多大音量等。它们被统一表示成MIDI 消息(MIDI Message) 。传输时采用异步串行通信, 标准通信波特率为31.25×( 1±0.01) KBaud。
MIDI文件包含一个或更多MIDI块与每个事件的时间信息。它支持歌曲、序列和音轨结构,拍子和拍号信息。 音轨名字和其他描述信息也可以与MIDI信息一同存储。 这个格式支持多条音轨、多个序列。这种格式可以允许用户从一个音轨移向另一个音轨。
特点:
允许数字合成器和其他设备交换数据
文件非常小是记录声音的指令信息
文件重放的效果完全依赖声卡的档次
文件封装格式:
.mid:主要用于原始乐器作品,流行歌曲的业余表演,游戏音轨以及电子贺卡等。

补充、CUE

CUE文件主要作用是播放音乐时选曲,整个APE文件分割成单曲。其实CUE文件是光盘镜像的一种标记文件,CUE文件里保存了光盘刻录的重要信息,用于保证光盘刻录的准确性。
CUE文件是一种索引文件,可以用音频播放软件打开,当然需要存在被索引的音频文件,而且在同一个目录下。用记事本可以打开CUE文件,并可以根据需要进行编辑修改。
CUE文件包含的信息包括但不限于专辑标题、艺术家姓名、歌曲标题、歌曲时长以及其他元数据。
CUE文件由两个主要部分构成:Header(可选)和Tracks-Info(数据轨描述表)。Header包含了专辑标题、艺术家姓名等信息,而Tracks-Info则详细描述每个音轨的细节。一般是wav,ape,flac无损压缩文件的索引文件。

例子是George Michael的Songs From The Last Century专辑。

CATALOG 7243848740251
PERformER "George Michael"
TITLE "Songs from the Last Century"
FILE "01 - Brother Can You Spare A Dime.wav" WAVE
TRACK 01 AUDIO
TITLE "Brother Can You Spare A Dime"
PERformER "George Michael"
INDEX 01 00:00:00
FILE "02 - Roxanne.wav" WAVE
TRACK 02 AUDIO
TITLE "Roxanne"
PERformER "George Michael"
INDEX 00 00:00:00
INDEX 01 00:01:60
…………….

音频编码比较

1、压缩比比较“
aac>ogg>mp3(wma,ra)>ape=flac=pcm
2、音质比较:
pcm=flac=ape>aac>ogg>mp3>wma>ra
3、硬件支持比较
mp3>wma>aac wav>flac ogg>ape
4、综合性能(综合音质体积编码率):
aac>ogg>flac ape》mp3>wav,wma,ra
音频编码格式介绍_第1张图片

你可能感兴趣的:(audio,开发类,多媒体,音视频,嵌入式硬件)