Formáty zvuku: typy, účel, rozdíly

9. 4. 2019

Audio formáty jsou typy souborů, které ukládají digitální audio data do počítačového systému. Bitmapová zvuková data (s výjimkou metadat) se nazývají formát kódování zvuku a mohou být nekomprimované nebo komprimované. Komprese se používá ke snížení velikosti souboru, což je často spojeno se ztrátou kvality zvuku. Zvuk může být ve formátu kódování zvuku také surový bitový tok, ale obvykle je vložen ve formátu dat s daty s konkrétní vrstvou pro ukládání dat.

zvukových formátů

Co jsou to?

Zvukový soubor je sada informací, která se skládá z dat o frekvenci a amplitudě zvuku uložených pro pozdější přehrávání.

Audio formáty mohou hrát roli kontejneru pro nespracovaná data, stejně jako použití kodeků. Často jsou tyto pojmy zmatené a zmatené.

Kodek zakóduje a dekóduje surové audio data, zatímco kódovaná data jsou obvykle uložena v souboru kontejneru. Přestože většina formátů zvukových souborů podporuje pouze jeden typ kódování dat zvuku (vytvořený pomocí zvukového enkodéru), multimediální formát kontejneru (například Matroska nebo AVI) může podporovat několik typů zvukových a obrazových dat.

Odrůdy v objemu a kvalitě

Formáty zvukových souborů lze rozdělit do následujících skupin:

1. Nekomprimované - například WAV, AIFF, AU nebo raw PCM bez záhlaví.

2. Formáty bez komprese bez ztráty - například FLAC, AudioMonkey (přípona souboru .ape), WavPack (rozšíření souboru .wv), TTA, ATRAC AdvancedLossless, ALAC (přípona souboru .m4a), MPEG-4 SLS, 4 ALS, MPEG-4 DST, WindowsMediaAudioLossless (WMA bezztrátové) a Shorten (SHN).

3. Formáty se ztrátou komprese - například Opus, MP3, Vorbis, Musepack, AAC, ATRAC a Windows Media Audio Lossy (komprimované WMA).

formátů zvukových souborů

Základní typ

Jedním z hlavních nekomprimovaných zvukových formátů je LPCM. Ve své podstatě je to typ PCM a je podobný technologii Digital Audio (formát audio CD). Jedná se o typ, který nejčastěji používají nízkoúrovňové API a digitální převodníky analogové. Ačkoli LPCM může být uložen v počítači jako surový formát zvuku, je obvykle umístěn v souboru Windows WAV nebo v aplikaci .aiff v systému MacOS.

WAV a AIFF

Digitální audio formát AIFF je založen na formátu výměny souborů (IFF) a WAV je založen na podobném typu souboru výměny zdrojů (RIFF). WAV a AIFF jsou navrženy tak, aby ukládaly širokou škálu zvukových formátů, a to jak bezztrátových, tak ztrátových. Jednoduše přidávají malou hlavičku obsahující metadata před zvukovou komponentou, která označuje zvukový formát (například LPCM se specifickou vzorkovací frekvencí, hloubkou bitů, pořadovými čísly a počtem kanálů). Vzhledem k tomu, že WAV a AIFF jsou široce podporovány a mohou ukládat LPCM, jsou vhodné formáty souborů pro ukládání a archivaci původního záznamu.

ogg

Nová generace

BWF (Broadcast Wave Format) je standardní zvukový formát vytvořený Evropskou unií vysílání jako nástupce WAV. Má mnoho vylepšení, včetně možnosti ukládat spolehlivější metadata do souboru. Jedná se o hlavní formát záznamu používaný v mnoha profesionálních pracovních stanicích v televizním a filmovém průmyslu. Soubory BWF obsahují standardizovanou časovou značku, která usnadňuje synchronizaci zvuku s jedním obrazovým prvkem. Autonomní multipřehrávač AETA, Sound Devices, Zaxcom, HHB Communications Ltd, Fostex, Nagra, Aaton a TASCAM vždy používají jako preferovaný formát BWF.

Audio s kompresí a bez ní

Tento typ dat ukládá data v menším svazku bez ztráty informací. Původní data lze z této verze obnovit.

Nekomprimované zvukové formáty zakódují zvuk a ticho se stejným počtem bitů za jednotku času. Kódování minut absolutního ticha vytváří soubor stejné velikosti jako minuty hudby. V komprimovaném formátu však bude hudba obsazovat menší soubor než původní nahrávka a ticho nebude trvat téměř žádný prostor.

mp3 formát

Formáty zvukových souborů tohoto typu zahrnují FLAC, WavPack, AudioMonkey, ALAC (Apple Lossless). Poskytují kompresní poměr asi 2: 1 (to znamená, že soubory zaberou polovinu prostoru PCM). Vývoj v kompresních formátech bez ztráty má za cíl zkrátit dobu zpracování při zachování dobré kvality zvuku.

Ztrátový komprimovaný zvukový formát

To vám umožní dále zmenšit velikost souboru, odstranit část zvukových informací a zjednodušit data. To ovšem vede k tomu, že kvalita zvukových formátů se zhoršuje. Používá různé metody (často pomocí psychoakustiky) k odstranění částí zvuku, které nejméně ovlivňují vnímanou kvalitu a minimalizují množství slyšitelného šumu přidaného během procesu komprese. Nejpopulárnějším příkladem je populární formát MP3. AAC, který lze nalézt iTunesMusicStore, je také široce distribuován. Většina formátů nabízí jiný rozsah. kompresní poměr obvykle měřeno v bitové rychlosti. Čím nižší je rychlost, tím menší je soubor a tím větší ztráta kvality.

formát digitálního zvuku

Jaké formáty jsou momentálně známy?

.3GP je multimediální formát kontejneru, který může obsahovat vlastní AMR, AMR-WB nebo AMR-WB + formáty, stejně jako některé otevřené verze.

.AC (Advanced Audio Coding) - založené na standardech MPEG-2 a MPEG-4. Soubory AAC jsou obvykle kontejnery ADTS nebo ADIF.

.AAX (Audible.com) je formát audioknih, který je soubor M4B s proměnlivou přenosovou rychlostí (poskytující vysokou kvalitu), šifrovanou pomocí DRM. MPB obsahuje kódovaný zvuk AAC nebo ALAC v kontejneru MPEG-4.

.AIFF je standardní formát zvukových souborů používaný společností Apple. Může být považován za ekvivalent WAV.

.AMR (AMR-NB) je typ zvuku používaný především pro záznam hlasu.

.APE (Ashland Monkey's) - audio formát s kompresí bez ztráty kvality.

.M4A je MPEG-4 audio používaný společností Apple pro nechráněnou hudbu staženou z iTunes Music Store. Zvuk v souboru M4A je obvykle kódován pomocí AAC, ačkoli ALAC může být také použit bez ztráty kvality.

.M4P je Apple verze AAC s proprietárními digitálními právy vyvinutými společností Apple pro použití v hudbě stažené z iTunes Music Store.

.MMF - zvukový pohled společnosti Samsung používaný v vyzváněcím tónu. Byl vyvinut společností Yamaha a je multimediálním datovým formátem.

.MP3 formátu MPEG Layer III Audio. Toto je nejběžnější typ používaného zvuku. Také známý jako MPEG-1 nebo MPEG-2, je to zvláštní formát kódování zvuku pro digitální zvuk. Používá formu komprese ztrátových dat pro informace o kódování nepřesné aproximace a vyřazení částečných dat. To vše se provádí za účelem snížení velikosti souborů, obvykle 10krát, ve srovnání s CD. Současně je kvalita zvuku srovnatelná s nekomprimovanou. Ve srovnání s kvalitou digitálního zvuku CD kvalita komprese MP3 obvykle dosahuje snížení velikosti o 75-95%. Soubory tohoto typu se tedy pohybují od 1/4 do 1/20 velikosti původního digitálního audio streamu. To je důležité pro zajištění přenosu a ukládání souborů, zejména v našich dnech, kdy je výměna informací velmi rozšířená. Základem pro toto srovnání je formát digitálního audio CD, který vyžaduje 1411200 bps. Bežně používané nastavení kódování MP3 je 128 kb / s CBR, což vede k souboru 1/11 (= 9%) velikosti původního souboru kvality CD, tj. 91% komprese.

Lossless MP3 komprese pracuje tím, že snižuje (nebo přibližuje) přesnost některých částí nepřetržitého zvuku, které jsou považovány za nepřístupné zvukovému rozlišení většiny lidí. Tato metoda se běžně označuje jako vnímání kódu nebo "psychoakustika". Používá psychoakustické modely k odmítnutí nebo snížení přesnosti komponent, které jsou méně slyšitelné lidskému sluchu, a poté zaznamenávají zbývající informace efektivně.

nejlepší zvukový formát

.MPC (dříve známý jako MPEGplus, MPEG + nebo MP +) je zvukový kodek s otevřeným zdrojovým kódem, který je optimalizován pro transparentní stereo / audio kompresi s přenosovou rychlostí 160-180 Kbps.

Formát .OGG, .OGA, MOGG je volně otevřený typ kontejneru, který podporuje mnoho dalších typů, z nichž nejoblíbenější je Vorbis audio formát. Nabízí kompresi podobnou MP3, ale méně populární. VJGG (Multi-Track-Single-Logical-StreamOgg-Vorbis) je vícekanálový nebo vícestopý formát souborů OGG.

.WAV je standardní formát zvukových souborů používaný hlavně na počítačích se systémem Windows. Obvykle se používá k ukládání nekomprimovaných (PCM) zvukových souborů s kvalitou CD, což znamená, že mohou být velké velikosti - přibližně 10 MB za minutu. Tyto soubory mohou také obsahovat data kódovaná různými kodeky ke zmenšení velikosti (například přenos do formátu GSM nebo MP3). Soubory WAV používají strukturu RIFF. Tento formát zachovává kvalitu souborů nejlépe.

.WMA je formát Microsoft Windows Media Audio. Navrženo s možnostmi správy digitálních práv (DRM) pro ochranu proti kopírování. To bylo dříve distribuováno tak široce jako formát OGG nebo MP3.

.WV je formát vytvořený pro video HTML5.

Pro audioknihy

.AOT Audible.com je kontejner s audiobookem s nízkou přenosovou rychlostí s DRM obsahujícím audio kódovaný jako MP3 nebo ACELP.

.M4B je rozšíření audiobook / podcast s kódováním AAC nebo ALAC v kontejneru MPEG-4. Oba formáty mohou obsahovat metadata, včetně značek kapitol, obrázků a hypertextových odkazů. Kromě toho M4B povoluje záložky (pamatuje si poslední pozici poslechu), zatímco M4A to neumožňuje.

Navrženo pro konkrétní účel.

.AKT je komprimovaný zvukový formát formátu ADPCM až do 8 kbps. Nahrává z většiny čínských MP3 a MP4 přehrávačů a diktafonů.

.AU je standardní formát zvukových souborů, který používá Sun, Unix a Java. Zvuk v souborech AU může být ve formě PCM nebo komprimován pomocí μ-law, a-law nebo G729 kodeků.

.AWB (AMR-WB) - zvuk používaný hlavně pro řeč, podobný specifikaci ITU-T G.722.2.

.DCT - používá se software NCH. Jedná se o formát proměnné kodeků určený pro diktování. Má informace o hlavičkách diktátu a může být zašifrována (podle lékařských zákonů o ochraně osobních údajů). Lze také říci, že jde o proprietární formát softwaru NCH.

.DSS - Soubory DSS společnosti Olympus jsou vlastními formáty společnosti Olympus. To je docela starý a špatný kodek. GSM nebo MP3, je zpravidla vhodnější, pokud mohou být použity rekordérem. To umožňuje ukládat další údaje do záhlaví souboru.

.DVF je proprietární formát komprimovaných hlasových záznamů společnosti Sony, běžně používaný hlasovými rekordéry této společnosti.

.GSM - určen pro telefonní služby v Evropě. Jedná se o nejlepší zvukový formát pro hlas zvuku v telefonu. Dobrý kompromis mezi velikostí a kvalitou souboru. Je také třeba poznamenat, že soubory wav mohou být někdy zakódovány pomocí kodéru GSM.

.MSV je vlastní formát společnosti Sony pro komprimované soubory Memory Stick. disky CD s audio formátem

Formáty internetu

.FLAC - formát souboru pro Free Lossless Audio Codec, bezztrátový kompresní audio kodek.

.IKLAX je multi-stop digitální audio formát, který umožňuje provádět různé akce na hudební data, například při míchání a skladování svazků.

.IVS je vlastnická verze Digital Rights Management vyvinutá firmou 3D Solar UK Ltd pro použití v hudbě stažené z hudebního obchodu Tronme, stejně jako pro interaktivní přehrávače hudby a videa.

.OPUS (Internet Engineering Task Force) je ztracená kvalita komprese zvuku formát vyvinutý pracovní skupinou Internet Engineering Task Force (IETF) pracovní skupina a navržený speciálně pro real-time interaktivní aplikace přes internet. Prezentovaný jako otevřený typ, standardizovaný pomocí RFC 6716, jeho referenční implementace je poskytována v souladu s licencí BSD pro 3 sekce.

.RA, .RM - formát Real Audio, navržený pro streamování zvuku přes internet. Současně .RA umožňuje ukládat soubory do souboru offline v počítači se všemi zvukovými daty obsaženými v samotném souboru. Programy pro zvukové formáty tohoto typu jsou nyní považovány za zastaralé.

Nejčastější

.RAW - Prvotní soubor může obsahovat zvuk v jakémkoli formátu, ale obvykle se používá s daty PCM audio. Zřídka se používá, kromě technických testů.

.SLN je schválený lineární formát PCM, který Asterisk používá. Před verzí v.10 byly standardními typy zvuku 16bitová podepsaná lina.

.Vox - nejčastěji používá kodek Dialogic ADPCM (Adaptive Differential Pulse Code Modulation). Stejně jako ostatní formáty ADPCM komprimuje data na 4 bit. Soubory ve formátu Vox jsou jako vlnové soubory, s výjimkou, že neobsahují informace o samotném souboru, takže se zvukové formáty mohou lišit. Chcete-li to provést, musíte nejprve určit vzorkovací frekvenci kodeku a počet kanálů.