Zakaj so se sploh pojavili formati tipa MP3 in druščine? Če hočemo odgovoriti na to vprašanje, moramo malce poznati zgodovino. Glasba je bila na voljo na CD-jih precej pred prihodom formata MP3. S tem, ko so računalniki v začetku devetdesetih začeli dobivati vse bolj multimedijski značaj, je bilo le vprašanje časa, kdaj bomo začeli za obdelavo zvoka uporabljati namizne računalnike. A počakati je bilo treba, da se izpolnijo nekateri pogoji. Prvi je bil ta, da smo dobili na voljo snemalnike CD-jev po neki normalni ceni. Ko so ti prišli, so zadeve stekle same. Ker je sistem Windows takrat poznal le zvok formata WAV, so se pojavili programi, s katerimi je bilo mogoče »ripati« glasbene CD-je, kar je pomenilo zajem s CD-ja v zvočno datoteko na disku. Tako smo si lahko začeli delati lastne kompilacije, kjer smo na enem CD-ju združili glasbo več izvajalcev. Težava tega formata WAV je bila v tem, da so bile datoteke precej velike. V času, ko so velikosti diskov bile krepko pod enim gigabajtom, je deset megabajtov za minuto glasbe precej požrešno. Treba je vedeti, da je zvok v kakovosti CD narejen tako, da je vzorčen 16-bitno in s frekvenco, ki je okoli dvakrat višja (44,1 KHz) od slišne frekvence človeškega ušesa. To pa pomeni, da je vsaka sekunda zvoka opisana s 1400 megabiti, kar je pomenilo okoli deset megabajtov za vsako minuto zvoka. In ker so bile takratne internetne povezave za današnje razmere izredno počasne, prenosnih diskov pa tudi ni bilo v obliki, primerni za navadne smrtnike, takšne glasbe ni bilo mogoče deliti oziroma je prenašati iz računalnika v računalnik. Zato se je iskala rešitev. Našel jo je nemški Fraunhoferjev inštitut, ki je ubral dokaj zanimivo pot. Takrat se je že nekaj vedelo o kompresijskih algoritmih, saj smo že poznali format AVI, ki je stiskal filme, zelo aktivno pa se je delalo tudi na tako imenovani Motion Pictures Expert Groupi (MPEG), zbirki standardov za prikaz slike in zvoka, ki uporablja izgubno kompresijo. To pomeni, da se med stiskanjem podatkov nekaj teh izgubi, vendar je izguba na takšni ravni, da še ne vpliva bistveno na kakovost slike in zvoka. Fraunhoferjev inštitut je pri MPEG aktivno sodeloval, predvsem pri stiskanju zvoka. Pri tem so ubrali dokaj zanimivo pot, imenovano psihoakustika. Ugotovili so, da je v zvočnem zapisu veliko podatkov, ki jih uporabniki sploh ne slišijo ali slišijo zelo slabo. In če se nekaj ne sliši, zakaj je treba s tem obremenjevati zvočno datoteko? Če te podatke vržemo stran, se bo njihova količina seveda zmanjšala. Toda kaj lahko vržemo stran? Ker je slišnost dokaj relativna, so Nemci izvedli cel kup testov na najrazličnejših osebah, da so ugotovili, kaj lahko »režejo« in česa ne. In iz tega »rezanja« in kompresijskih algoritmov je tako sredi devetdesetih nastal MPEG Layer III ali krajše MP3, ki je količino podatkov, če vzamemo kakovost CD, torej 44,1 KHz, zmanjšal za okoli 12-krat brez slišnega zmanjšanja kakovosti. Fraunhoferjevemu MP3 je pozneje sledilo še več drugih različic MP3, pa tudi drugih načinov stiskanja.

Na Fraunhoferjevem inštitutu v Nemčiji so dolgo testirali, katere zvoke ljudje slišijo in katerih ne. Nastala je psihoakustika.

Toda niso vsi načini stiskanja takšni, da se pri njih podatki izgubijo. Poznamo tudi brezizgubne načine stiskanja, kot je recimo FLAC (podrobneje malce pozneje), ki temeljijo zgolj na matematiki. Prednost brezizgubnega stiskanja je seveda v tem, da se ohranijo vsi podatki, torej lahko po potrebi rekreiramo originalni zapis, kar pri MP3 ni mogoče, saj so »odrezani« podatki za vedno izgubljeni, so pa pri brezizgubnih načinih velikosti datotek precej večje, čeprav še vedno bistveno manjše kot pri WAV.

Sama kompresija podatkov ni nič brez kodekov, torej programov/gonilnikov za kodiranje in dekodiranje oziroma pri zvoku za kompresijo in dekompresijo podatkov, ki na eni strani zvok stiskajo, na drugi pa razširjajo in pripravljajo za predvajanje. Za vsak format zapisa zvoka potrebujemo poseben kodek, saj gre za različne načine stiskanja. A če vam vaš program za »ripanje« CD-jev ponudi možnost hranjenja v neki format, to pomeni, da je ustrezen kodek nameščen. A to še ne pomeni, da bo takšno stisnjeno datoteko mogoče predvajati na prenosnem predvajalniku. Če ta v svoji programski opremi (firmwaru) ne vsebuje podpore za ta kodek, datoteke ne bo predvajal. Pred odločitvijo o formatu stiskanja zvočnih zapisov torej preverite, katere podpira vaš predvajalnik.

Pri zajemanju glasbe v računalnik naletimo na nekatere nastavitve. Pravzaprav najpomembnejša je bitna hitrost (bitrate). Gre za oznako, ki pomeni količino podatkov, s katerimi je opisan zvok v nekem določenem času. Bitna hitrost se meri v kilobitih na sekundo (kbits, Kbps). Če najdete podatek, da je neka pesem zajeta s hitrostjo 128 Kbps, to pomeni, da je vsaka sekunda zvoka opisana s 128 kilobiti, kar je kakovost blizu CD-kakovosti. V splošnem pomeni, da višja kot je bitna hitrost, višja je kakovost posnetka, a tudi velikost datoteke. Če zdaj kupujete glasbo prek spleta, jo boste najverjetneje dobili v bitni hitrosti 256 Kbps, kar je nekako dvojna CD-kakovost, čeprav primerjava ni najbolj na mestu. Poleg tega boste pri bitni hitrosti naleteli tudi na kratici CBR in VBR. CBR (constant bit-rate) pomeni, da je čez celotno pesem uporabljena enaka bitna hitrost za zajem zvoka, VBR (variable bit-rate) pa, da se ta hitrost med pesmijo spreminja. In zakaj bi jo sploh spreminjali? Spet gre za varčevanje pri prostoru. Če gre za neki del, kjer je slišati več glasbil, potem je pomembno, da je kakovost zajema čim večja, da se zvok lepo sliši. Če pa gre samo za recimo zvok ene violine ali celo tišino, pa ni nobene potrebe po tako veliki hitrosti, zato se lahko ta na takšnih odsekih zmanjša. Manjša hitrost pa pomeni manj podatkov. Je pa res, da morajo spremenljivo hitrost podpirati tudi naprave, kjer bomo takšno glasbo predvajali.

Pri zvočnih zapisih je treba omeniti še pojem vsebnik (container). Če najdete datoteko MP3, ni nujno, da je stisnjena s Fraunhoferjevim kodirnikom. Obstaja jih namreč kar nekaj. MP3 kot tak je torej vsebnik, v katerem je lahko vsebina shranjena na različne načine. Podobno je tudi pri filmih, kjer je format AVI le vsebnik, vsebina pa je lahko stisnjena s kodirniki xvid, divx in še s kakšnim.

Format MP3 poznajo vsi predvajalniki, ki podpirajo tudi različne kakovosti kodiranja.

Zapisali smo, da je stisnjenih formatov glasbe kar nekaj. MP3 je le eden in prvi, zato ga podpirajo vsi predvajalniki na trgu. Obstajajo pa še drugi, ki prav tako niso slabi, le preveriti morate, ali jih vaše naprave podpirajo. Pri predvajanju prek računalnika, tablice ali pametnega telefona težav ne bi smelo biti, saj je zanje mogoče sneti ustrezne kodeke, težave pa lahko nastanejo pri namenskih predvajalnikih, kjer kodekov ni mogoče nameščati. Pa si oglejmo nekaj najpogostejših glasbenih formatov.

AAC (Advanced Audio Coding) je izgubni format, ki ga podpira večina naprav. Gre za »derivat« MP3, ki je bolje dodelan na matematičnem delu, torej kompresiji zvoka, ki je ostal po »rezanju«. Datoteke, stisnjene z AAC, so pri isti bitni hitrosti manjše od MP3. Datoteke imajo pogosto končnico .m4a.

ALAC (Apple Losless) je Applov brezizgubni format zajema in zapisa zvoka. Apple si je želel, da bi bil ta format alternativa formatu FLAC, a mu to ni najbolj uspelo. Tudi datoteke ALAC so pogost shranjene v vsebniku M4A, torej imajo končnico .m4a.

AIFF (Audio Interchange File Format) je nestisnjen zvočni format, ki ga poznamo iz Applovih računalnikov. Zvočne datoteke so zelo visoke kakovosti, hkrati pa tudi zelo velike, zato tega formata v prenosnih napravah običajno ni.

FLAC (Free Losless Audio Codec) je format, ki ga najraje uporabljajo audiofili. Gre za brezizgubni format, ki je hkrati še odprtokoden, tako da ni težav z iskanjem kodekov in programov, ki format podpirajo. Ker gre za stiskanje brez izgub, je kakovost zvoka na zelo visoki ravni.

MP3 (MPEG Audio layer 3) smo že opisali. Gre za pionirja na področju izgubnega stiskanja zvočnega zapisa in tudi format, ki je najbolj uporabljan, saj ga podpirajo vse naprave. Od konca osemdesetih, ko se je format začel razvijati, je krepko napredoval, čeprav ga je glasbena industrija vmes poskušala ustaviti na vse mogoče in nemogoče načine.

Vorbis ali točneje Ogg Vorbis je zanimiv format, katerega datoteke pogosto nosijo končnico .ogg. Gre za nekakšno konkurenco MP3, ki nudi nekoliko višjo kakovost pri enaki bitni hitrosti, a se nekako ni uveljavil.

WMA (Window Media Audio) je format, ki ga je razvil Microsoft kot odgovor na MP3 in druščino. Gre za format, ki je v lasti Microsofta, torej je mogoče kodek dobiti le z njihovim blagoslovom, kakovost pa je nekje na ravni MP3 in AAC, ga pa podpira precej manj naprav.

WAV je nekakšen »domači« format zvoka v okoljih Windows od njihovega začetka naprej. Gre za nestisnjen format, ki nudi precej visoko kakovost zvoka, a hkrati tudi zelo velike datoteke, tako da je za prenosne predvajalnike neuporaben. Tudi sodobni programi za izdelavo zvočnih CD-jev ga zdaj ne potrebujejo več. Pred časom je namreč bilo tako, da smo morali, če smo hoteli izdelati zvočni CD, stisnjene datoteke, takrat bolj ali manj le MP3, najprej pretvoriti v format WAV, saj so programi za »pečenje« le tako znali izdelati zvočni CD. Zdaj je, zaradi višje hitrosti zapisovanja na optične medije, mogoče postopek izvesti neposredno, tako da formata WAV ne potrebujemo več.

Moj mikro, September Oktober 2013 | Miha Gradišnik |