To nekaj drugega je moral biti popolnoma nov algoritem stiskanja podatkov. In enega od njih, imenovanega FLAC (Free Lossless Audio Codec), je leta 2001 izdelal Josh Coalson. V tehniko linearnega napovedovanja, Golomb-Riceovega kodiranja in drugih matematičnih postopkov, ki so vključeni v FLAC, se ne bomo spuščali, ker za uporabnika ni pomembna. Kljub temu pa je o formatu treba zapisati nekaj besed. Zanimiv je namreč iz več razlogov. Prvi je bil v pojmu »lossless«, ki pomeni brez izgub. Zakaj je to pomembno, boste izvedeli v naslednjih odstavkih. Algoritem, ki vsebuje tako kodirnik kot dekodirnik (torej kodek), zvok formata wav stisne na okoli 50 odstotkov njegove originalne velikosti, kar je kar solidno, pomembno pa je, da pri tem ohranja vse kakovostne značilnosti originala. Zadeva se je kar prijela in leta 2004 jo je začel ponujati tudi Apple v svojem iTunesu. Kodirnik se je sicer imenoval Apple Lossles Codec, a načelo, ki ga je uporabljal, je bil skoraj identično FLAC-u.
A tudi 50- ali 60-odstotno zmanjšanje velikosti datoteke še vedno pomeni, da bo triminutna skladba precej velika − preko 10 megabajtov. To je še vedno kar precej. Zato se v sodobnih medijskih predvajalnikih uporabljajo drugi načini stiskanja, ki datoteke še bolj stisnejo. težava pa je v tem, ker pri tem trpi kakovost, saj vse temeljijo na takšnem ali drugačnem zmanjšanju količine podatkov.
Najbolj znan način stiskanja podatkov je nastal na Fraunhoferjevem inštitutu v Nemčiji sredi devetdesetih, torej kakih deset let pred pojavom FLAC-a, imenoval pa se je MPEG Audio Layer III ali krajše MP3. Ta uporablja drugačen pristop kot WAV, FLAC in Apple Lossless, saj se v datoteko ne shranjujejo vsi podatki, ampak le tisti, ki jih uporabniki oziroma poslušalci dejansko slišimo. To pomeni, da gre pri MP3 za stiskanje »z izgubami«, saj se v postopku redukcije velikosti datoteke nekaj podatkov izgubi. Izgubi? Ali to stiskanje z izgubo pomeni, da je MP3 slab? Ne (nujno)! Format temelji na tako imenovani psihoakustični analizi. Njena posebnost je v tem, da omogoča izločanje zvokov in nians, ki jih človeško uho ne more zaznati, s čemer lahko krepko zmanjša količino podatkov, ki se shranjujejo, brez za poslušalca, slišnega zmanjšanja kakovosti zvoka. In kako so ugotovili, kaj uporabnik sliši in česa ne? Eksperimentalno. Izvedli so raziskavo, v kateri je sodelovalo več sto ljudi. tem so dali poslušati najrazličnejše skladbe in ugotavljali, kaj ljudje slišijo in česa ne. Na osnovi teh praktičnih podatkov so nato razvili algoritem stiskanja, ki je povzročil pravo revolucijo, predvsem kar zadeva spletno glasbo.
Ideja MP3 je nastala na podlagi formata JPEG, ki je podobna načela stiskanja z izgubo vpeljal v slike. MP3 pa ni bil prvi. Že leta 1992 sta se s podobno idejo zabavala Philips s svojim formatom DCC in Sony z MiniDiscom, vendar sta bila oba načina povezana s specifičnimi napravami, manj pa s tem, da bi se z njima lahko zabaval uporabnik sam prek računalnika. MP3 je bil prvi, ki je omogočil kakovostno zmanjšanje količine podatkov do te mere, da si uporabniki lahko shranimo celotne glasbene albume v osebni računalnik ali pa jih prenašamo v napravah, kot so telefoni, medijski predvajalniki in podobno. Poleg tega MP3 daje uporabniku svobodo, da sam določi razmerje med kakovostjo zvoka in velikostjo datotek, tako da če potrebujete veliko datotek na razmeroma malo prostora, lahko datoteke bolj stisnete, če pa vas zanima kakovost, pa manj.
MP3 je prinesel še eno novost – metapodatke. To, kar imajo zdaj skoraj vse vrste datotek, je imel MP3 že ob svojem nastanku. Gre za dodatne podatke, ki se shranijo skupaj z datoteko samo. Pri glasbi so to naslov, ime izvajalca, albuma, datum nastanka in še kaj. S tem si uporabniki lahko izdelamo pregledne zbirke svojih glasbenih datotek.
Glede na zapisano bi si lahko mislili, da je MP3 odgovor na vsa zvočna vprašanja. Če omogoča shranjevanje glasbe v sprejemljivi kakovosti na desetini količine prostora, ki ga zaseda WAV, poleg tega pa omogoča še dodajanje metapodatkov, kaj pa sploh še potrebujemo? Potrebujemo možnost urejanja. No ja, saj je na trgu veliko programov, s katerimi je mogoče urejati datoteke MP3, a težava je v tem, da vedno, ko datoteko MP3 ponovno shranite, nekaj izgubite. In če to velikokrat ponovite, se to seveda pozna pri kakovosti. Zato se urejanje zvočnih datotek običajno izvaja prek formatov brez izgub, kot so WAV, FLAC ali podobni, v MP3 pa se shranijo na koncu, ko je urejanje končano.
MP3 pa ni edini kodek te vrste. S podobnimi idejami so se ukvarjali tudi drugi in tako je nastalo kar nekaj kodekov, ki temeljijo na odstranjevanju »odvečnih« podatkov iz datotek. Precej znana sta Windows Media Audio (WMA), ki je Microsoftov format stisnjenega zvoka, ter Advanced Audio Coding (AAC), ki ga je razvil del ekipe, ki je delal tudi s formatom MP3. Oba sistema sta ponujala enako kakovost zvočnih datotek kot MP3, datoteke pa so bile celo še manjše. Njuna dodatna lastnost pa je bila ta, da sta omogočala zaščito pred nepooblaščenim predvajanjem oziroma predvajanje le prek naprav, ki so bile »odobrene« s strani izdelovalca datotek. Majhna velikost in možnost avtorske zaščite sta lastnosti, ki sta bili pomembni za spletne storitve, ki ponujajo nakup glasbe. Pravzaprav se je tovrstna dejavnost s pojavom formata WMA, predvsem pa AAC šele prav razmahnila, čeprav so spletni ponudniki pozneje skoraj vsi prešli na MP3. Razen Appla, ki vztraja pri formatu AAC.
Sistemov oziroma kodirnikov zvoka je še veliko zato vseh ne bom našteval, mimo enega pa vseeno ne moremo. In to je Ogg Vorbis. Ta načeloma ni nič posebnega, saj opravlja enako delo kot AAC ali WMA, razlika pa je v tem, da je Ogg Vorbis v »javni lasti« (public domain) in ga je zato mogoče brezplačno in brez posebne licence uporabljati kjerkoli.
Moj mikro, september 2011 | Zoran Banovič |