MPEG-1 Audio Layer 3, pogosteje imenovan MP3, je digitalni zapis zvoka, ki uporablja mehanizem stiskanja z izgubo podatkov. Gre za skupni avdio format za shranjevanje zvočnih posnetkov, kot tudi de facto standard kodiranja za prenos in predvajanje glasbe v digitalnih medijskih predvajalnikih. Pri nastajanju MP3 kot avdio formata so sodelovali člani skupine Motion Pictures Expert Group, kjer vidneje izstopajo skupine inženirjev na inštitutu Fraunhofer IIS v Erlangnu, Nemčija, laboratorijih AT & T Bell Labs v Murrayju, ZDA, Thomson-Brandt, CCETT in drugi. MP3 je bil leta 1991 odobren kot standard ISO/IEC.
MP3 uporablja mehanizem stiskanja z izgubo, ki je zasnovan tako, da močno zmanjša količino podatkov, zahtevanih za predstavitev informacij, potrebnih za predvajanje avdio posnetkov. Čeprav algoritem zgubi nekatere podatke, je posnetek ob reprodukciji hkrati še vedno zelo blizu originalu, oziroma preprosteje – ob stiskanju MP3 zaradi združevanja zgubi tiste podatke, ki naj bi bili zunaj zvočne zaznavne sposobnosti večine ljudi. Zaradi tega se je MP3 uveljavil kot kakovosten format z odličnim zvokom, a se, jasno ne uvršča v hi-fi razred, kot ga definirajo avdiofili.
Datoteka MP3, ki je proizvedena z uporabo povprečnih stiskalnih nastavitev – to je z uporabo hitrosti vzorčenja 128 Kb na sekundo – bo običajno dosegla okoli desetino velikosti izvorne datoteke (če jo neposredno presnamemo z izvirnega avdio vira, recimo CD-plošče). Seveda lahko poljubno spreminjamo hitrost vzorčenja in stiskanja ter tako dosežemo še manjše datoteke, kjer pa se opazneje znižuje tudi kakovost reprodukcije.
Sestavni del datotek MP3 je tudi informacija ID3. Gre za metapodatke, ki so pripeti datoteki, največkrat pa v njih zapišemo podatke o glasbeni datoteki – recimo izvajalca, album, letnico in podobno.
BIT NA BIT – GLASBA
Ker je za pretvorbo analognega zapisa zvoka v digitalnega potrebno kar nekaj tehnoloških rešitev, se pogosto znajdemo pred tremi izrazi, ki jih marsikdo še vedno ne razume. Že pri zvoku se zaplete, saj se tu srečamo z izrazi kot so hitrost zajema (bitrate), frekvenca vzorčenja (sampling frequency) in stiskanje (compression).
Formati oz. načini zapisa zvoka v digitalni obliki so standardizirani iz projektov skupine Motion Picture Expert Group (MPEG), ki se ukvarjajo z definiranjem sintaks in algoritmov za digitalni zapis slikovnega in zvočnega gradiva. Specifikacija MPEG-1 definira tri nivoje za avdio informacijo. Vsi delujejo na podoben način, a z različnim stopnjami kompleksnosti v kodirnem in dekodirnem delu. Vsi načini zvok podobno razdelijo na 32 manjših delov, nad katerimi nato izvedejo fizično-akustični model, s katerim ugotovijo, katere zvočne informacije lahko zavržejo s kar najmanj vpliva na kakovost reprodukcije.
Frekvenca vzorčenja
Povprečno človeško uho je zmožno zaznati zvoke v frekvenčnem razponu od 20 do 20.000 Hz. Za reprodukcijo zvoka pri določeni frekvenci mora biti vzorčenje tega zvoka dvakratnik ciljne frekvence. To pomeni, da nam pri frekvenci vzorčenja 32.000 Hz ne uspe zajeti vseh informacij slišnega razpona zvoka (po zgornji definiciji bi potrebovali najmanj 19.980 Hz x 2 = 39.960 Hz), zato nekatere informacije višjih frekvenc izgubimo. Izoblikovale so se tri standardne frekvence vzorčenja – 32 kHz, 44,1 kHz in 48 kHz. Slabša, 32 kHz, je primerljiva s frekvenco vzorčenja, ki jo slišimo na radijskih postajah; 44,1 kHz se je uveljavil s prodorom CD-plošč, zato večkrat slišimo da označuje CD-kakovost; 48 kHz pa je boljši od CD-kakovosti. Zadnja dva torej zgubljata le frekvence, ki so zunaj človeškega slišnega področja, zato na videz ohranjata celovito zvočno sliko.
Višja kot je frekvenca vzorčenja, večja mora biti tudi hitrost zajema, sicer se prednosti vzorčenja višjih frekvenc izgubijo zaradi povečanja zvočnih nepravilnosti.
Hitrost zajema
Hitrost zajema (tudi hitrost vzorčenja) se omenja pogosto v navezi s kakovostjo avdio ali video zapisa. Hitrost zajema definira, koliko fizičnega prostora namenjamo zapisu ene sekunde avdia ali videa, vrednost pa je izražena v bitih (8 bitov je 1 bajt). Na primer, pri treh minutah glasbenega zapisa MP3 pri hitrosti zajema 128 Kb/s pri CBR (constant bit rate – hitrost vzorčenja je enotna skozi celoten zapis) potrebujemo 2,81 MB prostora. (1024 x 128 x 180 / 1024 x 8 – oziroma še deljeno s 1024 za pretvorbo v megabajte). S hitrostjo zajema 64 Kb/s bomo dobili približno kakovost kasete, s 192 Kb/s kakovost stereo radijskega programa, pri 384 Kb/s pa CD-kakovost zvoka.
Stiskanje
Ker bi za digitalni zajem podatkov na opisani način potrebovali ogromno količino prostora, hkrati pa so digitalni podatki idealni za stiskanje (kompresijo), so znotraj standarda MPEG-1 nivoji 1, 2 in 3, namenjeni tudi stiskanju.
Nivo 1 (Layer 1) izvirno označuje hitrost zajema 384 Kb/s, in ta vključuje stiskalni faktor 4 : 1. Ta zapis se še danes uporablja pri DVD-filmih, hkrati pa zapis s preprostejšim fizično-akustičnim modelom daje boljšo kakovost od nivoja 2 pri hitrosti zajema 192 do 256 Kb/s.
Nivo 2 (Layer 2), originalno označuje hitrost zajema pri 192 do 256 Kb/s, vključuje stiskanje faktorja 6 : 1 do 8 : 1. Poznejše specifikacije so dvignile možno hitrost vzorčenja do 384 Kb/s. Pri vzorčenju 256 do 384 Kb/s daje odlično kakovost zvoka, pri 224 do 256 Kb/s zelo dobro, pri vzorčenju 192 do 224 Kb/s pa le dobro.
Nivo 3 (Layer 3), originalno označuje hitrost zajema pri 112 do 128 Kb/s, vključuje stiskanje faktorja 10 : 1 do 12 : 1. Poznejše specifikacije so dvignile možno hitrost vzorčenja do 320 Kb/s. Čeprav se splošno sprejemljiva kakovost začne pri uporabi nivoja 3 ter vzorčenja 128 Kb/s, pa realno gledano to še vedno ni zadovoljivo. Nivo 3 ponuja odličen zvok pri vzorčenju 224 do 320 Kb/s, zelo dober od 192 do 224 Kb/s ter povprečen pri 160 do 192 Kb/s. Pri vzorčenju 112 do128 Kb/s je kakovost slabša kot nivo 2 pri 192 do 256 Kb/s.
Najobičajnejši zapis MP3 pri vzorčenju 128 Kb/s ponuja razred stiskanja okoli 11 : 1, vendar pa mnogi slišijo razliko glede na predvajanje s CD-plošč oziroma pri predvajanju vzorčenja 256 Kb/s. Ta ocena je sicer subjektivna, vendar se je pomembno zavedati, da MP3 ponuja t.i. stiskanje z izgubljanjem. To pomeni, da algoritem odstrani nekatere informacije izvornega zvoka, s čimer varčuje pri porabi prostora. Kot vsi moderni algoritmi se tudi MP3 trudi odstraniti zvoke, ki jih človek ne zazna. Alternativa temu načinu stiskanja so algoritmi, ki stiskajo zvok brez izgube (FLAC, SHN, LPAC). Tem običajni 16-bitni zvok PCM (CD) uspe stisniti nekako na 50–75 % originalne velikosti (odvisno od karakteristik samega zvoka). Iz zgolj avdiofilskih razlogov pa velikost takih datotek večino ni prepričala, zato so ti algoritmi bolj kot ne postranska veja.
KONKURENČNI FORMATI
MP3 je odličen format, saj ima najpomembnejšo lastnost – uporablja ga ves svet. A MP3 še zdaleč ni idealen. Ker je pri ustvarjanju sodelovalo toliko organizacij, si seveda vsaka lasti tudi patent oz. del patenta na MP3. Prav ti pravni spori okoli pravic in podeljevanja licenc podjetjem, ki želijo s formatom MP3 karkoli početi (predvajalniki glasbe, naprave, ki ga podpirajo), so v letih okoli preloma tisočletja spodbudila razvoj novih konkurenčnih formatov in hkrati znatno upočasnila razvoj MP3-licenčne programske opreme. Odprle so se tudi nove možnosti, kot so odprtokodni format Vorbis ter konkurenčna AAC in WMA. Microsoft se je recimo odločil, da se odmakne od MP3 in razvije svoj format Windows Media predvsem zato, da bi se izognili vprašanjem o licencah. V zadnjih letih smo na različnih sejmih doživeli tudi nekaj policijskih racij in zaplembe MP3-predvajalnikov raznih azijskih proizvajalcev, pa tudi SanDiskovih, recimo leta 2006 na sejmu IFA ...
Zato ni čudno, da je danes aktualnih kar nekaj formatov, in da večina medijskih predvajalnikov zna predvajati kar nekaj teh, če ne vseh.
Sodobni zapisi zvoka, kot so poleg MP3 še recimo AAC, ATRAC, WMA, RealAudio, MP3Pro, WMA Pro, Ogg Vorbis in drugi, tudi že omogočajo variabilno hitrost zajema, kar pomeni, da za akustično zahtevnejši del dinamično povečajo hitrost vzorčenja, za tišji, bolj monoton del pa znižajo. Tako v povprečju ohranjajo podobno raven velikosti datotek kot pri konstantnem vzorčenju, hkrati pa je kakovost reprodukcije bistveno boljša.
Kateri je boljši? Več organizacij je izvajalo meritve kodiranja z uporabo različnih kodekov in predvajanje rezultatov, in dejstvo, je da so danes vsi zelo izenačeni, in da le trenirano uho zazna manjše razlike. Poleg tega je zaradi hitro se spreminjajočih kodekov, ki jih nenehno razvijajo, težko rezultate takega testa pred pol leta pretvoriti v sedanjost.
A povprečje ostaja – v internetu je 128 Kb/s postal standard za »dovolj dober« zapis oz. hitrost zajema. Odličen pregled formatov in njihovih lastnosti in primerjavo najdete na naslovu http://en.wikipedia.org/wiki/Comparison_of_audio_codecs.
AVTORSKA ZAŠČITA
V zadnjih letih, ko industrija pritiska ne le na pirate – razpečevalce tuje avtorske lastnine za lasten zaslužek – temveč tudi na ponudnike internetnih storitev in same uporabnike, je avtorska zaščita za izvajalce, založbe in tudi internetne trgovine čedalje pomembnejša.
In tudi tu se pojavljajo razlike med formati in kodeki. Nekateri formati, podobno kot MP3 vsebuje meta informacije ID3, vsebujejo tudi informacije o upravljanju digitalnih pravic (DRM – digital rights managment).
Upravljanje digitalnih pravic (DRM) je splošni izraz, ki se nanaša na dostop do tehnologij nadzora, ki ga uporabljajo proizvajalci strojne opreme, izdajatelji in imetniki avtorskih pravic, da se omeji uporaba digitalnih medijev ali naprav. Včasih so zaščite preprečevale nepooblaščeno kopiranje, danes pa upravljanje z digitalnimi pravicami omogoča precej širše akcije in podroben nadzor, kaj se sme in kaj ne. Izdajatelj lahko tako omeji število predvajanj, prikazov, število skopiranih izvodov … Upravljanje digitalnih pravic pogosto uporablja kriptografijo in spletna aktiviranja. Uporabljajo ga družbe, kot so Sony, Apple, Microsoft, BBC in drugi – in tudi veliko drugih založb. Upravljanje digitalnih pravic imajo mnogi za sporno – v najboljšem primeru.
Moj mikro, December 2008 | Jaka Mele |