Specifikacija MPEG-1 definira tri nivoje za avdio informacijo. Vsi delujejo podobno vendar z različnim nivoji kompleksnosti v kodirnem in dekodirnem delu. Vsi načini zvok podobno razdelijo na 32 manjših delov, nad katerimi nato izvedejo fizično-akustični model, s katerim ugotovijo, katere zvočne informacije lahko zavržejo s kar najmanj vpliva na kakovost reprodukcije.
Frekvenca vzorčenja
Povprečno človeško uho je zmožno zaznati zvoke v frekvenčnem razponu od 20–20.000 Hz. Za reprodukcijo zvoka na določeni frekvenci mora biti vzorčenje tega zvoka dvakratnik ciljne frekvence. To pomeni, da nam pri frekvenci vzorčenja 32.000 Hz ne uspe zajeti vseh informacij slišnega razpona zvoka (po zgornji definiciji bi potrebovali najmanj 19.980 Hz x 2 = 39.960 Hz), zato nekatere informacije višjih frekvenc izgubimo. Izoblikovale so se tri standardne frekvence vzorčenja – 32 kHz, 44,1 kHz ter 48 kHz. Slabša, 32 kHz je primerljiva s frekvenco vzorčenja, ki jo slišimo na radijskih postajah; 44,1 kHz se je uveljavila s prodorom CD-plošč, zato večkrat slišimo, da označuje CD-kakovost; 48 kHz pa je boljša od CD-kvalitete. Zadnji dve torej zgubljata le frekvence, ki so zunaj človeškega slišnega področja zato na videz ohranjata celovito zvočno sliko. Višja ko je frekvenca vzorčenja, večja mora biti tudi hitrost zajema, sicer se prednosti vzorčenja višjih frekvenc izgubijo zaradi povečanja zvočnih nepravilnosti.
Hitrost zajema
Hitrost zajema (tudi hitrost vzorčenja) se pogosto omenja v navezi s kakovostjo avdio ali video zapisa. Hitrost zajema definira, koliko fizičnega prostora namenjamo zapisu ene sekunde avdia ali videa, vrednost pa je izražena v bitih (8 bitov je 1 bajt). Na primer, pri treh minutah glasbenega zapisa MP3 pri hitrosti zajema 128 Kb/s pri CBR (constant bit rate – hitrost vzorčenja je enotna skozi celoten zapis) potrebujemo 2,81 MB prostora. (1024 x 128 x 180 / 1024 x 8 – oziroma še deljeno s 1024 za pretvorbo v megabajte). S hitrostjo zajema 64 Kb/s bomo dobili približno kakovost zvoka avdio kasete, z 192 Kb/s kakovost stereo radijskega programa, pri 384 Kb/s pa CD-kakovost zvoka.
Stiskanje
Ker bi za digitalni zajem podatkov na opisani način potrebovali ogromno količino prostora, hkrati pa so digitalni podatki idealni za stiskanje (compression), so znotraj standarda MPEG-1 nivoji 1, 2 in 3 namenjeni tudi stiskanju. Najobičajnejši zapis MP3 pri vzorčenju 128 Kb/s ponuja razred stiskanja okoli 11 : 1, vendar pa mnogi slišijo razliko glede na predvajanje s CD-ja oziroma pri predvajanju vzorčenja 256 Kb/s. Ta ocena je sicer subjektivna, vendar se je pomembno zavedati, da MP3 ponuja t. i. stiskanje z izgubljanjem. To pomeni, da algoritem odstrani nekatere informacije izvornega zvoka, s čimer varčuje pri porabi prostora. Kot vsi moderni algoritmi se tudi MP3 trudi odstraniti zvoke, ki jih človek ne zazna. Alternativa temu načinu stiskanja so algoritmi, ki stiskajo zvok brez izgube (FLAC, SHN, LPAC). Ti običajni 16-bitni zvok PCM (CD) zmorejo stisniti nekako na 50–75 odstotkov originalne velikosti (odvisno od karakteristik samega zvoka). Iz zgolj avdiofilskih razlogov pa velikost takih datotek večine ni prepričala, zato so ti algoritmi bolj kot ne postranska veja.
Moj mikro, Februar 2010 | Jaka Mele |