Kdo bi vedel? Na podatke proizvajalcev se na žalost ne moremo preveč zanašati. Vse je v verjetnosti, a saj vemo, kako je z njo. Do nje pridejo s pomočjo pospešenih laboratorijskih poskusov ali na osnovi podatkov o pokvarjenih izdelkih, ki so jih kupci vrnili v preteklosti. Ko se nam medij pokvari in izgubimo podatke, nam je popolnoma vseeno, da je proizvajalec zanj zatrdil, da bo z 99,9999-odstotno gotovostjo zdržal x let.

BREZ MAGNETIZMA BI NAM TRDA PREDLA!

Devetdeset odstotkov, torej skoraj vsa novonastala vsebina, je shranjena na magnetnih pomnilniških napravah, večinoma na trdih diskih. Zato ne čudi, da bi vsi radi natančno vedeli, katerega dne in ob kateri uri se bo disk preselil v večna lovišča. Naj vas razočaram. Magične formule (ali programa) ni! Kako žgoča in pekoča je »dokončna« okvara diska, veste vi, ki se vam je to že pripetilo, še zlasti če podatkov niste imeli shranjenih še kje drugje. Pomen rednega arhiviranja podatkov bom to pot preskočil. Postrežem pa vam lahko z ugotovitvami raziskave (http://labs.google.com/papers/disk_failures.html), ki je bila izvedena na velikem številu diskov (okoli 140 tisoč različnih proizvajalcev, modelov in letnikov izdelave), v strežnikih in diskovnih poljih med njihovo praktično uporabo (9-mesečno časovno okno). Zanimiva je zato, ker je pokazala nekoliko drugačna dejstva, kot smo jih bili vajeni do zdaj.

Ne boste verjeli, a tudi pri tej raziskavi gre za verjetnost, konkretno, kakšna je verjetnost okvare glede na določene merljive količine v predvideni petletni življenjski dobi diska. Upoštevajte ta podatek in kupite nov računalnik ali nov disk, ne glede na to, da stari na prvi pogled še vedno zanesljivo deluje. Trdi diski so sicer res da robustne naprave, a obenem tudi izredno kompleksne (veliko mehanskih sestavnih delov). Po domače povedano, to pomeni, da redko odpovedo, a ko odpovedo, je za to lahko veliko razlogov.

V grafikonih nastopa kratica AFR, ki pomeni povprečje pokvarjenih diskov (annualized failure rates), pri čemer kot taki štejejo oni, ki so bili zaradi različnih razlogov (beri: okvar) zamenjani.

Neenakomerna distribucija okvar glede na starost diskov med nič in petimi leti. Ti podatki nam ne pomagajo pri natančnem razumevanju vpliva starosti diska na verjetnost okvare. Še več! Že nekatere predhodne analize so pokazale, da je graf odpovedi glede na starost diska ni odvisen zgolj od proizvajalca, temveč tudi od modelov in letnikov izdelave. Kar je do neke mere razumljive, saj na primer pred petimi leti diski še niso bili enako zanesljivi, kot so najnovejši modeli. Zanimivo je morda le to, da število okvar pri diskih, starejših od treh mesecev, nekoliko pade, nato pa ponovno naraste pri dvoletnikih.
Podobno neenakomerno sliko dobimo tudi pri prikazu stopnje okvar glede na obremenitve diskov (tedensko povprečje bralno-pisalnih ciklov oziroma pasovne širine – koliko podatkov je bilo prenesenih z diska oziroma na disk). Zelo jasno je moč razbrati, da visoka obremenitev vpliva na možnost okvare pri diskih, mlajših in starejših od treh let. Pri diskih, starih tri leta, pa je so se bolj kvarili diski, ki so bili manj obremenjeni. Spet ni jasne povezave med obremenitvijo diska in njegovo življenjsko dobo, čeprav so to pokazala nekatere prejšnje analize, ki so bile izvedena na neprimerno manjši »populaciji« diskov.
Kaj pa temperatura diska? Veljajo je prepričanje, da bolj kot je disk »vroč«, večja je verjetnost njegove okvare, oziroma da temperatura 15 stopinj C podaljša življenjsko dobo diska. Ta raziskava pa tega ni potrdila in ni pokazala povečanja števila okvar pri povečanju temperature, razen ko je govor o res visokih temperaturah in pri starejših diskih. Kot kaže, so novi diski manj občutljivi na temperaturne razlike. Pokazalo se je še nekaj – vsaj pri novejših diskih: stopnja okvar pri nizkih temperaturah je višja kot pri višjih optimalnih temperaturah. Po svoje je to zanimivo in ima praktično možnost uporabe. Skrbniki podatkovnih centrov imajo večji manevrski prostor pri določanju optimalne temperature prostora, vsaj kar zadeva delovanje diska.
Zaznanje napake (scan errors). Vmesnik diska vedno išče napake pri zapisu podatkov, veliko število najdenih napak pa je znak fizične okvare dela ali delov pomnilniškega medija. V okviru omenjene skupine diskov jih je zgolj 2 odstotka imelo napake. Kljub vsemu pa je ugotovitev naslednja: verjetnost okvare diska z napakami je desetkrat večja od verjetnosti okvare diska brez napak. Oziroma! Po zaznavi prve napake je verjetnost, da disk ne bo »preživel« naslednjih 60 dni, 39-krat višja od verjetnosti pri disku brez napake.
Število vseh novih dodelitev (reallocation counts). Ko logika diska »misli«, da je s sektorjem nekaj narobe, tega prenese na drugi fizični naslov (na drugi del diska). Devet odstotkov diskov iz raziskave je imelo število novih dodelitev višje od nič. In rezultat? Po prvi novi dodelitvi je verjetnost okvare diska v 60 dneh 14-krat višja od verjetnosti pri disku brez nove dodelitve.
Število novih dodelitev (offline reallocation), ki ne vključuje tistih, ki so nastale kot posledica dejanskih vhodno-izhodnih operacij. Po prvi novi dodelitvi je verjetnost okvare v prvih 60 dneh 21-krat višja.
Disk lahko sumljive sektorja postavi v »karanteno« (probational counts), dokler se ne izkaže, da je ta res okvarjen in je njegov prenos potreben. Po prvi zaznavi te napake je verjetnost okvare 16-krat višja od verjetnosti pri disku brez napake.

KAJ ZDAJ?

Rezultati analize (še) nimajo praktične vrednosti, še posebej si z njimi ne morate pomagati domači uporabniki. Kaj pa vi, ki ste hkrati najobčutljivejši na odpoved diska, saj je to dostikrat povezano z izgubo prav vseh podatkov, ki ste jih imeli na njem? Obstajajo specializirana podjetja, ki se ukvarjajo z rekonstrukcijo podatkov z okvarjenih diskov, vendar je njihova cena običajno previsoka za povprečnega domačega uporabnika, hkrati pa je dostikrat tudi vprašljivo, ali in koliko podatkov jim bo uspelo dejansko rešiti.

Nasveti za vas so bržkone subjektivni, redko uporabni, tako da vam ostane le lastna intuicija. Na kaj mislim? Splet je poln nasvetov v slogu: poslušajte svoj disk in če se vam dozdeva, da je preglasen, to lahko kaže na slabše delovanje mehaničnih delov diska, ki lahko povzročajo okvaro. Lahko naštevamo še naprej. Ali se vam dozdeva, da se računalnik predolgo zaganja ali odpira programe oziroma datoteke? So v odprtih datotekah vidne napake (na primer v besedilu ali sliki)? Vse to je lahko posledica slabšega delovanja diska ali pa tudi ne, saj je še gora drugih razlogov (med drugim virusi). Edino, kar bi počel gleda na rezultate analize, bi sem ter tja zagnal program za pregled diska in pogledal omenjene parametre (slabi sektorji in podobno. Edina prava zaščita je ….zelo dobro jo poznate: varno arhiviranje vseh podatkov, ki so vam pomembni!

Nič nas ne sme presenetiti
Verjetno že veste, da je treba z mediji pazljivo ravnati, tako da se ti ne poškodujejo. Priporočamo, da se držite naslednjih enostavnih pravil. Če je le mogoče, se ne dotikajte površine medija, torej tam, kjer so podatkovne sledi, kajti te je moč hitro opraskati. Raza, ki se je ne da enostavno odpraviti, bo vplivala na kakovost branja podatkov. Tudi če površine ne opraskate, lahko njeno prijemanje s potnimi rokami povzroči težave. Zakaj? V potu sta maščoba in sol, ki lahko pod določenimi pogoji reagirata s površinskimi sloji nekaterih medijev. Verjetno pa že veste, da »zapackan« DVD pogon težje bere oziroma se pri tem pojavljajo napake.Mediji naj ne bodo izpostavljeni tekočinam in prahu in tudi ne previsokim temperaturam in neposredni sončni svetlobi (najbolje, da so v temnem prostoru). Pri hranjenju naj bodo v zaščitnem ovitku in postavljeni pokončno – torej ne vodoravno in ne eden na drugem, kar radi počnemo. Priporočljivo je tudi, da medijev ne puščamo v pogonu, tega pa je treba redno čistiti.
Tip pomnilniškega medijaTemperatura (stopinj C) Relativna vlažnost (%)
Magnetni mediji (trakovi) 10−4520−80
Optični mediji – CD-ji10−5010−80
Optični mediji − DVD-ji10−5010−80
Flash, SSD in podobno10−5020−80
Kombinacija medijev16−3220−80
Glede na povedano vam predlagam, da vsakih nekaj let, ne pozneje kot po desetih letih, podatke prepišite na nov medij enake ali novejše tehnologije. Če ste paranoični in želite mirno spati brez bojazni, da bodo vaši dragoceni podatki čez noč izpuhteli, vam pa se o tem še sanjalo ne bo, potem vam predlagam naslednje: če svoje podatke hranite na DVD-ju, naredite dve arhivski kopiji, pri čemer uporabite dva »prazna medija« različnih proizvajalcev. Previdnost je mati modrosti!

DISKI SSD IN POMNILNIŠKE KARTICE

Zadnje leto so na trg prišli tako imenovani diski SSD (Solid State Disk − disk brez gibljivih delov), ki podatke ne zapiše na magnetni medij in nima vrtečih in temu primerno obremenjenih mehanskih delov. Namesto tega podatke zapiše v pomnilniške celice (logična vezja), ki za hranjenje ne potrebujejo električne energije – podatek ne izpuhti, ko izključimo napajanje. Gre torej za pomnilniške kartice, ki smo jih vajeni pri skoraj vseh mobilnih napravah, zapakiranih v nekoliko večja ohišja. Proizvajalci teh diskov, poleg višje hitrosti pisanja in branja, ravno to dejstvo največkrat omenjajo kot prednost pred klasičnimi trdimi diski, pri čemer zanemarjajo čisto relevanten podatek, da je cena zapisa bita podatka pri teh diskih višja od cene pri trdih diskih.

Pa tudi diski SSD niso večni. Vsaka celica za hranjenje bita podatkov ima omejeno število zapisov. Ta je različna od kakovosti pomnilnika in se giblje med 300 tisoč in milijon. Kaj to pomeni v praksi? Kolikšna je njihova življenjska doba. Ker gre za relativno novost, praktičnih podatkov še ni, odvisni smo od zagotovil proizvajalcev, pri katerih nihče ne omenja dobe, manjše od šestih let tudi v primeru, ko na disk vsak dan zapišemo 1 GB podatkov. Ti diski so opremljeni z mehanizmi za podaljševanje življenjske dobe: od algoritmov, ki štejejo zapise v določene celice, nato pa optimirajo zapisovanje po pomnilniku, tako da so vse celice relativno enako obremenjeno, pa do algoritmov, ki ko neka celica doseže prej določeno število zapisov, vanjo prestavi podatke, ki jih le beremo. Do neke mere je torej njihova življenjska doba veliko bolj povezana z obremenitvijo diska (zapisovanje podatkov vanj) kot od drugih parametrov. Enako velja za pomnilniške kartice. Manj kot določa proizvajalec, načeloma ne, kako dolgo, pa je odvisno od uporabe kartice.

OPTIČNI MEDIJI ZA VEČ KOT 10 LET!

Trdi diski, diski SSD in pomnilniške kartice niso najprimernejši za dolgotrajno hranjenje podatkov, ker so preprosto za ta namen predragi. Podatke smo »pekli« na CD-je, danes na DVD-je, v bodoče pa jih bomo na HD DVD-je ali diske blu-ray. Katera tehnologija bo prevladala? Stavimo na HD DVD, kljub manjši kapaciteti, saj je cenejši!

Kolikšen je njihov rok trajanja? Tu šele zaplovemo v motne vode! Proizvajalci navajajo različne podatke, od 20 pa tja do 300 let, kar naj bi kazali njihovi laboratorijski pospešeni preizkusi. Praktičnih testov pa seveda ni, saj jih uporabljamo šele nekaj več kot deset let, hkrati se spreminjajo materiali, ki jih uporabljamo, da ne govorimo o novih tehnologijah in večanju gostote zapisa na enako veliki površini. Logično bi bilo, da je manjši »fizični« zapis bolj podvržen degradacijam kot večji. Verjetno je temu tudi v praksi tako, vendar kdo bi vedel, saj, kot sem omenil, v praksi tega ne morem preveriti.

Pogledal sem svoje zapisljive CD-je, ki sem jih naredil med leti 2001 in 2005, in ti so še vedno čisto normalno delovali, razen dveh. Zakaj je pri teh prišlo do okvare, ne vem, lahko da je zadeva povezana s slabšo kakovostjo uporabljenih medijev ali pa je bila napaka že pri zapisovanju, pa tega takrat nisem niti opazil. To kaže na banalno zadevo. Na oko je nemogoče oceniti, ali so podatki na optičnem mediju še vedno dosegljivi ali pa niso. To lahko preverimo le tako, da CD vstavimo v pogon in poskušamo prebrati nekaj naključno izbranih datotek. Kdo bi naredil takšen preizkus pri zbirki nekaj sto ali celo nekaj tisoč medijev?

Kolikšna je življenjska doba nosilcev – to pot podrobneje
NosilecNizka kakovostVisoka kakovost
Magnetni trakovi
0,5-palčni trak5 let20 let
Videokaseta (VHS) 2 leti10 let
0,25-palčni trak2 leti10 let
Magnetni formati
348010 let20 let
3490/3490E20 let20 let
QIC/QIC-WIDE5 let10 let
Optični diski
Plošča CD5 let50 let (morda tudi več)
Magnetno-optični disk10 let30 let
Mikrofilmi
Za kopiranje10 let15 let
Za arhiviranje100 let200 let
Papir
Časopisi (visoka kislost) 10 let15 let
Revije (nizka kislost) 15 let100 let
Posebne izdaje (celuloza) 100 let500 let
Zgodovina
Egipčanske kamnite tabliceVeč kot 2200 let

KAKOVOST NI STALNA

Življenjska doba zapisljivih optičnih medijev je odvisna od stabilnosti uporabljene organske snovi, v katero laserski žarek »vrta« ali »peče« luknjice in tako zapisuje podatke. Skozi čas mora »luknjica« ostati relativno enake oblike, snovi iz okolice ne smejo reagirati na organsko snov, če želimo, da bo pogon še vedno lahko razpoznal podatke. Prvič, vsi proizvajalci medijev ne uporabljajo enake snovi, še huje je to, da se snov ali njena kakovost spreminja med serijami izdelanih medijev iste blagovne znamke enega proizvajalca. Drugič, proizvajalci imajo več blagovnih znamk, ki se med seboj razlikujejo po kakovosti in s tem po ceni. Mediji so čedalje cenejši, če jih ravno ne obremenjujemo s povračili za »neke« avtorske pravice, tako da so »nekateri« proizvajalci prisiljeni uporabljati cenejše surovine. Ker je pri DVD-jih uporabljena drugačna snov (pa tudi »luknjice« so manjše) imajo ti načeloma krajšo življenjsko dobo od CD-jev.

Le kot primer naj navedemo uradne številke nekega podjetja. Za našo zgodbo njegovo ime nima pomena. Tako pri CD-jih kot pri DVD-jih ima dve blagovni znamki, zlato in srebrno. Po njihovih trditvah zlati CD zdrži do 300 let, srebrni pa le 50 let, zlati DVD 100 let, srebrni pa le med 20 in 30 let. Kot sem dejal, je te podatke v praksi nemogoče preveriti. Nihče jih še ni, zato se običajno govori, da imajo DVD-ji rok trajanja okoli 20 let, potem pa medij začne degradirati in prej ali slej podatki na njem niso več »berljivi«. Vprašanje pa je še nekje drugje. Tudi če podatki zdržijo več kot 20 let, se moramo vprašati, ali bom takrat sploh imeli bralnik, ki bo znal prebrati format in način zapisa, ki smo ga danes za zapis podatkov uporabili. Tudi če arhivu medijev priložimo ustrezen pogon, je vprašanje, ali bo ta takrat sploh še deloval in ali ga bomo sploh lahko priključili na računalnik. Tudi vmesniki sčasoma spreminjajo.
Čisto legitimno je tudi vprašanje, ali bomo današnje podatke čez dvajset let še potrebovali. Odvisno od tega, kakšni so. Nekaterih zagotovo ne bomo, bomo pa veseli, če bomo lahko čez desetletja še vedno gledali fotografije, ki jih snemamo danes. Najmanj za ustrezne arhive teh boste pa le morali poskrbeti!

Marjan Kodelja | Zoran Banovič