Globoki splet je pot do informacij, ki niso za vse »oči«.
Trditev je delno resnična. Ljudje tam shranjujejo informacije, za katere nočejo, da bi jih lahko enostavno našel čisto vsak uporabnik spleta. Razlog za to pa je čisto človeški. Recimo, da gre za poslovne dokumente podjetji, ki so prek interneta dosegljivi zaposlenim, ne pa tudi vsej spletni javnosti. Logično, kajne? Ker teh dokumentov spletni iskalnik ne indeksira, so po definiciji del globokega spleta, vendar nimajo ničesar skupnega s kriminalom in deviantnim obnašanjem ljudi. So le ustrezno zaščiteni, da vsak do njih ne more priti.
Skrivanje informacij pred iskalniki je redko.
Trditev seveda ne drži. Večina spletnih strani skrije del svoje vsebine spletnim iskalnikom. Spletna stran vsebuje dve datoteki, robots.txt in sitemap.xml, ki »pajkom« spletnih iskalnikov povesta, kaj lahko pogledajo (indeksirajo) in česa ne. Preprosto zato, ker je tisto, kar želijo skriti, običajno polno tehničnih stvari, ostankov programiranja in še česa, kar je ostalo po razvoju spletne strani. Ne skrivajo se bistvene informacije, temveč stvari, ki bi lahko zmedle »pajke«. Po definiciji pa tudi te sodijo v globoki splet.
Strani, ki preverjajo obiskovalce, ali so človek ali programski »pajek«, gotovo nekaj skrivajo.
Gre za strani, kjer moramo na primer vnesti na zaslonu slabo viden niz številk in črk (Captchas), preden nas spustijo naprej, izvedejo iskanje po strani ali dovolijo registracijo na storitev. Tu ni ničesar, kar bi lahko povezali z željo po skrivanju. Skrbnik strani preprosto noče, da bi vsebino »pregledovali« programski »pajki«. Vsebina je ljudem dosegljiva, po definiciji pa lahko sodi v globoki splet, če je iskalniki ne morejo indeksirati.
Freenet, Tor in sorodna omrežja so del globokega spleta.
Trditev drži. Freenet je osnova za distribucijo vsebin, zgrajena okoli tehnologije VPN, Tor pa nekaj podobnega, le da je zgrajen okoli veliko anonimnih vozlišč. Iskalniki nimajo mehanizmov, s katerimi bi lahko pogledali v zakodirane seje (transakcije) uporabnikov teh omrežji. Spet pa to ne pomeni, da se znotraj teh mrež dogajajo le nezakonite stvari. Navsezadnje tudi veliko podjetji uporablja varne sisteme za poslovanje prek interneta, katerih vsebin iskalniki ne dosežejo. Večina dogajanja znotraj teh omrežji je za ljudi nezanimiva, ker ni nič zanimivega, iskalnikov te zadeve ne zanimajo. Po definiciji pa so del globokega spleta.
Globoki splet je ogromen.
Trditev še kako drži. Vzemimo primer informativne spletne strani podjetja. Ta je običajno velika največ nekaj megabajtov, kar je seveda le delček informacij, ki jih to podjetje hrani na svojih strežnikih in ki so dostopne prek interneta zaposlenim. Spletna stran sodi v vidni splet, vse ostalo pa v globoki. To je povsem vsakdanji primer, saj podjetja svojih poslovnih podatkov ne objavljajo javnosti. Ta je upravičena le do tega, kar podjetje misli, da je za objavo. Po definiciji sodijo na globoki splet tudi vsi dokumenti, ki jih imamo v Googlovih storitvah (Google Drive, Picasa, Documents), vendar jih nismo označili kot javne. Informacij, ki niso dosegljive spletnim iskalnikom, je še veliko, večina je popolnoma nezanimiva ali zanimiva le za redke, kljub temu pa je to vzrok, zakaj je globoki splet veliko večji od vidnega.
Moj mikro, Junij 2012 | Marjan Kodelja | Zoran Banovič |