Veliki podatki (big data) so »zvenečnica« računalniške industrije, opevajo se prednosti za podjetja, manj pa slabosti, ki jih bomo deležni uporabniki. Na situ je, kot velikokrat do zdaj, naša zasebnost. Neotipljiva stvar, katere zavedanje je med uporabniki na nizki ravni. Ne gre le za nadzorne sisteme, ki kot gobe po dežju rastejo na vsakem koraku, in za Snowdnovo razkritje nečednega početja Američanov. Bolj bi nas moralo skrbeti, kaj z našimi podatki počnejo zasebna podjetja. Služijo denar! Facebook je tipičen predstavnik takšnega podjetja, z milijoni uporabnikov po vsem svetu. »Dobro bi služil, če bi uvedel letno naročnino 10 dolarjev in uporabnikom ponujal enako storitev, vendar brez razkrivanja podatkov. Pa tega ne počne, ker več služi z njihovo prodajo,« je na srečanju v Ljubljani povedal Joseph A. Cannataci, profesor na nizozemski univerzi Rijksuniversiteit Groningen. Dodal je še, »da enako velja tudi za Google, ki ne bi bil uspešen, kot je, če ne bi 'bral' pošte uporabnikov storitve Gmail«. Facebook ne bi obstajal brez osebnih podatkov svojih uporabnikov. Se lahko proti temu sploh borimo? In kako? Če na primer evropski politiki dvignejo glas, trčijo v zid vmešavanja v ameriške gospodarske interese. To pa je enako, kot da bi Američanom napovedali vojno. Omenjena podjetja imajo strežnike tudi drugod po svetu, vendar so kot ameriška podjetja podvržena njihovemu razumevanju zasebnosti in posledično človekovih pravic, ki je v veliki meri milejše od razumevanja te problematike v Evropi.
Priča smo stari igri med patriciji in plebejci, a z novimi tehnikami. Plebejci ustvarjamo podatke; 90 odstotkov »svetovnih« podatkov, podatkov, ki so nastali v človeški civilizaciji, je nastalo v zadnjih dveh letih. Za tri četrtine teh pa smo zaslužni individualni uporabniki interneta. Vse, kar v njem storimo, pusti nekje zapis. Obiščemo spletno stran, pošljemo poštno sporočilo, premaknemo datoteko z ene lokacije na drugo. Patriciji z analizo te ogromne količine podatkov pridobijo moč nad nami. »Dokler velja načelo proporcionalnosti, lahko govorimo o posameznikovi svobodi, ko to pade, te ni več,« meni Nataša Pirc Musar, informacijska pooblaščenka. Pri tem je dodala, da imamo tudi v Sloveniji, z eno boljših zakonodaj varstva zasebnosti, dvoumne situacije. Če želi policija na primer nadzirati komunikacije, mora pridobiti sodni nalog. Slovenski obveščevalni varnostni agenciji (SOVA) je prepovedano prisluškovati na slovenskem ozemlju, če pa želi prisluškovati v tujini, potem je dovolj, da to dovoli njen direktor. Nič neobičajnega, enako velja za večino svetovnih tovrstnih agencij. Težava se pojavi zaradi načinov sodobne komunikacije, ko lahko komunikacija poteka tudi po poteh zunaj Slovenije, kar v teoriji omogoča, da SOVA lahko prisluškuje tudi Slovencem. Musarjeva je kot problem neproporcionalnosti omenila dogovor med EU in Ameriko, sklenjen kmalu pa začetku vojne proti terorizmu, o pošiljanju podatkov o finančnih transakcijah. Podatki dnevno odtekajo prek Atlantika, v Evropi pa se nihče ne vpraša, za kaj jih Američani potrebujejo.
Kakšno vlogo imajo pri tem veliki podatki, kaj sploh so, bomo razložili v nadaljevanju. Vohunjenje, nadzor, ciljno oglaševanje niso mogoči brez sistemov, ki v zbranih podatkih iščejo vzorce. Ti vzorci pa so lahko iskani kriminalec, terorist ali preprosteje vedenjski profil uporabnika. Napačno je mišljenje, da če na internetu ne puščamo osebnih podatkov, v ozkem razumevanju tega termina, potem nas nihče ne more identificirati. Vedenje na internetu oziroma vse, kar tam počnemo, je skoraj tako unikaten vzorec kot prstni odtis in dovolj zmogljivi sistemi lahko posameznika izluščijo iz anonimnosti. Več kot imajo na voljo podatkov, večji kot je digitalni kup sena, lažje v njem prepoznajo posamezne igle. Podatki na kup pritekajo iz različnih virov, kar pomeni, da je ta vsak dan večji. Pravi rudnik zlata za vohune, policiste, pa tudi za podjetja, ki znajo podatke spremeniti v denar. Sistemi (računalniki in programska oprema) in specialisti, ki jih upravljajo, so dragi, zato državne organizacije analizo podatkov zaupajo zasebnim podjetjem. Zanje sicer veljajo enaka pravila varovanja podatkov, vendar je nadzor nad njihovo dejavnostjo ohlapnejši. Ali pa ga ni. Podatki, ki so jih zbrale državne organizacije, končajo v rokah zasebnikov, kar bi nas verjetno moralo vsaj malo skrbeti.
Velikih podatkov ne bi bilo brez načrtnega zbiranja, ki poteka na različne načine. Večino podatkov pridobijo iz legalnih virov, z novičarskih strani, družabnih omrežij, iz javnih vladnih gradiv, javno objavljenih znanstvenih raziskav. Mnogo teh podatkov je opremljenih tudi z lokacijskimi oznakami. Dodajmo temu še nelegalne vire, prisluškovanje, vdore v sisteme in pa na enem mestu zbrane podatke nadzornih sistemov (videokamer, mikrofonov …). Nikoli v človeški zgodovini ni bilo mogoče na enem mestu zbrati toliko podatkov, do nedavno to ni bilo niti uporabno, saj računalniki niso bili dovolj zmogljivi, da bi v doglednem času z analizo teh podatkov prišli do uporabnih zaključkov. Danes je položaj drugačen. Vsa večja računalniška podjetja razvijajo sisteme velikih podatkov, razvijajo nove tehnologije in jih ponujajo trgu. Še vedno pa gre za kompleksne sisteme, katerih zapletenost eksponentno raste z rastjo količine podatkov, zato si jih lahko privoščijo le največji.
Uvod teme o velikih podatkih bom sklenili z anekdoto o agenciji NSA, ki jo je povedal profesor Cannataci. Danes vemo, da so Američani agencijo NSA ustanovili po napadu Japoncev na Pearl Harbour, s ciljem, da se takšni napadi presenečenja ne bi nikoli več zgodili. Ljudje so vedeli, da agencija obstaja, vendar Amerika uradno obstoja dolgo časa ni priznala. Do sredine osemdesetih let prejšnjega stoletja, ko je neko podjetje objavilo oglas o uničevalcu papirja, ki je sposoben v eni uri uničiti več kot šest ton papirja. In ki naj bi ga uporabljala ravno NSA. Čemu bi kdor koli sploh potreboval tako zmogljiv uničevalec? Izkazalo se je, da NSA prisluškuje teleks komunikacijam, pri čemer je nastalo ogromno papirja, tega pa je bilo treba po uporabi uničiti. Podobno velja tudi za zadnji škandal. Vedeli smo, da prisluškuje in kopiči podatke, vendar je NSA to redno zanikala. Zdaj ne more več zanikati, obrniti mora ploščo in spremeniti svoj odnos do javnosti.
Pojem zasebnosti je mogoče razumeti na več načinov, v digitalnem svetu pa lahko govorimo o treh, med seboj povezanih »zasebnostih«, ki tvorijo celoto. Informacijska zasebnost pomeni, da so naši podatki varni in zunaj dosega radovednih oči. Komunikacijska zasebnost pomeni, da so varne komunikacijske poti, da na njih ni prisluškovalnih naprav. Tretja, v zadnjem času zaradi prodora pametnih telefonov vse bolj pereča pa je lokacijska zasebnost, saj je lahko podatek o lokaciji uporabnika v nekem trenutku zgovornejši kot drugi podatki, ki so o njem na voljo na internetu.
Moj mikro, September Oktober 2013 | Marjan Kodelja |