Po podatkih analitske hiše IDC povprečen ameriški pisarniški delavec letno ustvari 1,8 milijona megabajtov podatkov. V to so vključeni prenosi vsebin s spleta, dokumenti v digitalni obliki, pretežno besedila, poštna sporočila in biti, ki jih ustvari računalnik med prenosom informacij prek računalniških omrežij in interneta. Večine teh podatkov uporabnik ne vidi, na prvi pogled pa so tudi brezosebni. Pa so res? Znanstveniki, ki raziskujejo velike podatke, opažajo, da se skoraj vsak »tip« podatka lahko uporabi kot prstni odtis za identifikacijo osebe, ki ga je ustvarila. Film, ki ga je izbral in prenesel iz tovrstnih storitev, lokacijski podatki mobilnega telefona, ki jih zbirajo mobilni operaterji, vzorec gibanja, ki ga posnamejo nadzorne kamere v večjih mestih. Več kot je podatkov, težje govorimo o zasebnosti, saj bogastvo podatkov naredi posameznikovo identifikacijo algoritemsko mogočo.
Največkrat slišimo o tako imenovanem profiliranju uporabnikov, ki se ga gredo ponudniki storitev, kot sta Facebook in Google. Nimata le podatkov, ki so javno dostopni vsem uporabnikom spleta, temveč tudi tako imenovane prometne podatke. Kdaj se je uporabnik prijavil v storitev, katere profile je obiskal, kaj je všečkal, katere vsebine je iskal, koliko časa se je v storitvi zadržal, od kod je vanjo vstopil in kam je šel, ko jo je zapustil. Podatke nevede puščamo vedno, ko uporabljamo spletne storitve, in čeprav ne spadajo v ozko definicijo osebnih podatkov, so zgovorni. Ne povedo le, kaj so interesi ali želje uporabnikov, pač pa še veliko več, na primer spolno orientacijo, kot je pokazala ena zadnjih tovrstnih raziskav.
Profiliranje uporabnikov samo po sebi ni grožnja, vsaj dokler je upoštevano načelo proporcionalnosti. To besedo smo do zdaj omenili že večkrat, ker je bistvena za svobodo posameznikov. Dokler za podatke, ki smo jih nevede pustili na internetu, kljub temu pa so naši, dobimo enako ali več, kot zaradi tega izgubimo, potem smo načelno zadovoljni. Ko pa je obratno, in največkrat so v sodobnem svetu človekove pravice neproporcionalno kršene zaradi varnostnih razlogov, pa ne moremo več govoriti o pozitivni izrabi tehnologije. Zavedanje uporabnikov, čemu vsemu so izpostavljeni med uporabo interneta, je zato bistveno pri ohranjanju posameznikove svobode.
Obstoječa pravila o varstvu podatkov v svetu velikih podatkov ne delujejo. Operaterji zbirajo prometne podatke svojih uporabnikov določen čas, po tem pa so dolžni iz njih izbrisati vse osebne podatke (anonimizirati). Obširnejša je ta baza brezosebnih podatkov, manj je verjetno, da je res taka. Vzemimo primer baze podatkov mobilnih operaterjev, ki jo ti največkrat naredijo brezosebno tako, da iz vseh zapisov izbrišejo telefonske številke – enovita označba, ki vedno pripelje do uporabnika. Kot take pa jih lahko tudi prodajajo. Še vedno pa so v tej bazi lokacijski podatki, mesta, kjer so bile storitve opravljene. Raziskovalca ameriškega inštituta MIT Yves-Alexandre de Montjoye in César A. Hidalgo pa sta pokazala, da lahko dostikrat že poznavanje štirih položajev, kjer je uporabnik telefon uporabljal, v kombinaciji z drugimi javno dostopnimi podatki identificira telefon, prek njega pa tudi njegovega lastnika.
Malce drugače povedano: v svetu velikih podatkov je zasebnost uporabnikov obratno sorazmerna s količino brezosebnih podatkov o njem, ki so analitiku na voljo. Manj kot je podatkov, večja je zasebnost, ko pa je podatkov preveč, zasebnosti ni več.
Moj mikro, September Oktober 2013 | Marjan Kodelja |