In ta novost naj bi temeljila na teoriji iger. Če se izrazimo malce znanstveno – teorija iger se ukvarja z razvojem matematičnih modelov za prepletene optimizacijske probleme več akterjev oziroma igralcev. Pri neželeni pošti oziroma spamu so igralci na eni strani ponudniki storitev elektronske pošte, na drugi pa pošiljatelji spama. Oba igralca oziroma akterja imata svoje cilje, ki jih je mogoče zapisati z uporabo optimizacijskega kriterija – ponudnik elektronske pošte želi filtrirati sporočila tako, da odstrani čim več neželenih sporočil, in se pri tem čim manjkrat zmoti (za spam označi legitimno sporočilo), pošiljatelj spama pa hoče svoji stranki, pa naj gre za prodajalca »zdravil« ali rezultate ribarjenja gesel, maksimirati učinek. Matematični opis oziroma model mora oba cilja nekako preplesti in iz tega nekako izračunati optimalen način zaščite. Cilja »igre« obeh akterjev sicer nista enaka, gre pa za nerešljiv konflikt med obema, kar sodi v domeno teorije iger. Kako?

V igri, kjer imamo dva igralca, ima vsaka stran na voljo določeno število strategij. Matematično izraženo bi se temu reklo, da ima vsak igralec na voljo »akcijski prostor« oziroma nabor potez. Ponudnik elektronske pošte lahko na primer vsaki besedi dodeli »spam-score«, kot to počnejo besedilni filtri neželene pošte, pošiljatelj pošte pa lahko spreminja vzorce besedil, namesto »viagra« recimo napiše »v1@gra«. Če bi bil nabor potez obeh igralcev končen, kot na primer pri šahu, kjer se ve, kam je mogoče prestaviti kakšno figuro, bi bila težava dokaj preprosta. A pri spamu gre za neskončno število mogočih potez. Ponudnik pošte lahko vsaki besedi doda poljubno oznako »spam score«, pošiljatelj pa lahko najde nešteto načinov zapisa določene besede. Je pa kljub temu nekaj oprijemljivih stvari. Ena je na primer ta, da oba akterja vesta, da imata oba na voljo neskončno število potez. Druga je ta, da oba poznata zgodovino svoje dejavnosti in lahko iz preteklih potez povzameta marsikatere koristne sklepe. Ali torej obstaja optimalna strategija preprečevanja spama?

Zadeva je malce zapletena, a spet logična. Zaščita pred spamom je odvisna od tega, za katero strategijo se odloči pošiljatelj oziroma od spremembe vzorca sporočil glede na pretekla sporočila. Na drugi strani pa velja, da bo dobiček naročnika odvisen od tega, kakšen »spam-score« bo filter pošte dodelil sporočilu. V obeh primerih gre za nekaj, kar z zornega kota nasprotnika ni mogoče napovedati, o potezah nasprotnika je mogoče govoriti le v obliki možnosti znotraj akcijskega prostora. V takšnem primeru izračunati, kaj se bo zgodilo, privede do neskončne zanke tipa »če on misli, da jaz mislim, da on misli …« Kaj torej storiti?

NASHEV FILTER

Čudovite rešitve se je že leta 1950 domislil matematik John Nash, ki je zanjo leta 1994 dobil Nobelovo nagrado za ekonomijo. O njem je bil posnet tudi film Čudoviti um, saj je njegova življenjska zgodba izredno zanimiva. Teorijo je zastavil leta 1950, star le dvajset let. Nato pa se ga je lotila paranoidna shizofrenija, ki je povzročila, da je skoraj celotna naslednja tri desetletja prebil v različnih umobolnicah. Medtem pa je njegov matematični dokaz postal temelj sodobne ekonomske teorije, za kar so ga, kot smo zapisali, leta 1994 nagradili z Nobelovo nagrado. In kaj je bistvo Nasheve torije? Preprosto povedano gre nekako takole: Če imam dva igralca in se oba obnašata racionalno, potem bosta oba iskala način oziroma rešitev, kako maksimirati svoje cilje. Če se oba igralca zanašata na to, da se enako racionalno obnaša tudi nasprotnik, potem govorimo o Nashevem ravnotežju, saj obe strategiji maksimirata uspeh obeh igralcev. Če bi katera koli stran enostransko odstopila od te strategije, bi to pomenilo zmanjšanje učinka za to isto stran. Do tu vse lepo in prav, a se sliši malce čudno – ali to pomeni, da se bomo morali sprijazniti s tem, da bo določeno število neželenih sporočil vedno prišlo k nam? Točno to! Spamerji bodo vedno našli nove vzorce, kako obiti filtre. To je podobno kot bolezni in zdravila, kjer nikoli ne bomo imeli zdravil za vse bolezni, saj se bodo pojavljale nove. Gre za to, da se količina neželene pošte, ki »pobegne« skozi filtre, drži na čim nižji ravni. Raziskovalna skupina univerze v nemškem Potsdamu je ugotovila, da če nad sporočili uporabijo filter, ki upošteva Nashevo ravnovesje, in to primerjajo z običajnim filtrom, so rezultati Nashevega filtra neprimerno boljši. Zadevo so testirali tako, da so oba filtra najprej »naučili« oziroma vanju vstavili vzorce 6000 neželenih sporočil. Nato so oba filtra uporabili na 65.000 javnih in 40.000 privatnih sporočilih. In rezultati so bili občutno v prid Nashevemu filtru. Pri obeh se je seveda stopnja prepoznavanja neželene pošte s časom znižala, saj so si spamerji v času eksperimenta izmislili nove vzorce, a stopnja prepoznavanja je pri Nashevem filtru upadala precej počasneje. Začetna stopnja prepoznavanja je bila pri obeh filtrih najprej skoraj 100-odstotna, pri pregledanih skoraj 65.000 sporočilih pa je Nashev filter prepoznal 98,5 odstotka sporočil, običajen filter pa 97,7 odstotka, kar je, če to prenesemo v število sporočil, 520 sporočil, ki jih je Nashev filter našel, običajen pa zgrešil. In podobno je bilo pri zasebnih sporočilih, le da so bili tam odstotki prepoznavanja višji.

Kaj je torej bistvo Nashevega filtra? Gre za to, da se z njim premosti največja slabost obstoječih metod – čas, ki ga potrebujejo za to, da ponudniki odkrijejo napad in nanj odreagirajo. Pri Nashevem filtru je namreč tehnološki razvoj spamerja že »vračunan«, zato se ravnovesje vzpostavi skoraj takoj, ko spamer spremeni svoje metode napada. Zaščita seveda ni stoodstotna, je pa precej učinkovitejša od obstoječe.

In kdaj bomo metodo lahko našli v praksi? Za zdaj gre za laboratorijske preizkuse omenjene nemške univerze. Sledilo bo matematično optimiranje procesa odkrivanja, nato pa živ preizkus pri nemškem ponudniku interneta Strato. In ko bo zadeva tako daleč, da bo uporabna za komercialno rabo, jo bodo ponudili javnosti. O tem, kdaj bo to, pa avtorji še ne govorijo.

Moj mikro, oktober 2010 | Zoran Banovič