Inteligentni računalniki so tehnološke sanje že nekaj desetletij. Pravzaprav vse od koraka, v katerem so elektronska računala preskočila osnovne računske operacije v nekaj več. Ideja je svojo pot našla tudi v knjige in seveda filme ter prek njih burila domišljijo milijonov ljudi po vsem svetu. Pri tem pa seveda ni šlo za neki konsenz o tem, ali je imeti pametni stroj/računalnik nekaj dobrega ali slabega. Znanstveniki in tehnološki navdušenci seveda vidijo inteligentne naprave kot orodje dobrega – nekaj, kar bo pomagalo zdraviti bolezni, pomagalo ljudem pri najtežjih opravilih in prevzemalo določena vsakodnevna bremena uporabnikov, s čimer bo njihovo življenje bolj kakovostno. Knjige in filmi so tu manj optimistični, saj inteligentne stroje velikokrat predstavljajo kot nekaj, kar se bo neizogibno izrodilo in se na tak ali drugačen način obrnilo proti človeštvu. Tako so nastali Terminator, WarGames, Transcendence in še kup drugih tovrstnih filmov. Seveda je vsakdanjost bistveno manj dramatična, saj je revolucija umetne inteligence (UI) šla svojo pot brez svetovne kataklizme. A to ne pomeni, da ne bomo deležni nobene revolucije več. Pravzaprav je tako, da jo ravnokar živimo. In to vsakodnevno.

V zadnjih letih so najprej računalniki, nato pa še mobilne naprave prešli iz pasivnih spremljevalcev, katerih samostojnost se je odražala skoraj izključno v samodejnih posodobitvah in kakšnih alarmih v koledarju, v naprave, ki nenehno spremljajo našo komunikacijo in čakajo na ustrezne besede, ki pomenijo, da si uporabnik želi njihovo pomoč. Naprave tiho zbirajo podatke o tem, kaj imamo radi, o čem se pogovarjamo, kje se gibljemo, kakšne so naše vsakodnevne navade in opravila. Osnovni namen vsega tega je, da bi nas sistem umetne inteligence v napravi lahko bolje »razumel« in nam čim bolj »pomagal«. In s tem ko naprave postajajo vse bolj tehnološko dovršene, naša komunikacija z njimi pa vse bolj preprosta, ni treba imeti pretirano žive domišljije, da si znamo predstavljati čas, ko bo naš pametni telefon o nas vedel več, kot vemo sami. Zato se postavlja vprašanje, kako pametne želimo, da naj bodo naše mobilne naprave, in kako daleč smo do tega stanja.

DIGITALNI OSEBNI POMOČNIKI

Konec leta 2011 je Apple na trg poslal svoj 4s, najnovejši model iz serije iPhone, in se lotil reklamiranja zadeve na zelo neobičajen način. V reklamah se ni hvalil s tem, kako je z novo napravo luštno telefonirati, kako dober fotoaparat ima, kako varen in kako dobro narejen je, ampak je njegova kampanja temeljila bolj ali manj na eni sami funkciji, bolje rečeno programu, ki je bil poleg tega še v beta različici. A kljub temu je Siri postala zvezda, in to čez noč. Nenadoma so se v oglasih začeli pojavljati znani obrazi, kot so John Malkovich, Zooey Deschanel in podobni, ki se o juhi, dnevnih opravilih in čisto igralskih temah niso pogovarjali s kakšnim prijateljem ali sodelavcem, ampak kar s svojim – telefonom. Pri tem pa ni bilo toliko pomembno to, da takšen program obstaja, saj je podobne sisteme pred tem predstavil že marsikdo, tudi Samsung in Microsoft, ki veljata za največja Applova tekmeca. Bolj pomembna je bila preprostost in lahkotnost uporabe oziroma interakcije s telefonom.

Seveda bo ob omembi Siri vsak resnejši uporabnik dvignil obrv. Siri še zdaleč ni tako kakovosten »osebni digitalni pomočnik«, kot ga poskuša predstaviti Apple. Temelji namreč na sistemu prepoznave govora, ki pa je tehnološko še dokaj daleč od nečesa, kar bi lahko bilo širše uporabno. Že nekdo s šibkim naglasom ima lahko precejšnje težave, da o težavah pri nihajoči kakovosti internetne povezave niti ne govorimo. Narobe razumljeni ukazi, besede in popolna ohromitev sistema, če nimamo na voljo internetne povezave, so uporabnike pripeljali do tega, da so raje to, kar bi radi, kar odtipkali. Toda ko je zadeva delovala, pa je bilo vse skupaj videti kot čarovnija. In zato lahko rečemo, da se je s Siri začela prihodnost.

Dve leti po Siri je mogoče takšne ali drugačne osebne digitalne pomočnike najti na skoraj vseh računalniških platformah. V najnovejših androidnih napravah in računalnikih Chromebook najdemo Google Now, torej Googlov odgovor na Siri, Samsung je razvil izdelek, imenovan S-Voice, Microsoft pa je pred kratkim napovedal in za ameriški trg izdal svojo Cortano, ki je svoje ime dobila po UI-osebi iz priljubljene igre Halo.

Microsoft v Cortano polaga precejšnje upe. Najprej seveda kot nekaj, kar naj bi Windows Phone 8.1 postavilo na mesto, na katerem si Microsoft želi biti, torej na vrh, pozneje pa tudi kot nekaj, kar bi lahko bilo sistem za interakcijo z računalnikom v vseh okoljih Windows. Joe Belfiore, vodja programa Windows Phone pri Microsoftu, razlaga razvoj Cortane takole: »Cortana je bila zamišljena kot digitalni osebni pomočnik, zato smo se pri njenem snovanju najprej obrnili na realne osebne pomočnike iz mesa in krvi, da bi videli, kaj vse obsega njihovo delo. Ugotovili smo, da je ena od tehnik, ki jih ti pomočniki uporabljajo, tudi beležnica, v katero si zapisujejo interese, navade in želje svojih strank. In to seveda počne tudi Cortana – zapisuje si vse, kar ve o meni, jaz kot uporabnik pa lahko te osebne podatke vedno pregledam.«

Googlov izdelek se imenuje Google Now, gre pa za sistem, ki je odgovoren za beleženje uporabnikove zgodovine internetnega iskanja, lokacije in splošnih navad, iz pridobljenih podatkov pa se nato izdela profil, prek katerega nam sistem ponuja pomoč pri uporabi naprave.

Iz zapisanega je razvidno, da je zbiranje podatkov ključnega pomena vsakega sistema umetne inteligence, saj šele na osnovi teh lahko pridemo do sistemov odločanja. Odločiti iz nič se ne more niti človek, kaj šele »neumen« stroj. Pri digitalnih osebnih pomočnikih ima zbiranje podatkov še eno pomembno dimenzijo – varnost oziroma zasebnost. Naprave, na katerih so ti podatki shranjeni, so običajno povezane v internet, v primeru pametnih telefonov pa tudi tako majhne, da jih uporabniki nosimo s seboj, kar pomeni, da jih je mogoče tudi izgubiti ali pa nam jih ukradejo. Zato je eno od pomembnih vprašanj tudi to, koliko svoje zasebnosti smo pripravljeni deliti s takšnim pomočnikom. Google Now se osredotoča predvsem na to, kaj počnemo v internetu, in je nekoliko manj »oseben«, Cortana pa je bolj radovedna, a jo je zato mogoče dokaj dobro omejiti, čeprav ni popolnoma jasno, kaj vse ve o nas.

Povej, kaj bi rad

Pomemben del UI je torej zbiranje podatkov. A ti seveda niso omejeni le na podatke iz imenikov, zgodovine brskanja, preteklih pogovorov in sorodnih aktivnosti. Podatki so tudi ukazi, vprašanja in podobne vrste komunikacija. Pri tem pa seveda pride do izraza sposobnost računalnika te elemente najprej sprejeti. In tu pride na vrsto prepoznava govora. Pri namiznih računalnikih in prenosnikih, kjer imamo tipkovnico, prek katere lahko želene ukaze dokaj hitro vnesemo v računalnik, vse skupaj mogoče niti ni tako pomembno in služi bolj kot zanimivost, pri mobilnih napravah, kjer je tipkanje podobno obisku pri zobozdravniku, pa je način vnosa s pomočjo govora še kako koristna zadeva.

Še pred nekaj leti smo o prepoznavi govora govorili kot o eksotiki, ki je še daleč od stanja vsakdanje uporabnosti. Danes je stanje takšno, da je uporabnost še vedno zelo omejena, saj je na voljo le za »velike« jezike, in še pri njih za bolj ali manj knjižno izgovarjavo. Res pa je, da so sistemi precej napredovali in da jih je mogoče celo uporabljati v vsakdanje namene, ne le kot hvalisanje z novim pripomočkom na zabavi. Google, na primer, omogoča zvokovno iskanje, kjer je mogoče iskan pojem vnesti prek mikrofona, v nekaterih primerih pa vam bo Google rezultate lahko celo prebral. V zadnjih različicah je iskalniku mogoče celo postavljati vprašanja. Če ga na primer vprašamo, kdaj je izšel neki znan film, bo Google to razumel, če pa boste v nadaljevanju vprašali, kdo je igral v njem (torej boste uporabili besedo »njem«, in ne naslov filma), bo razumel tudi to. Prek Google Maps in uporabe GPS-sistema lahko na zvokovni način tudi »vprašate« za pot.

Najverjetneje se niste zavzeli, toda podobna zvokovna orodja imajo tudi sistemi Windows. In to že nekaj časa, natančneje od Viste naprej. Razlog, da se niste zavzeli, je predvsem v tem, da sistem ni na voljo za slovensko različico Windows.

A če so se sistemi prepoznave govora v preteklosti razvijali dokaj počasi, se zadnja leta obeta pospešen razvoj. To pa zato, ker postajajo osrednja komunikacijska točka mobilni telefoni in tablični računalniki, in ne več osebni in prenosni računalniki. In ker gre pri mobilnih napravah za finančno zelo zanimiv trg in ker mobilne naprave običajno nimajo tipkovnic oziroma so te le omejeno uporabne, se najrazličnejša podjetja, inštituti in tudi univerze pospešeno ukvarjajo s tem, kako narediti prepoznavo govora bolj učinkovito. Navsezadnje v mobilni telefon tako ali tako že govorimo, ko se pogovarjamo, torej nam manjka le še korak do tega, da mu bomo tudi ukazovali.

Ampak prepoznava govora je nekaj, kar je ustreznik recimo optičnemu prepoznavanju besedila (OCR). Gre za prepoznavanje in interpretiranje vzorcev. Tu kaj dosti umetne inteligence ni. Seveda ne. Gre za to, da gre za sistem zajemanja podatkov, odločanje pa leži drugje. V nečem, čemur pravimo umetna inteligenca. To je sistem, ki iz vseh zbranih podatkov izlušči to, kar nam lahko le koristi. Cortana, na primer, omogoča, da ji ukažemo, naj nas naslednjič, ko bomo govorili s Petrom, spomni na to, da ga prosimo, ali nam posodi kosilnico. Cortana nato spremlja, s kom se pogovarjamo, in ko ugotovi, da kličemo Petra, nas opozori na kosilnico. No, to je recimo eden od primerov, kako naj bi umetna inteligenca, skupaj z zajemom podatkov in prepoznavo govora, naredila osebne digitalne pomočnike za nekaj uporabnega.

A pri tem naletimo na težavo, ki je ta trenutek v mobilni sferi še kako pereča – prepočasna internetna povezava. Pa saj imamo 3G, 4G, 5G LTE in še kup drugih kratic, boste rekli. Da, imamo, vendar so prepočasne. Večino dela sistemi namreč opravljajo v oblaku, torej ne v napravi, saj je le tako mogoče zagotoviti ustrezno procesorsko moč. Nekatere osnovne funkcije, recimo prepoznavo govora, imamo lahko na lokalni napravi, a te so omejene na »pokliči Petra«, »zaženi predvajalnik glasbe« in podobno, česa bolj zapletenega pa te naprave niso zmožne, saj preprosto nimajo ustrezne procesorske moči. In tako bo ostalo še kar nekaj časa. Oblak bo na tem področju vladal še, tehnološko gledano, zelo dolgo.

In kaj je tako zapletenega? Oglejmo si primer, kjer UI v mobilnih napravah pride najbolj prav – v avtomobilu. Vzemimo, da imamo bolj malo goriva, zato mobilni napravi ukažemo »najdi najbližjo bencinsko napravo«. To je načelno zelo preprosto – mobilni telefoni z vgrajenim GPS-sistemom in tudi namenske navigacijske naprave imajo v svojih podatkovnih bazah podatke o bencinskih servisih, in ker znajo ugotoviti, kje smo, je iskanje poti do servisa dokaj preprosto. Če pa bomo v trenutku iskanja priključeni v oblak, pa je lahko celoten scenarij neprimerno bolj kompleksen. Sistem ve, da njegov uporabnik Marko zbira Petrolove točke, iz lokacijskega sistema ve, da se vozi po avtocesti iz Maribora v Ljubljano, ve pa tudi, da ima bencina dovolj še za okoli 60 kilometrov, zato mu bo predlagal le Petrolove bencinske servise na poti v smeri Ljubljane, ki so toliko oddaljeni od Marka, da ne bo ostal na cesti. Pri izračunu bo preveril še, ali so na poti do servisa kakšni zastoji, in tudi to upošteval pri predlaganih rešitvah. Toda za to potrebuje povezavo v internet. Če te ni, postane mobilna naprava navaden opomnik, v katerega moramo ročno vpisovati sestanke in podobne aktivnosti.

V avtomobilih, ki so, kar zadeva UI, dokaj hvaležna stranka, je takšnih idej in rešitev še veliko in veliko jih že deluje – iskalniki hotelov, parkirni pomočniki in še kaj bi se našlo, vendar so te rešitve dokaj razdrobljene in zato nerodne za uporabo. Največji izziv bo vse skupaj spraviti pod neko skupno streho in s tem uporabniku omogočiti, da svoje potrebe zadovolji na enem mestu. Zdaj so na primer lokacijske storitve na osebnem računalniku ena aplikacija, parkirni pomočnik pa druga, skupna uporaba pa pogosto ni mogoča, posebej pa ne prenos na mobilno napravo. In prav to je največji izziv sodobnih digitalnih osebnih pomočnikov.

Avtomobil je za tovrstne storitve res najbolj primeren prostor. V avtu potrebujemo sistem prepoznave govora, saj je tipkanje med vožnjo nevarno, iz enakega razloga mora prek govora potekati tudi upravljanje opravil, prejemanje in pošiljanje elektronske pošte, usposobljen mora biti sistem pretvorbe besedila v govor, da naš pomočnik lahko sporočila prebere, prek govora moramo opravljati tudi spletna iskanja, če pa lahko rezultate uporabimo še kje drugje, pa bi bila zadeva sploh idealna. Ali ne bi bilo zabavno, recimo, avtomobilu ukazati »poišči kitajsko restavracijo«, ta pa bi nam nato prebral rezultate, in ko bi se odločili za eno od njih, bi mu ukazali »pelji me tja« in nove koordinate bi se vnesle v navigacijski sistem? In vse brez tipkanja in pogleda na zaslon naprave. No, Google, Blackberry, Apple in nekateri proizvajalci navigacijskih naprav se krepko trudijo izdelati avtomobilskega pomočnika, ki bi znal podobne stvari.

Ideje pa seveda segajo še naprej. Tako imenovani »internet stvari« (internet of things) počasi postaja resničnost. Naslednji logični korak je povezava različnih senzorjev, »agentov« ali kakor koli že imenujemo samodejne vhodne naprave. Tako bo hladilnik recimo vedel, kaj je v njem, in se povezal s koledarjem, v katerem bo preveril, ali imamo načrtovano kakšno družabno večerjo ali kaj podobnega, in nas opozoril, da bo treba po nakupih. Televizijski sprejemniki bodo prek biometrične tehnologije prepoznali naše glasove in programe na televiziji razvrstili tako, da bodo na kupu tisti, ki jih najraje gledamo. Ali pa bo mobilna naprava v avtomobilu ugotovila, da se bližamo domu, in bo ustrezno prilagodila temperaturo, prižgala luč nad vhodnimi vrati.

Toda kdo?

Vse to je lepo in prav, vendar se bo na tem področju dogajalo tudi marsikaj grdega. Težava bo stara – kdo bo postavil »standard«. Glede na to, kako stvari stojijo zdaj, so neki skupni standardi, ki bi omogočali, da nekdo z Nokijinim telefonom komunicira s Samsungovo televizijo, LG-jevim hladilnikom in tako naprej, skoraj nemogoči. Zato se bo najverjetneje nadaljevala rast velikih podjetij, ki bodo lahko nudila več različnih naprav. Kupec se bo raje odločal za naprave enega proizvajalca, saj bodo te bolje »delale skupaj«. Pri tem pa ne gre zanemariti dejstva, da bodo taisti proizvajalci seveda morali tudi zbirati podatke, če bodo želeli delujoče sisteme umetne inteligence. Mogoče lahko zaupamo Samsungu, da bo izdelal dobre naprave, toda ali mu lahko zaupamo podatke? In enako velja za vsa ostala podjetja, pa naj bodo na programski ali strojni strani.

A pustimo prihodnost prihodnosti. Kaj pa se dogaja zdaj? Preberite v nadaljevanju.

Moj mikro, september – oktober 2014 | Miha Gradišnik |