Aplikacije obdelave slik danes pokrivajo široko področje, od industrijske uporabe varnostnih sistemov do prometa in medicinskih tehnologij. Kljub temu strokovnjaki sodijo, da je doslej izkoriščena le manj kot petina njihovih možnosti. Po ocenah proizvajalcev doseže svetovni trg sistemov za strojni vid danes okoli 6,5 milijarde evrov, z rastjo nad 10 odstotkov na letni ravni. Sistemi za obdelavo slik so se v industriji uveljavili predvsem na področju nadzora kakovosti v vseh sektorjih, od menjalnikov prek računalniških zaslonov do tiskanih vezij mobilnih telefonov. Uporabljajo jih tudi v metrologiji, za vizualno vodene stroje in prepoznavanje komponent, znakov in kod. Kamere omogočajo robotom prepoznavanje oblik in nameščanje delov za obdelavo.

PAMETNE KAMERE

Po študiji podjetja Frost & Sullivan (F&S) iz leta 2005 bo čedalje bolj rasla prodaja digitalnih kamer z gigabitnim ethernetom za prenos slik visoke ločljivosti iz kamere v računalnik do oddaljenosti več sto metrov. V letu 2007 bodo na voljo 3D-sistemi za robote, sistemi za nadzor polprevodniških komponent z natančnostjo 4,5 mikrometra. Za leto 2010 so napovedane pametne kamere, povezane v nevralna omrežja in sposobne kategoriziranja objektov v različne razrede, kar je osnova avtomatskega sortiranja. Obdelava slik je izjemno pomembna tudi v zdravstvu, kjer bodo komunikacijski sistemi za arhiviranje slik (PACS) omogočili obdelavo, skladiščenje in upravljanje medicinskih posnetkov, kot je že uveljavljeno na področju radiologije. Analitiki za leto 2010 napovedujejo, da se bo prodaja tovrstne opreme v medicini v Evropi povzpela s 470 milijonov dolarjev v letu 2003 na 1,47 milijarde v letu 2010. pomemben
Pomembno gonilo rasti je zmanjševanje stroškov za okrog 10 % na leto. Pomemben trend je združevanje različnih vrst obdelave, kot so slike visoke ločljivosti, pridobljene z računalniško tomografijo, in slike s področja jedrske medicine, ki vizualizirajo biokemične procese. V avtomobilski industriji raste pomen obdelave slik za sisteme za pomoč voznikom. Proizvajalci ne uporabljajo le laserskih, radarskih in ultrazvočnih senzorjev temveč tudi kamere, ki hitreje od človeka zaznavajo vozila, robove ceste, prometne znake in pešce. Po F&S bodo največjo rast prodaje med senzornimi sistemi na vozilih v naslednjih letih doživele ravno kamere. Med drugim bodo uporabljane kot podporni video sistemi za opazovanje oznak ceste, ki bodo lahko sproti opozarjali o spremembi smeri vožnje glede na cesto in tudi za pomoč pri parkiranju.

OKOLJE POD NADZOROM

Zadnje leti doživljajo posebno visoko rast prodaje sistemi za video nadzor. F&S napoveduje, da bo prodaja v letu 2008 dosegla 11 milijard dolarjev. Največji segment svetovnega trga imajo ZDA, v Evropi pa Velika Britanija. V letu 2004 je bilo v uporabi v Veliki Britaniji že 4 milijone javnih in zasebnih kamer, od tega okrog pol milijona v Londonu. Samo v podzemni železnici je nameščeno približno 6000 kamer. V nekaterih ulicah so kamere med sabo oddaljene manj kot 15 m. Nekdo je izračunal, da je povprečen posameznik v Londonu posnet najmanj 300-krat na dan. Velika večina ljudi meni, da je boj s kamerami proti kriminalu pomembnejši od morebitnih negativnih vidikov, kot je nadzor mimoidočih. Celo 90 % prebivalcev Londona se strinja z uporabo kamer na javnih mestih, medtem ko je takšnega mnenja le 25 % prebivalcev Dunaja. V Manhattnu je na javnih mestih nameščeno več kot 9000 kamer, v povprečju štiri na vsako stavbo.
Tovrstni sistemi so prej pošiljali posnetke na monitorje in trakove (televizija zaprtega kroga, CCTV). Danes vse več kamer pošilja posnetke v računalnik, kar omogoča da 4−8 digitalnih kamer uporablja le en procesor. Čez samo nekaj let bodo mnoge kamere opremljene s čipom. Klasični video trakovi bodo tako postali odvečni, saj bodo inteligentne kamere sposobne primerjati podatke, odkriti nenavadno obnašanje in sprožiti alarm. V letu 2008 bodo kamere vse pogosteje združene z rešitvami za nadzor dostopa. To bo pripeljalo do rasti zahtevo po biometrijskih sistemih, posebej za prepoznavanje obraza. Analitiki napovedujejo visoko rast popolnoma digitalnih rešitev, temelječih na internetnem protokolu (IP). Vsaka nadzorna kamera bo takrat pravzaprav postala spletna kamera. (webcam). Tako bo lahko denimo varnostno osebje na letališčih, železniških postajah in športnih dvoranah zabeležilo in poslalo v računalniško analizo posnetek sumljive osebe ali aktivnosti kar prek mobilnega telefona.

VDELANA INTELIGENCA

Stroji lahko opažajo svetlobo, pa naj bo to laserski žarek, ki omogoča namestitev 80-tonskega kontejnerja na velikanskem avtomatskem žerjavu, nevidna svetloba radarja ali radia, ki omogoča vozilu vzdrževanje varne oddaljenosti od drugih vozil, ali pa vidna svetloba, ki omogoča 3D-kameri hitro razvrščanje pošte ali medicinskem sistemu izdelavo natančnega slušnega aparata. V vseh teh primerih se strojni vid razvija v smeri, ki bo kmalu pripeljala do roba inteligence. Trend je najopaznejši na področju nadzora. Kamere so že sposobne odkrivati zapuščeno prtljago na letališču, ljudi, ki so nevarno blizu prihajajočega vlaka podzemne železnice, avtomobile, ki drvijo v napačni smeri ... Današnji pametni nadzorni sistemi lahko odkrivajo dogodke z natančnostjo, ki presega 95 odstotkov.
Pred nekaj let je bilo več napačnih alarmov kot pravih, danes pa sistema za nadzor prometa v predoroma v Hongkongu (Aberdeen) in Švici (Giswil) imata manj kot en napačen alarm v tednu. Medtem ko so starejše sisteme motili odsevi, ostri kontrasti ali okluzije (kombinacije tople in hladne zračne gmote), novejši sistemi po zaslugi pametnejših algoritmov spremljajo objekte brez napak. Tako se lahko nadzorniki namesto analizi samega alarma posvetijo analizi dogodka in ukrepom. To je zelo pomembno, ker ljudje pred monitorji niso ravno zanesljivi opazovalci. Nedavna študija je pokazala, da nadzorno osebje že 22 minut po začetku opazovanja praktično ne vidi 95 % prizorišča! Poleg boljših algoritmov k večji kakovosti nadzornih kamer ogromno prispevajo tudi močnejši procesorji, ki bodo vse pogosteje »vdelana inteligenca« v vsaki kameri, namesto da bi kot doslej povezovali 4 do 8 kamer na en procesor.

V ISKANJU NEVARNOSTI

Kot pravi strokovnjakinja za obdelavo slik Emma Brassington iz podjetja Roke Manor Research: »Zahteve po obvladovanju ogromnih količin podatkov, ki jih proizvajajo kamere, so vse večje. Odgovor ni vse več ljudi za pregledovanje pridobljenih posnetkov, temveč predvsem vdelovanje vse več inteligence.« Vdelana inteligenca ponuja številne prednosti, kot so možnost neodvisnega nadzora dogodkov v vidnem polju, filtriranje nepomembnih podatkov in prenos pomembnejših informacij do centralne lokacije v nadaljnjo analizo. Pametne kamere je mogoče brezžično povezati in podatke, ki jih same preliminarno obdelajo, povezati in analizirati v zmogljivejšem sistemu. Seveda je treba razviti sistem, ki lahko prepreči pomote zaradi različnih dogodkov, prenatrpanosti, medsebojnega delovanja in šuma.
Strokovnjak za obdelavo signalov Justinian Rosca napoveduje za prihodnost skupno delovanje na tisoče miniaturnih pametnih brezžičnih kamer, ki bodo nenehno iskale znake nevarnosti z analizo značilnosti iz kadra v kader in primerjanjem z metapodatki v zbirki. Da bi vizualni sistem lahko ocenjeval slikovne informacije, mora biti sposoben odkrivati nenavadne pojave in filtrirati morebitne vremenske ali svetlobne motnje, kot so odrazi, vlaga, sence in podobno. Dr. Dorin Comaniciu iz SCR je patentirala matematično teorijo, ki jo je poimenovala »robustno zlitje informacij« (RIF), omogoča pa analiziranje podatkov iz različnih senzorjev. Gre za statistično metodo, ki na podlagi vrednotenja kombinacije podatkov iz različnih virov pride do optimalnih rezultatov. Drugo pomembno področje raziskav je statistično učenje, pri katerem kamera pridobiva sposobnost preprostega spremljanja objekta, primerjanja njegove slike s slikami v bazi ter njegovega kategoriziranja.

STROJI S SAMOODLOČANJEM

Modeliranje resničnega sveta je težavna naloga. Današnja tehnologija lahko zagotovi prepoznavanje prometnih znakov z visokih 90−95 odstotkov zanesljivosti. Že slabo vreme in pomanjkljiva svetloba lahko rezultat zelo poslabšata. Rešitev je zlitje kamer z drugimi senzorskimi sistemi. Odkrivanje znakov pa je le ena naloga, ki jo bodo v prihodnosti opravljali novi senzorski sistemi. Po F&S bodo kamere senzorska tehnologija z največjo rastjo v naslednjih letih. Podjetja v svetu razvijajo različne avtomobilske rešitve s kamerami, kot so sistem za ohranjanje smeri vožnje po voznem pasu in opozorilni sistem za primer zapuščanja voznega pasu, kamera za nadzor zaspanosti, sistem za odkrivanje pešcev, video nadzor sprednje in zadnje strani vožnje in podobno. Radar, infrardeči sistem, ultrazvok in brezžični sistem bodo poskrbeli za dodatne vrste nadzora prometa, z odkrivanjem drugih vozil v bližini, komuniciranjem z njimi in z izogibanjem trčenju zaradi mrtvih točk, nepričakovanega zaviranja ali slabe vidljivosti
Nekatere od omenjenih tehnologij se že na trgu. Sčasoma bodo v paketu na voljo tudi druge tehnologije. Strokovnjaki podjetja Roke Manor Research so razvili malo avtonomno vojaško vozilo, ki uspešno »navigira« po stavbi s pomočjo kamere in se izogiba oviram. Podobna tehnologija bo v prihodnosti v rabi za napredni nadzor brezpilotnega zrakoplova, razvoj nadzornih sistemov za policijskih vozil, nadzor daljnovodov, nadzor žitnih polj in podobno. Avtonomni sistemi, zasnovani na videnju, so kompleksne tehnologije, ki jih lahko primerjamo z ljudmi v smislu gradnje konceptov na podlagi videnja in doživetja novih stvari. »S takšnimi tehnologijami lahko stroji gradijo svoje modele sveta,« pravi Emma Brassinngton. »Namesto da stroj učimo o svetu, mu lahko omogočimo, da ga sam raziskuje in se uči iz tistega, kar vidi. Čez 10 ali 15 let bi lahko tovrstne izkušnje pripeljale do strojev, ki bodo sposobni sami odločati, se prilagajati novim okoliščinam in samostojno spreminjati svoje cilje.«

INTELIGENTNI VID STROJEV

Veliko preden bodo stroji sposobni graditi svoje modele kompleksnega naravnega ali urbanega okolja, bodo lahko opravljali podobne, a enostavnejše naloge v tovarnah ali skladiščih. Tridimenzionalni vid ima bistvene prednosti v primerjavi z dvodimenzionalnim, pa naj gre za identificiranje novih ali že znanih objektov. 3D-vid danes omogoča zanesljiv pregled lopatic turbine v elektrarni in izdelavo 3D-modelov visoke ločljivosti, ki jih lahko stranke uporabljajo za odkrivanje napak. Med lopatico turbine in srcem je seveda velika razlika, a so tudi podobnosti, ko gre za strojni vid. Dr. Dorin Comaniciu je s svojim timom razvila metodo uporabe »postopkov, vodenih iz podatkovne zbirke«, ki uporablja že razložene primere slikovnih in video podatkov za ustvarjanje samodejnih algoritmov za izvajanje vizualnih in kvantitativnih nalog merjenja.
Comaniciu in njen tim so med drugim razvili algoritem Auto EF, ki nadomešča konvencionalno metodo ultrazvočne slike pacientovega srca za izračun frakcije odklona (ejection fraction, EF), razlike v količini krvi, črpane med diastolo in sistolo. Strokovnja za to potrebuje nekaj minut, algoritem pa le dve sekundi. Specializirani algoritmi, povezani s strojnim vidom, bodo omogočili obsežno ocenjevanje celotnega organizma in bolezni z demografskega, sistemskega ali individualnega vidika, vse do genetske in molekularne ravni. Generična narava strojnega vida že danes omogoča sinergijo med različnimi polji. Med drugim so pred kratkim uvedli samodejno ultrazvočno merjenje glave, trebuha in stegna fetusa, ki so najpomembnejši parametri nosečnosti. Po zaslugi modularne arhitekture programske opreme je moč iste tehnologije uporabiti za odkrivanje razpok na turbini, zasedenosti parkirnih mest ali obrazcev gibanja vozil na cesti in pešcev na pločniku – kar so vse ilustracije uporabe inteligentnega strojnega vida.

Boj proti vsiljivcem

Sistemi za video nadzor, ki zmorejo samodejno odkrivati nepooblaščene osebe in spremljati njihovo gibanje, že prihajajo iz laboratorijev v prodajo. Že danes obstajajo tehnološke možnosti razlikovanja ljudi, živali in vozil ter odkrivanja nenavadnega obnašanja, ki jih že uvajajo na nekatera letališča, denimo v Münchnu. Na največjih letališčih na svetu je nameščeno na stotine kamer (v Münchnu 1600), ki zlasti po obrobnih delih iščejo morebitne neželene obiskovalce. V naprednih sistemih se podatek o vsiljivcu takoj pošilja nadzornem centru, medtem ko ga sistem kamer samodejno spremlja. Trenutno najbolj inovativen je varnostni sistem Sistore CX EDS (Enhanced Detection Solution), ki ga je razvil Siemens Building Technologies (SBT). V središču sistema je oprema za inteligentno obdelavo slik, ki prek interneta in ethernetnega omrežja zbira podatke iz številnih kamer. Napredni algoritmi omogočajo video senzorjem učenje pri tolmačenju sprememb slike v vidnem polju kamer. Vnaprej določeni parametri velikosti, hitrosti in drugih značilnosti omogočajo odkrivanje in natančno lociranje človeka, živali ali vozila. Shranjene slike normalnega ozadja o omogočajo tudi odkrivanje morebitne sabotaže. Če na primer kdo premakne kamero, ta takoj pošlje opozorilo zaradi spremenjene slike v vidnem polju. V SBT-ju še naprej razvijajo algoritme, ki bodo v prihodnosti omogočali opazovanje nenavadnih objektov ali oseb tudi v slabših vremenskih in svetlobnih razmerah kakor tudi spremljanje morebitne sumljive osebe med drugimi osebami ali celo v gneči.

Naočniki za zvočno gledanje

Nemško podjetje Siemens v sodelovanju z univerzami in organizacijami slepih ter s podporo EU-ja že nekaj let vodi projekt »Poznavalski pomožni sistem za slepe« (CASBliP). Cilj je razvoj senzornega sistema, ki bi z uporabo zvočnih signalov omogočil slepim osebam pridobiti prostorno zaznavanje svojega okolja. Koncept senzornega sistema, vdelanega v naočnike, so v Siemens CT razvili, ko so razvijali tipalo za hitrejše zaznavanje pešcev iz avtomobila. Takrat so odkrili, kot pojasnjuje vodja projekta dr. Peter Mengel, da je koncept uporaben tudi za orientacijsko pomoč slepim. Laserska dioda, nameščena v par naočnikov, skenira okolje pred osebo z infrardečimi impulzi do oddaljenosti 5 m znotraj kota 60 stopinj. Odsevano infrardečo svetlobo odkriva majcena kamera s 64 slikovnimi elementi (piksli). Razlike v preteklem času se pretvarjajo v profil okolja pred uporabnikom, izražen z zvočnimi signali. Večja ko je oddaljenost, višji je ton signala.− daljši ko je objekt, nižji je ton. Po kotu odboja je mogoče razlikovati, kaj je desno in kaj levo. Slepa oseba lahko s premikanje glave pridobi preprosto, a celotno sliko neposrednega okolja pred sabo.

Avtonomni omrežni sistemi v letu 2020

V našem scenariju za leto 2020 v New Yorku testirajo novo vrsto neodvisnih omrežnih sistemov (ANS), mobilnih naprav, ki se same učijo. Naprave ustvarjajo poročila v metabesedilu (strojnem jeziku), ki se samodejno pretvarjajo v človeški jezik Newyorški ANS-i so mestni delavci, mobilni stroji, dolgi 15 cm, ki svoje okolje vidijo s pomočjo tipal, tolmačijo ga v skladu s svojimi programi in ukrepajo tako, kot so programirani. Njihov posel je nadzor in vzdrževanje težko dosegljivih in nevarnih infrastruktur. Trenutno je to zamenjava pokvarjenih procesorjev v nadzornih kamerah na območju 3 kvadratnih kilometrov srednjega dela Manhattna, da bodo te spet sposobne inteligentno tolmačiti tisto, kar vidijo, sodelovati z drugimi kamerami in po potrebi opozarjati nadzorno službo. ANS-e ob 4:30 zjutraj pripeljejo v Manhattan v avtomatskem transporterju. Dva na naši sliki sta zadolžena za zamenjavo čipov v kamerah na visoki stolpnici na križišču 53. in West End avenije, pri čemer so ANS-stbr1 (desno) že pripravili na tolmačenje kompleksnih vizualnih podatkov, ANS-stbr2 (levo) pa se šele uči. Ob 6:15 ANS-stbr1 preverja položaj prek vdelane naprave GPS, prek brezžičnega omrežja primerja podatke o položaju kamer s podatki v zbirki, potem pa načrt delovanja usklajuje z načrti drugih bližnjih skupin ANS-ev, da se jim ne križajo poti, kakor tudi z avtomatskim čistilcem, da ju ne pobere. Dva ANS-a v dveh urah obiščeta vse kamere, ANS-stbr1 pregleda čipe in zamenja pokvarjene, obenem pa drugem ANS-u pojasni vse, kar česar »neizkušena« naprava ne pozna (ANS-stbr2 mu pošilja slike svojega vidnega polja z označenimi deli, ki niso bili razumljivi).
Medtem ko se vzpenjata, je še več takšnih nejasnih detajlov, obenem pa so se slike spodnjih detajlov poslabšale, tako da jih ANS-stbr2 ni znal tolmačiti. Na koncu ANS-stbr1 »kolegu« svetuje, naj uporabi radar in obenem hitrost njunega premikanja in gibanja drugih objektov, kot so vozila na aveniji daleč pod njima. Štiri ure pozneje so baterije obeh ANS-ov še zmeraj polne, ker se polnijo sproti iz gibanja stavbe, vetra, sončne svetlobe in vibracij steklenih plošč zaradi spodnjega prometa. Posel je pri koncu, za pregled je ostala le še starejša nadzorna kamera. Ko se ji ANS-a približata, začne kamera oddajati visok ton kot signal opozorila pred vpadom nepooblaščenih naprav, ker ju ni prepoznala. Medtem je vmesno varnostno logično vozlišče že analiziralo posnetek in prekinilo nepotrebni signal iz stare kamere, preden bi začela ukrepati človeška posadka iz najbližje varnostne postaje. ANS-stbr1 pouči ANS-stbr2 kako naj z rentgenskimi žarki in strukturirano svetlobo preveri strojno opremo kamere in nove slike primerja s slikami, shranjenimi v zaščitenih datotekah. Raziskava je pokazala, da v kameri ni poškodb ali drugačnih okvar. Nazadnje ANS-stbr1 zamenja očitno že nezanesljiv čip v stari kameri in vse še enkrat testira. S tem je njuna misija končana, zato počakata na transportno vozilo, se spustita vanj in se vrneta v skladišče do jutrišnjega obiska nove stolpnice.

Esad Jakupović