Nacionalna televizija (www.rtvslo.si) ne glede na obupno slab program sem ter tja naredi tudi kaj vrednega pozornosti. Ena od takšnih stvari je tudi ta, da večino oddaj lastne produkcije prej ali slej opremi s podnapisi. Dobro za vse tiste državljane, ki so naglušni ali gluhi, saj tudi njim omogoča spremljanje dogajanja.

Kako do podnapisov

Podnapisi oddaj, ki jih ne oddajajo v živo, so na voljo že pri njihovem prvem predvajanju (vključite jih prek funkcije v teletekstu). Žive oddaje pa jih dobijo pri njihovi prvi ponovitvi.

Podnapisi so osnova delovanja storitve Odprti kop. Njen avtor je Andraž Tori, ki je pri snovanju sistema uporabil množico odprtokodnih gradnikov. In kaj storitev počne?

SAMODEJNA IZDELAVA SPLETNE STRANI ODDAJE

Na kratko povedano, iz podnapisov in video posnetkov samodejno naredi spletno stran oddaje. Podnapise preoblikuje v besedila, jih segmentira in stavke uredi v logično zaporedje ali sklop, ki mu slavisti pravijo odstavek. Iz video posnetka nato izlušči relevantne slike, ki rabijo za ilustracijo odstavka in hkrati tudi označujejo vstop na točno določen del posnetka, kjer je bil stavek ali odstavek izgovorjen.

Kaj pomeni ime storitve?

Nič drugega mi ne pade na pamet, kot da so si ime izposodili pri rudarjih. Odprti kopi so izkopi rud na površju, po domače povedano − v tla delajo ogromno luknjo, veliko večjo, kot to počnejo otroci v peskovniku. Logično! Tudi pri tem gre za rudarjenje. Namesto rudnin »izkopavajo« besedila. Je »odprti« tudi zato, ker je uporabljena odprta koda?

Celotna oddaja se tako prelevi v popolno spletno obliko. Vse, kar so akterji izrekli, je namreč tudi v obliki besedila, to pa pomeni, da je omogočeno tudi iskanje − s pomočjo tistih »ta pravih« spletnih iskalnikov (Google, najdi.si …), kakor tudi s pomočjo iskalnika znotraj storitve. Storitev glede na vsebino samodejno predlaga sorodne članke, ki so objavljeni na portalu nacionalne televizije. Naredi pa še nekaj − omogoči prepletanje gumbov za citiranje (quote), prek katerih lahko želeni citat prenesemo v svoj blog. Koliko bo šele zdaj »izlivov žolča« nesramnih ali besnih gledalcev? Prav zabavno bo. Če pa česa ne razumete, omogoča tudi samodejno povezovanje pojmov v razlage Wikipedije.
Pa recite, da Slovenci nismo pametni ali inovativni! Rešitev je na prvi pogled videti preprosta, v svojem bistvu to ni. Prej bi dejal, da je zapletena, saj je v njenem ozadju vrsta sodobnih algoritmov, in je hkrati ena izmed redkih v svetu. Podobna meni znana je projekt Metavid (ime naše storitve je bolj posrečeno izbrano), ki na podoben način za vekomaj shrani vse »kvazi« modrosti, izrečene v kongresu ZDA.

Kaj pravi Andraž?

»Problem spleta je, da je informacij preveč in da ni dovolj ljudi, ki bi jih smiselno urejali. Zato prihaja čas samodejnih tehnologij, ki bodo vse bolj razumele jezik, kontekst in uporabnika ter mu pomagale. To se bo dogajalo na vseh ravneh od velikih mednarodnih iskalnikov, do spletnih strani posameznih medijskih hiš in z vsemi velikimi arhivi v spletu − na primer v javni upravi.
Prihaja pohod samodejnih tehnologij, ki pa seveda ne bodo popolne. Njihovo bistvo je, da so dovolj dobre, da dodajo veliko vrednost obstoječim vsebinam. Ko sem opazil, da podnapisov za gluhe ni mogoče spremljati v internetnih videih RTV Slovenija, sem se začel pogovarjati z Multimedijskim centrom, kako bi to izvedli. Nato smo ugotovili, da je mogoče narediti še mnogo več. Da lahko samodejno naredimo celotne spletne strani, z uporabo najsodobnejših tehnologij seveda. In tako se je rodil Odprti kop.
Algoritmi so zahtevni, podatkov je veliko, zato traja približno dve uri, da je posamezna oddaja obdelana, odvisno od njene dolžine. Načeloma pa bodo oddaje dostopne v spletu v takšni obliki dan po predvajanju. Strani oddaj, kakršne so trenutno objavljene, so narejene brez človeškega posredovanja, sistem pa novinarjem in urednikom omogoča tudi naknadno popravljanje.
Pogoje rabe postavlja RTV Slovenija, a zaenkrat plačljivost ni v načrtu. Na začetku bodo v sistemu Hri-bar, Milijonar z Jonasom, Mednarodna obzorja, Tednik in še približno 15 drugih. Na podlagi tega projekta sva avtorja ustanovila podjetje Zemanta, d.o.o., ki se specializira za samodejno prepletanje multimedijskih vsebin, ponujanje kontekstualnih vsebin in dodajanje vrednosti spletnim arhivom medijskih hiš. Imamo velike ambicije, ki presegajo slovenski trg, vendar je najprej seveda treba uspeti doma.«

Jan Kosmač