18. avgust 2008

Brez umetne inteligence je računalnik neumen

Pred nami je največja revolucija na področju iskalnih strojev! Dosedanja gola zaporedja znakov (strings of characters) v besedilih se bodo dala računalniku prepoznati s pomočjo vse bolj razvite umetne inteligence. Potem ne bo več tako usodnega pomena, če smo pri iskanju izbrali ustrezne »ključne besede«, saj bo bolj pomemben POMEN besedil (tudi iskalnega izraza), kot pa znaki s katerimi so napisani …

Bolj kot razvijamo in obvladujemo informacijske tehnologije, bolj spoznavamo, kako fantastično razvita in popolna s(m)o že milijone let delujoča živa bitja - in mi ljudje, kot krona stvarstva še posebej. Sedaj, ko imamo že super hitre procesorje, gigabajtne nosilce »spomina« in celo terabajtno svetovno omrežno podporo, uspevamo počasi (in zelo nezanesljivo) računalniško prepoznavati obraze na (ustrezno kvalitetnih) slikah, kar je sicer prava malenkost za vsakega povprečnega otroka, pa čeprav tudi preko človeškega očesa informacije pridejo v možgane preko tisočih pikčastih impulzov (v bistvu tudi digitalnih) …

Družbe, kot Riya*, ki so doslej uspele še najbolje spoznati vsebino slik (»Visual Search«), se hvalijo s tem, da so še največ dosegle na enem od področij umetne inteligence – »computer vision«. Slike, katere mi spoznamo in »razumemo, sprejmemo« v sekundi, morajo računalniki najprej spremeniti v matematične algoritme in šifre (povprečne slike jih imajo vsaka po 6.000), nato pa se začne strašno komplicirano »računanje« zato, da bi se našle znane in smiselne kombinacije … In če naj bi nek obraz prepoznali za potrebe bio-metričnih potnih listov, potem je treba dobljene kombinacije primerjati še s tisoči in tisoči drugih slik … (kar mi spet naredimo ponavadi kar mimogrede, ko se spomnimo znanca izpred 10 let) …

Na vizualno področje sem opozoril zato, da bi si lažje predstavljali, na kakšen zapleten način mora »neumni« računalnik začeti delovati tudi na področju besedil. Zaporedje črk in drugih znakov je potrebno najprej »na grobo« spoznati in razdeliti na besede in stavke. Umetna inteligenca je potrebna od tu naprej, začenši z že dokaj razvitimi jezikovnimi tehnologijami. Visok nivo (formalnega) prepoznavanja besedil tudi v slovenščini si lahko ogledate pri Microsoftovih orodjih v Pisarni – Office 2003, kjer vam računalnik lahko že kar koristno pomaga pri odpravljanju slovničnih napak.

Trdo delo pa se tu seveda šele začenja: ugotoviti, kaj besedilo POMENI, in to potem povezati z drugimi ustreznimi pojmi in besedili. Za to pa je potrebno (biti vključeno) že zelo specifično znanje. Umetna inteligenca na področju medicine (ki je tudi že precej razvita), mora povezati težave s krvnim pritiskom z (ne)primerno prehrano in z ustreznimi terapijami in zdravili.

Nepogrešljivi iskalni stroji doslej niso imeli ustreznih rešitev, niti vključenih elementov umetne inteligence. Google bi nas na področju medicine verjetno hitro pripeljal tudi od visokega pritiska do ustreznih zdravil (s plačanimi oglasi). Za splošno iskanje je tudi to ponavadi dovolj, nikakor pa ni to prava smer za bolj zahtevno in kvalitetno iskanje – predvsem tudi ne na pravnem področju. Z vidika iskalnika je namreč celotni internet ena sama ogromna zakladnica najrazličnejših besed (na določenih straneh), skupaj s povezavami med temi besedami in stranmi. Pa prav nič več!

Upam si celo trditi, da še tako izpopolnjen(i) iskalnik(i) á la Google predstavlja(jo) povsem neustrezno smer (»dead end«) nadaljnjega razvoja obdelave informacij, razen seveda, če jim bodo določili povsem novo arhitekturo. Kot si lahko predstavljate, bodo morali pri (zasnovi in) izdelavi novega (pravega) iskalnika na medicinskem področju sodelovati predvsem zdravniki, na pravnem pa – predvsem pravniki. Med bilijoni in bilijoni besed (pogosto obdanih z morjem navlake) bo možno dobro informacijo najti le z uporabo pravega ZNANJA (ki pa doslej ni bilo ustrezno vkomponirano v iskalnike).

Imamo srečo, da je prav pravo eno od najbolj ustreznih področij človeške dejavnosti za obvladovanje s pomočjo računalnikov, saj se študentje na nek način vsa leta študija učijo predvsem raznih PRAVIL.

S pomočjo umetne inteligence bo torej potrebno najprej vsa ta pravila (in njihove povezave) predstaviti računalniku, ki bo odslej znal prepoznati tudi nova (pravna) besedila in nam jih predstaviti preko iskalnika. Postopek bo sicer dopolnjen s spoznanji strojnega učenja in statistike, vendar bo temeljil na znanju in pravilih, katera bodo definirali pravniki.

Takšnega zelo ambicioznega (in dolgotrajnega) projekta uporabe umetne inteligence v pravu smo se prvi lotili Slovenci, skupaj s partnerji iz nekaterih najrazvitejših držav EU. Zaradi boljše možnosti zaščite intelektualne (»industrijske«) lastnine smo družbo »AI-in-Law Future Technologies Inc« sicer ustanovili v ZDA, vendar lahko napovem, da bodo uporabniki sistema IUS-INFO eni prvih, ki bodo uporabljali PRAVI pravni iskalnik.


*Priporočeni link: http://www.riya.com/