29. marec 2008

Iskanje s pomočjo umetne inteligence

Bolj kot razvijamo in obvladujemo informacijske tehnologije, bolj spoznavamo kako fantastično razvita in popolna s(m)o (že milijone let delujoča) živa bitja - in mi ljudje kot krona stvarstva še posebej. Sedaj ko imamo že super hitre procesorje, gigabajtne nosilce »spomina« in celo terabajtno svetovno omrežno podporo, uspevamo počasi (in zelo nezanesljivo) prepoznavati obraze na (ustrezno kvalitetnih) slikah, kar je sicer prava malenkost za vsakega povprečnega otroka, pa čeprav tudi preko človeškega očesa informacije pridejo v možgane preko tisočih pikčastih impulzov (v bistvu tudi digitalnih)…

Družbe kot Riya, ki so doslej uspele še najbolje spoznati vsebino slik (»Visual Search«), se hvalijo s tem, da so še največ dosegle na enem od področij umetne inteligence – »computer vision«. Slike, katere mi spoznamo in »razumemo, sprejmemo« v sekundi, morajo računalniki najprej spremeniti v matematične algoritme in šifre (povprečne slike jih imajo vsaka po 6.000), nato pa se začne strašno komplicirano »računanje« zato da bi se našle znane in smiselne kombinacije… In če naj bi nek obraz prepoznali za potrebe bio-metričnih potnih listov, potem je treba dobljene kombinacije primerjati še z tisoči in tisoči drugimi slikami… (kar mi spet naredimo ponavadi kar mimogrede in se spomnimo znanca izpred 10 let)…

Z vizualnim področjem sem začel zato, da bi si lažje predstavljali, na kakšen zapleten način mora »neumni« računalnik začeti tudi na področju besedil (kar je nam pravnikom bolj pomembno). Zaporedje črk in drugih znakov je potrebno najprej »na grobo« spoznati in razdeliti na besede in stavke. Umetna inteligenca je potrebna od tu naprej, začenši z že dokaj razvitimi besednimi tehnologijami. Visok nivo (formalnega) prepoznavanja besedil tudi v slovenščini si lahko ogledate pri Microsoftovih orodjih v Pisarni – Office 2003, kjer vam računalnik lahko že kar koristno pomaga pri odpravljanju slovničnih napak.

Trdo delo pa se tu seveda šele začenja: ugotoviti, kaj besedilo POMENI in to potem povezati z drugimi ustreznimi pojmi in besedili. Za to pa je potrebno (biti vključeno) že zelo specifično znanje. Umetna inteligenca na področju medicine (ki je tudi že precej razvita), mora povezati težave s krvnim pritiskom z (ne)primerno prehrano in z ustreznimi terapijami in zdravili.
Nepogrešljivi iskalni stroji doslej niso imeli ustreznih rešitev, niti vključenih elementov umetne inteligence. Še najbolj se je temu približal legendarni Google (in v tem je tudi skrivnost njegovega uspeha), vendar na dokaj specifičen način, s pomočjo določenih »trikov«. Iskane pojme je namreč začel povezovati s pomočjo statističnih metod: od kje so se ponavadi pojavljali iskalci, katere so (naj)bolj iskane strani, kateri linki so najpogostejši itd. Tako bi nas na področju medicine verjetno hitro pripeljal tudi od visokega pritiska do ustreznih zdravil (s plačanimi oglasi). Za splošno iskanje je tudi to ponavadi dovolj, nikakor pa ni to prava smer za bolj zahtevno in kvalitetno iskanje – predvsem tudi ne na pravnem področju. Z vidika iskalnika, kot je Google je namreč celotni internet ena sama ogromna zakladnica najrazličnejših besed (na določenih straneh), skupaj s povezavami med temi besedami in stranmi. Pa prav nič več!

Upam si celo trditi, da še tako izpopolnjen(i) iskalnik(i) a la Google predstavlja(jo) povsem neustrezno smer (»dead end«) nadaljnjega razvoja obdelave informacij, razen seveda, če jim bodo določili povsem novo arhitekturo. Kot si lahko predstavljate bodo morali pri (zasnovi in) izdelavi novega (pravega) iskalnika na medicinskem področju sodelovati predvsem zdravniki, na pravnem pa – predvsem pravniki. Med bilijoni in bilijoni besed (pogosto obdanih z morjem navlake) bo možno dobro informacijo najti le z uporabo pravega ZNANJA (ki pa doslej ni bilo ustrezno vkomponirano v iskalnike).

Imamo srečo, da je prav pravo eno od najbolj ustreznih področij človeške dejavnosti za obvladovanje s pomočjo računalnikov, saj se študentje na nek način vsa leta študija učijo predvsem raznih PRAVIL.

S pomočjo umetne inteligence bo torej potrebno najprej vsa ta pravila (in njihove povezave) predstaviti računalniku, ki bo odslej znal prepoznati tudi nova (pravna) besedila in nam jih predstaviti preko iskalnika (search engine). Postopek bo sicer dopolnjen s spoznanji strojnega učenja in statistike, vendar bo temeljil na znanju in pravilih, katera bodo definirali pravniki.
Kot vse kaže se bomo zelo ambicioznega (in dolgotrajnega) projekta uporabe umetne inteligence v pravu lotili skupaj z nekaterimi najrazvitejšimi državami EU in lahko napovem, da bodo uporabniki siatema IUS-INFO eni prvih, ki bodo uporabljali PRAVI pravni iskalnik.

Vir, 26. 8. 2006