25. marec 2008

Kako naj računalnik razume pravo?

Kako so organizirani naši možgani? Ali imajo kakšen »operacijski sistem«? Kje so shranjene besede in kje pojmi? Obstajajo kakšni splošni »direktoriji« z našimi spomini in ali so naprej hirerahično razčlenjeni? Kako pogosto se nam vklaplja »iskalni stroj«? Kako se nam pojavijo nove ideje? Kaj je to učenje? – takšna vprašanja se mi pojavljajo, ko premišljujem o možnostih črpanja pravnega znanja iz obstoječih dokumentov (predpisov, judikatov, člankov…)…

Če hočemo pravno informatiko dvigniti na povsem novo in bistveno bogatejšo stopnjo, kot je prevladovala doslej (zbiranje, iskanje in razpečevanje mehaničnih nizov črk in besed, katere bo šele končni uporabnik »razumel«), potem se ne moremo izogniti primerjav med človeško in računalniško logiko. Če naj bi računalnik bistveno bolj(e) pomagal človeku (na pravnem področju), potem mora tudi on, vsaj do določene mere »razumeti« pravna besedila.

Ker pa verjetno do izvorne kode operacijskega sistema človeških možganov verjetno ne bomo nikoli prišli, si bomo morali pač pomagati vsaj z omejenimi simulacijami našega miselnega procesa ter to uporabiti za izdelavo algoritmov, ki bodo računalniku pomagali priti do približno enakih zaključkov kot jih na podlagi enakega »inputa« doseže človek.

Tudi pravo je določeno in zapisano v obliki človeškega jezika in za začetek je potrebno najti vsaj okvirne pomene besed in njihovih povezav. Na tem področju (in v prvih korakih pri razvoju umetne inteligence na področju prava) pa si bomo lahko že veliko pomagali z lepimi rezultati, katere so v preteklih desetletjih dosegle JEZIKOVNE TEHNOLOGIJE. Običajno si kot najbolj popularne njihove dosežke predstavljamo razne aplikacije za računalniško obdelavo naravnega jezika. Slovenski primer: KOLOS

Manj spektakularne, vendar tudi zelo bogate pa so razne leksikalne podatkovne zbirke, kot n.pr. WordNet in EuroWordNet, ki temeljijo na povezavi pojmov z leksikalnimi in semantičnimi relacijami. Prvi sistem je začel nastajati v Ameriki že pred desetletji in ima danes velik vpliv) (in s tem tudi angleščina kot dominantni jezik na tem področju) na vse druge projekte. V tej podatkovni zbirki so samostalniki, glagoli, pridevniki in prislovi urejeni v sinonimske nize (sinsete), EuroWord Net pa je temu pridružil še več jezikov, ki se do določene meje povsem ujemajo, v velikem delu pa obstajajo tudi njihove specifike.

Obstaja pa tudi že projekt BalkaNetWord (kamor pa Slovenija seveda ne spada).
Zaradi izrazito ontološkega pristopa (vključno z relacijami kot so sopomenskost, nadpomenskost, podpomenskost, protipomenskost) ) takšne »besedne mreže« predstavljajo dobro osnovo tudi za specifična področja, kot je tudi pravo. Doslej je bilo na tem področju še največ doseženega v okviru projekta LOIS (Lexical Ontologies for legal Information Sharing). Izhodiščna ugotovitev njegovih nosilcev je bila, da je ena glavnih pomanjkljivosti obstoječih pravnih informacijskih sistemov v tem, da nimajo učinkovite predstavitve semantičnih razmerij med pravnimi pojmi (doslej še) »skritimi« v vsebini (?) pravnih dokumentov. Po domače povedano: računalnik (program) uporabnikom ne more prav nič pomagati glede prave VSEBINE besedila.
Kot sem napovedal že v svoji kolumni »Prav(n)i iskalec« se bomo tudi Slovenci v naslednjih letih veliko ukvarjali s »črpanjem znanja« (knowledge extraction) iz obstoječih pravnih podatkovnih baz, kot tudi s pomočjo pri nastanku (kreiranju) novih (pravnih dokumentov vseh vrst) na veliko bogatejši način. Iz praktičnih razlogov večje učinkovitosti bomo (na začetku še dokaj nezanesljive) metode teoretičnih pravnih pravil kombinirali s tehnologijami strojnega učenja in teorije iger, ki veliko vsebinskih pojmov »zadenejo« tudi po statističnih pravilih običajnega vrstnega reda besed.

Zato bomo morali tako »ukrotiti« računalnike in jim »razložiti« način človeškega mišljenja in izražanja, da bodo začeli z razumevanjem prava…

S skupnimi močmi (ljudi in računalnikov) bomo posledično lahko tudi izboljšali kvaliteto samega prava…

Ne verjamete? Stavim za tisoč evrov: izplačilo leta 2015…

Vir, 8. 7. 2006