Anton Tomažič: 08/08

31. avgust 2008

Koga naj volim?

Na to pomembno vprašanje, ki se nekaj tednov pred volitvami postavlja kar kakšni tretjini volivcev, bo odslej lahko pomagal odgovoriti tudi računalnik. Pripravili smo namreč spletno uporabnino "Koga naj volim?", kjer uporabnik lahko preizkuša sorodnost njegovih stališč in vrednot do aktualnih družbenih vprašanj – s stališči političnih strank…

Za začetek je pripravljenih 15 kartic s povsem jasnimi vprašanji (na primer glede uvedbe kazni dosmrtnega zapora) ter dvema nasprotnima odgovoroma (skrajni stališči) ter drsnikom, ki prikazuje pomembnost tega vprašanja.

Na začetku akcije so dobile politične stranke enake vprašalnike, preko katerih so lahko odgovorile, kakšna so njihova stališča glede posameznih vprašanj (tako, da so se med obema skrajnostma pozicionirale z vnosom številke od 1 do 100) in kako pomembna se jim zdi ta tema (z vnosom številk od 1 – nepomembno, do 200 – zelo pomembno).

Ko sedaj uporabnik na spletu odgovarja na vseh 15 vprašanj (tako, da z drsnikom določa stopnjo (ne)strinjanja in stopnjo (ne)pomembnosti problematike), se njegovi odgovori primerjajo s stališči strank in tako se na koncu ustvari »lestvica« strank glede na podobnost (sorodnost) stališč z bodočim volivcem.

Za vse tiste, ki so bili doslej še neodločeni, koga bodo volili, bi si težko predstavljali boljši nasvet, kako naj oddajo svoj glas.

No, jaz si že predstavljam, kako bi se dalo aplikacijo še bistveno izboljšati, v smeri (še) večje objektivnosti in si bom po svojih močeh prizadeval, da bo pri naslednjih parlamentarnih volitvah (upam, da šele čez štiri leta!) to že možno.

Potrebno bo namreč dodati še objektivne, zunanje, stvarne pokazatelje stališč (in tudi aktivnosti!) političnih strank, predvsem parlamentarnih. Predvolilne obljube (parole) sicer nekaj že povedo o usmerjenosti in ideoloških izhodiščih strank, vendar pa se praktično delovanje od tega dostikrat precej razlikuje.

Glede na to, da sem trden vernik v naraščajočo pomembnost umetne inteligence v prihodnosti (predvsem seveda na pravnem področju, vendar tudi na vseh drugih), sem prepričan, da bi bilo možno s kvalitetno obdelavo vseh dokumentov ter magnetogramov Državnega zbora (in vse to JE že danes dosegljivo v digitalni obliki) preteklega štiriletnega mandata, priti do ogromno zaključkov o tem, za kaj so poslanci posameznih strank glasovali, predlagali, nasprotovali, podpirali, vlagali, dopolnjevali itd.

Tako pridobljene matematične ponderje bi bilo potrebno dodati (korigirati) k uradnim predvolilnim stališčem, obljubam ter napovedim političnih strank in takoj bi dobili (še malo) bolj zanesljiva priporočila o tem, za koganajvolim.si…

Naj opozorim še na eno pomembno odliko opisane uporabnine. Presenetljivo (za politično področje) je povsem nevtralna glede na običajne politične opredelitve, kot so desno – levo, napredno – nazadnjaško, liberalno – konzervativno itd. Teh pojmov vprašalnik sploh ne vsebuje in jih boste zaman iskali. V bistvu smo jih tudi skrili, saj bodo drsnik enkrat odločno postavili na desno stran tisti, ki so sicer prepričani levičarji, drugič pa desničarji z največjim užitkom na levo…

In prav je tako. Ljudje smo svobodna bitja in se tudi glede političnih vprašanj ne moremo (smemo) vedno opredeljevati le tako, kot se (naše) stranke. Če se morda (pogojno označene) tipične leve stranke v neki državi zavzemajo na nižje zaporne kazni, pa ima kakšen posamični levičar gotovo pravico, da pa se mu zdi boljši dosmrtni zapor. In če verjetno (pogojno označene) tipične desne stranke ne podpirajo porok istospolnih partnerjev, imajo pa gotovo posamični njihovi člani in simpatizerji do tega vprašanja lahko drugačno stališče.

Če se bo »računalniško svetovanje« volivcem v prihodnosti še bolj(e) razvilo (in jaz sem prepričan, da se bo!) in bo možno izpolniti še precej več kot 15 kartic, potem bo morda prišlo tudi do zanimivih situacij, ko bo marsikateri uporabnik spoznal, da doslej morda sploh ni glasoval za pravo stranko!!!! Da je le nasedal lepim besedam in karizmi voditelja? In da dejansko njegove vrednote in stališča bolje zastopa neka druga stranka, ki pa morda ni imela tako dobrih »piarovcev«…

Skratka: tudi na področju e-Demokracije se bo zgodilo še marsikaj zanimivega in koristnega…

*Priporočeni link: http://www.koganajvolim.si/

27. avgust 2008

Vse slovensko pravo na obesku za ključe

Ko se lotevamo ambicioznega projekta umetne inteligence, po katerem bi v digitalno (računalniško) obliko spravili (tudi) pomenski del prava (z vsemi pravnimi pravili vred), potem se nam upravičeno zastavi tudi vprašanje o možnem obsegu takšne na novo ustvarjene (ne več samo podatkovne) zbirke znanja …
Temeljit premislek pa nas pripelje do zapeljive pomisli, da bi dobro organizirano ter kvalitetno obdelano celotno znanje o pravnem sistemu ene države lahko stisnili kar na – eno samo zgoščenko – posledično pa tudi na USB obesek za ključe?

Kakšen bi bil lahko obseg (teža) celotne pravne vede neke države, n.pr. Slovenije … In kje bi lahko bolj(e) obvladali pravo, kot na Pravni fakulteti? Saj tam ga pravniki tudi predavajo ... Seveda pa toliko spet ne bom poenostavljal, da bi iskal razliko v teži med brucem in diplomiranim pravnikom… Konec koncev študentke v teh letih pazijo na postavo in bi na rezultate vplivali še drugi dejavniki …

Kje je meja med navadnim (»normalnim«) človekom in pravnikom? V diplomi! Pravi Pravnik je tisti, ki je prebral vse pravne UČBENIKE, poslušal vsaj nekaj predavanj (ZAPISKI), spoznal nekaj PREDPISOV in morda še kakšen JUDIKAT – in potem na izpitu to tudi dokazal.

Po tej logiki lahko pridemo tudi do nekaj kvantitativnih ocen, seveda ne v KG, temveč v MB. Zložimo skupaj vse učbenike Pravne fakultete, jih skeniramo, OCR-amo, podobno storimo z zapiski, glede ostalega pa vzamemo kar točne podatke iz IUS-INFA …

Ob tem naj opozorim na to, da golo besedilo v digitalni obliki, očiščeno raznih oblikovnih dodatkov, predstavlja presenetljivo majhen obseg glede na današnje spominske kapacitete naše računalniške opreme! Obligacijski zakonik obsega 614 kB. Povprečen učbenik kakšen MB (manj kot ena sama fotografija iz sodobnega žepnega fotoaparata). Tako imate lahko že na obesku za ključe po nekaj sto knjig (učbenikov) …

Čistopisi vseh veljavnih predpisov obsegajo manj kot pol Giga (= 500 MB), relevantni judikati pa dva- do trikrat več. Zbirka strokovnih člankov iz preteklih let lahko obseg še poveča, po drugi strani pa lahko velik obraten učinek dosežemo z »zipanjem« …

Hitro lahko ugotovimo, da bi na eno zgoščenko (DVD) zlahka spravili VSA pravna pravila nekega pravnega sistema. Toda – ali je to tudi že znanje? Seveda ne! To so le goli podatki. Znanje je potrebno iz njih šele izluščiti (knowledge extraction), ga na nek način (znati) interpretirati. Poudarjam: na nek način – do neke mere – kolikor se mehanično to sploh da. Toliko, da takšno »znanje« lahko predstavlja dober pripomoček in koristno orodje – povprečnemu uporabniku, pravniku, sodniku. Pri tem se dobro zavedam velikega pomena pravnega občutka (ali kot nas v svoji kolumni na IUS-INFU večkrat opozarja prof. Miro Cerar: das Rechtsgefühl).

Ker bodo meta podatki (takšni, ki vidno besedilo sicer bogatijo, vendar se pri branju “ne vidijo”) gotovo za nekajkrat povečali obseg celotne podatkovne zbirke o nekem pravnem sistemu, si ne upam trditi, da bi že danes lahko celotno pravo stisnili na eno zgoščenko (DVD), upam pa si napovedati, da bo že ob kateri od prvih naslednjih generacij teh prenosnih medijev zagotovo možno “celotno pravo” nositi s seboj – ne samo v glavi, temveč tudi - v žepu.

Iz svoje kože pač ne moremo … In tako tudi mene vsakršna podjetniška razmišljanja slej kot prej privedejo na pravno področje. Sem pač pravnik in podjetnik. Ampak čisti »fah idiot« pa tudi nisem … in občasno dobim tudi kakšne ideje iz ne-pravniškega področja …

Eno vam bom, zvestim bralcem v zahvalo, razkril v naslednjem prispevku. Ampak – pozor! To bo ena prav zares odlična in še neizkoriščena podjetniške ideja, Vredna takole … kakšnih 50 MIO EUROv … Pričakujem, da mi bo prisvojitelj (kar izrecno dovolim) priznal vsaj kakšnih 5% od čistega zaslužka …

Ste radovedni, zakaj se potem realizacije ne lotim kar sam? Zaradi prezasedenih kapacitet! Pomanjkanje resursov …

Lahko mi zaupate, da bom kot dober patriot dal nekaj prednosti slovenskim podjetnikom: preden bo moja kolumna prevedena v še kak drug jezik (to pa bo gotovo šele čez nekaj mesecev), imajo lahko slovenski podjetneži že narejen poslovni načrt, morda pa tudi že prototip izdelka ?

*Priporočeni link: http://www.tomazic.info/govornik/Default.htm

21. avgust 2008

Umetna inteligenca za telebane

Leta 2006 sem na internetu objavil svojo podjetniško iniciativo (glej originalno besedilo povzetka**) in pri tem naletel v mednarodnih krogih na tako dober odziv, da smo še istega leta ustanovili družbo »AI-in-Law Future Technologies Inc«, ki se ukvarja z uvajanjem umetne inteligence v pravo …

Čeprav je bila družba* ustanovljena v ZDA, pa so njeni glavni partnerji in sodelavci iz Evrope in sicer iz Slovenije, Nizozemske, Madžarske in Italije. Ker bo šlo za visoko inovativne tehnologije, ki zahtevajo zelo visoko stopnjo zaščite industrijske lastnine (vključno s patentiranjem programskih rešitev in algoritmov), je bila njihova ocena, da je to trenutno bolje in lažje doseči v ZDA, poleg tega pa je na tem trgu čutiti tudi največji interes za komercialni razvoj družbe in celo oploditev s tveganim kapitalom.

Družba AI-in-Law bo skušala s pomočjo pretežno pravniških timov zgraditi (dopolniti že obstoječe) pravne ontologije (najprej splošne, kasneje pa tudi za posebna področja), tako da bodo programerji lahko iz besedil (celotne) zakonodaje in judikatov (preteklih sodnih odločb) potegnili pomen vsakega posameznega stavka. Z jezikovnimi tehnologijami se ne bodo ukvarjali, temveč bodo uporabili (kupili) že odlične rezultate (pri nas je to družba Amebis), ki so doseženi že skoraj v vseh pomembnejših jezikih. Del tega bo tudi izražanje v »naravnem jeziku«, kar bo kasneje omogočilo, da bo uporabnik svoj (pravni) problem vnesel opisno in neformalno, v obliki poljubnih stavkov.

V drugi fazi bodo s pomočjo specialnih tehnologij (že razvite splošne umetne inteligence), predvsem »strojnega učenja« še zelo izboljšali odstotek točnosti pri (raz)poznavanju besednih in stavčnih povezav. Tu si bodo pomagali z obstoječimi pravnimi slovarji in tezavri, predvsem pa tudi s statistiko (pojmov, ki se ponavadi in normalno pojavljajo skupaj). Vse to jim bo omogočilo, da bodo v bistvu zelo obogatili praktično vrednost besedilnih podatkovnih zbirk.

Tako obogatene zbirke (sedaj že tudi ZNANJA) bodo služile za številne druge koristne namene in projekte, od katerih bo »matična« družba AI-in-Law razvijala le nekatere, praviloma pa jih bodo uporabljali drugi subjekti, na podlagi dokumentacije, specifikacije in navodil osnovnega razvojnega sistema.

Moduli umetne inteligence (temelječi na obogatenih zbirkah pravnega znanja) bodo lahko koristno uporabljeni prav pri vsakem projektu modernizacije (kateregakoli) sodnega sistema, saj jih bodo izvajalci lahko uporabili za izdelavo ekspertnega sistema za spremljanje sodnih postopkov. Krona tega bo gotovo na koncu, ko bodo sodniki lahko s pomočjo računalnika dobili osnutek (predlog, katerega bodo lahko sprejeli, zavrgli ali dopolnili) sodbe z obrazložitvijo.

Podobno (ali pa še bolj) uporabni bodo moduli AI (kot obogatene zbirke pravnega znanja) na področju javne uprave in drugih zahtevnih sistemov množičnega komuniciranja z uporabniki. Vloge v elektronski obliki so (le) prvi korak … do končnega cilja, da vlagatelj dobi tudi kvalitetno in hitro rešitev.

Ko bodo celotne zakonodaje posameznih držav (EU) obdelane in obogatene z znanjem (meta podatki), jih bo tudi lažje med seboj primerjati in usklajevati (s predpisi EU). In ker bodo takšni sistemi med seboj povezani, bo neprimerno lažje naprej graditi kvalitetne in kompatibilne pravne sisteme. Ob spremembi enega (člena) zakona, bodo na več mestih zasvetili rdeči gumbi: v upravnem postopku za izdajanje potnih listov, v spletni aplikaciji za izvršilne predloge, v komercialnem programu za odvetniške pisarne, v službi za evropske zadeve, v mednarodnem programu za medsebojno obveščanje državnih tožilstev itd.

Jasno je, da se bo uporaba umetne inteligence v pravu, od zakonodajnega postopka naprej, poznala tudi pri kvaliteti, saj bo v pravnih predpisih ter sodnih in upravnih odločbah manj leporečja, nejasnosti, dvoumnosti, napak, podvajanj, itd.

Družba AI-in-Law je svoje vmesne rezultate (po dveh letih petletnega projekta) tudi že javno predstavila na pomembni in odmevni mednarodni konferenci »e-Pravosodje & e-Pravo 2008«, katero je organizirala Slovenija v okviru predsedovanja EU. V Portorožu so bila vsa predavanja strokovnjakov družbe AI-in-Law pred 400 udeleženci sprejeta z velikim zanimanjem in odobravanjem.

Bil sem zelo ponosen, ko sem videl, da smo Slovenci enkrat za spremembo uspešno nekaj »učili« informacijske strokovnjake iz Avstrije, Nemčije, Francije, Velike Britanije, Španije …

**We plan to connect the best researchers and developers from various countries on the field of AI & Law with investors who believe that well planed and produced modules of AI could be of great value for different future (say - 5 year) projects involving e-justice, e-administration, e-forms, e-legislation, online created documents, etc. The newly established company will try to take and maintain the leading position in this area of endless opportunities. We truly believe that this practical collaborative approach would first of all raise general awareness about tangible benefits AI would bring into the legal world, and secondly, motivate investors to help with the current and future projects and research.

18. avgust 2008

Brez umetne inteligence je računalnik neumen

Pred nami je največja revolucija na področju iskalnih strojev! Dosedanja gola zaporedja znakov (strings of characters) v besedilih se bodo dala računalniku prepoznati s pomočjo vse bolj razvite umetne inteligence. Potem ne bo več tako usodnega pomena, če smo pri iskanju izbrali ustrezne »ključne besede«, saj bo bolj pomemben POMEN besedil (tudi iskalnega izraza), kot pa znaki s katerimi so napisani …

Bolj kot razvijamo in obvladujemo informacijske tehnologije, bolj spoznavamo, kako fantastično razvita in popolna s(m)o že milijone let delujoča živa bitja - in mi ljudje, kot krona stvarstva še posebej. Sedaj, ko imamo že super hitre procesorje, gigabajtne nosilce »spomina« in celo terabajtno svetovno omrežno podporo, uspevamo počasi (in zelo nezanesljivo) računalniško prepoznavati obraze na (ustrezno kvalitetnih) slikah, kar je sicer prava malenkost za vsakega povprečnega otroka, pa čeprav tudi preko človeškega očesa informacije pridejo v možgane preko tisočih pikčastih impulzov (v bistvu tudi digitalnih) …

Družbe, kot Riya*, ki so doslej uspele še najbolje spoznati vsebino slik (»Visual Search«), se hvalijo s tem, da so še največ dosegle na enem od področij umetne inteligence – »computer vision«. Slike, katere mi spoznamo in »razumemo, sprejmemo« v sekundi, morajo računalniki najprej spremeniti v matematične algoritme in šifre (povprečne slike jih imajo vsaka po 6.000), nato pa se začne strašno komplicirano »računanje« zato, da bi se našle znane in smiselne kombinacije … In če naj bi nek obraz prepoznali za potrebe bio-metričnih potnih listov, potem je treba dobljene kombinacije primerjati še s tisoči in tisoči drugih slik … (kar mi spet naredimo ponavadi kar mimogrede, ko se spomnimo znanca izpred 10 let) …

Na vizualno področje sem opozoril zato, da bi si lažje predstavljali, na kakšen zapleten način mora »neumni« računalnik začeti delovati tudi na področju besedil. Zaporedje črk in drugih znakov je potrebno najprej »na grobo« spoznati in razdeliti na besede in stavke. Umetna inteligenca je potrebna od tu naprej, začenši z že dokaj razvitimi jezikovnimi tehnologijami. Visok nivo (formalnega) prepoznavanja besedil tudi v slovenščini si lahko ogledate pri Microsoftovih orodjih v Pisarni – Office 2003, kjer vam računalnik lahko že kar koristno pomaga pri odpravljanju slovničnih napak.

Trdo delo pa se tu seveda šele začenja: ugotoviti, kaj besedilo POMENI, in to potem povezati z drugimi ustreznimi pojmi in besedili. Za to pa je potrebno (biti vključeno) že zelo specifično znanje. Umetna inteligenca na področju medicine (ki je tudi že precej razvita), mora povezati težave s krvnim pritiskom z (ne)primerno prehrano in z ustreznimi terapijami in zdravili.

Nepogrešljivi iskalni stroji doslej niso imeli ustreznih rešitev, niti vključenih elementov umetne inteligence. Google bi nas na področju medicine verjetno hitro pripeljal tudi od visokega pritiska do ustreznih zdravil (s plačanimi oglasi). Za splošno iskanje je tudi to ponavadi dovolj, nikakor pa ni to prava smer za bolj zahtevno in kvalitetno iskanje – predvsem tudi ne na pravnem področju. Z vidika iskalnika je namreč celotni internet ena sama ogromna zakladnica najrazličnejših besed (na določenih straneh), skupaj s povezavami med temi besedami in stranmi. Pa prav nič več!

Upam si celo trditi, da še tako izpopolnjen(i) iskalnik(i) á la Google predstavlja(jo) povsem neustrezno smer (»dead end«) nadaljnjega razvoja obdelave informacij, razen seveda, če jim bodo določili povsem novo arhitekturo. Kot si lahko predstavljate, bodo morali pri (zasnovi in) izdelavi novega (pravega) iskalnika na medicinskem področju sodelovati predvsem zdravniki, na pravnem pa – predvsem pravniki. Med bilijoni in bilijoni besed (pogosto obdanih z morjem navlake) bo možno dobro informacijo najti le z uporabo pravega ZNANJA (ki pa doslej ni bilo ustrezno vkomponirano v iskalnike).

Imamo srečo, da je prav pravo eno od najbolj ustreznih področij človeške dejavnosti za obvladovanje s pomočjo računalnikov, saj se študentje na nek način vsa leta študija učijo predvsem raznih PRAVIL.

S pomočjo umetne inteligence bo torej potrebno najprej vsa ta pravila (in njihove povezave) predstaviti računalniku, ki bo odslej znal prepoznati tudi nova (pravna) besedila in nam jih predstaviti preko iskalnika. Postopek bo sicer dopolnjen s spoznanji strojnega učenja in statistike, vendar bo temeljil na znanju in pravilih, katera bodo definirali pravniki.

Takšnega zelo ambicioznega (in dolgotrajnega) projekta uporabe umetne inteligence v pravu smo se prvi lotili Slovenci, skupaj s partnerji iz nekaterih najrazvitejših držav EU. Zaradi boljše možnosti zaščite intelektualne (»industrijske«) lastnine smo družbo »AI-in-Law Future Technologies Inc« sicer ustanovili v ZDA, vendar lahko napovem, da bodo uporabniki sistema IUS-INFO eni prvih, ki bodo uporabljali PRAVI pravni iskalnik.

*Priporočeni link: http://www.riya.com/

11. avgust 2008

Project LLx - 0811

To poletje smo vsi malo zaljubljeni… Pripravljamo namreč našo prvo aplikacijo za Facebook, ki pa bo imela zelo zanimivo vsebino: ljubezenska pisma (in druge podobne izraze simpatije), prilagojena lastnostim (profilu) naslovljenca/ke…

Sedaj torej že lahko razkrijem pomen imena našega skrivnostnega »Projekta LLx«… Seveda: »Love Letters, X- version«…

Zadevo bomo naredili najprej za slovenske uporabnike (in ta bo tudi v celoti brezplačna!), nato pa bomo vse skupaj prevedli (in priredili) v angleščino in druge jezike. Priznam, da nameravamo potem to tudi tržiti… No, ja kakšen dolar bo pa že vreden vzorec kakšnega kvalitetnega pisemca, prilagojenega ljubljeni osebi in naravi razmerja z avtorjem, saj bo izdelek tudi lepo okrašen, z grafiko in (malo kasneje) razpoloženjsko glasbo v ozadju. Posebno če to primerjamo s popularnimi »darili«, katera ljudje za 1$ kupujejo, čeprav gre le za najmanjšo slikico torte ali srčka…

Poskusiti ni greh… Bomo videli, kako globoko se nam bo uspelo preriniti v 90 milijonski trg FB uporabnikov, ki so vsi le kakšno sekundo in nekaj klikov oddaljeni… Takole smo razmišljali na začetku za korajžo: »Če jih prodamo le 1 miljon, pa smo že na konju…«

Danes smo imeli usklajevalni sestanek in sem kar zadovoljen s potekom in dosedanjim delom ekipe. Programerji so si lepo razdelili naloge in se eden ukvarja z vmesnikom, drugi z analizo besedil, tretji z ozadjem na strežniku, četrti s Facebook okoljem itd. Vesel sem, da se je naš »competitive dialogue« tako lepo iztekel in da se našlo delo za vsakega, ki se nam je pridružil.

Malo kritično pa je postalo z vsebino!? Ker rabimo veliko različnih vzorcev (ljubezenskih pisem), smo se odločili da uporabimo kar »crowd-sourcing«: k sodelovanju bomo povabili kar malo širši krog naših prijateljev in prijateljic na Facebooku! Konec koncev je bo to tudi naša končna »ciljna skupina« in se bo prav tu najlažje izoblikovala ustrezna vsebina glede na okus publike…

8. avgust 2008

Svetovna zakladnica znanja na dlančniku

Google je sicer (prvi) daleč največji in najvažnejši iskalni stroj na svetu, vendar pa ni edini »veliki igralec«, saj imajo skoraj v vseh (večjih) državah tudi še kakšnega nacionalno (regionalno) usmerjenega »playerja«. Slovenski »Najdi.si« žal nima tako (hvaležno) velikega trga, kot na primer ruski »Yandex« …

Če bi imel trenutno kaj prostih investicijskih sredstev, bi jih zlahka nekaj namenil tudi napovedanim novim delnicam Yandexa (IPO), saj že danes obvladuje kar 40% ruskega trga iskanih strojev (Google le 30%). Po velikosti je celo drugi največji (iskalni gonilnik) v Evropi. Očitno se tudi kar spodobno prilagaja razvojnemu trendu v smeri Web 2.0, saj je prevzel tudi MoiKrug.ru (ja, seveda: Moj krog), ki je največje socialno omrežje za ruske poslovneže. Dobra kombinacija!

Poznavalci vedo, da se bo v naslednjih letih ogromno sredstev obrnilo (in potrošilo) na področju SEO – »Search Engine Optimization«.

Po že večkrat omenjeni svetovni zakladnici znanja na internetu, je seveda treba iskati in ker je »zadetkov« praviloma vedno preveč, je zelo pomembno, kateri od teh so (nam) prikazani na začetku, na vrhu (vsi ostali bodo verjetno ostali neizkoriščeni, neprebrani). Tukaj pa se prepletajo vse mogoče tehnologije, algoritmi, triki in (oglaševalski) interesi.

Optimizacija se lahko izvaja na obeh straneh: »aktivno« pri samem iskalnem stroju, kot tudi na »pasivni« strani – spletnih straneh, ki bodo poindeksirane ter vsrkane v »goooga-bazo.

Poznam kar nekaj informatikov (tudi v Sloveniji), katerih se drži oznaka (pohvala), da znajo spletne strani tako dobro opremiti z ustreznimi (meta) oznakami, da jih bodo iskalniki kot Google ali Najdi.si prikazali visoko na seznamu zadetkov. V bistvu gre za razne trike, ki pa morajo biti seveda nenehno posodabljani, saj se na drugi strani upravljalci iskalnikov nenehno trudijo s »proti-triki« (podobno razmerje, kot na področju nadlegovalne pošte).

Takšna referenca »dobrega optimizatorja iskanja« je med poslovneži tako pomembna, da lahko predstavlja tudi odločilni kriterij pri zaposlovanju informatikov. V tej novi spletni ekonomiji, posebno še pri trgovini, je pač ključnega pomena, da se bo naš proizvod (ali storitev) znašel na vrhu seznama zadetkov. »Pa naj stane koliko hoče!« In tudi stane: če iskalnemu stroju (Googlu je to glavni prihodek!) dobro plačate, se pač lahko znajdete višje, kot bi se sicer …

Na začetku smo se ob tem celo nekaj zmrdovali, češ da to »ni fair«, da gre za goljufanje, zaslužkarstvo … No, danes smo to pač sprejeli kot nekaj normalnega … Podobno, kot se tudi več ne zgražamo, ker so vrhunski športniki vsi po vrsti profesionalci… Pred nekaj desetletij so jih zaradi tega še izganjali iz Olimpijade …

V bistvu je že lokalni pristop neka oblika optimiziranja iskalnih gonilnikov! In zato tudi šansa za manjše lokalne Davide proti GG (Google Golijat).

Če iščete »lopato« na Googlu, dobite ponudbo družbe »Lopata, Flegel & Company LLP” za razne konzultantske in izobraževalne storitve … česar pa verjetno niste iskali … Če pa vnesete “lopato” na domačem “Najdi.si”, dobite to, kar ste iskali: “nerjaveče lopate iz polipropilena, ki so izjemno lahke in primerne za odmetavanje snega ali drugih materialov” (ProSigma).

Naslednji razlog za pomembnost (in perspektivnost) tudi lokalnih iskalcev pa je povsem tehnični. Mi smo sicer probleme z našimi tremi šumniki v glavnem že rešili (ali se jih navadili) in je prednost našega Davida (Najdi.si) pred Golijatom (da ga več ne ponavljam …) le še minimalna, drugače pa je pri nekaterih bolj vzhodnjaških civilizacijah. Popolnoma drugačne pisave (kitajska, japonska, korejska) so gotovo (vsaj na začetku) dajale prednost domačim rešitvam in zato ni čudno, da imajo tudi tam takšne lokalne velikane (pa še večje) iskalce, kot je Yandex.

Da, samo na začetku … Saj v drugi fazi se lahko tudi globalni »playerji« kar hitro ponižajo in prilagodijo … Kar vnesite malo drugačno verzijo Googla - http://www.google.ae/ - pa boste videli, da se iskalni izraz vnaša od desne proti levi, ker gre za arabsko pisavo …

Prepričan sem, da se bo v prihodnosti največja optimizacija iskanja dosegla (izvedla) na strani »strežnika«, še najbolj seveda pri GG. Tukaj je še ogromno možnosti. Na začetku je šlo predvsem za takšne algoritme, ki so ugotavljali pogostost obiskovanja spletne strani (ki je predmet indeksiranja), njeno pomembnost (od kje so nanjo nameščeni linki), rangiranje pri drugih, itd. Temu so se dodajali vse bolj zahtevni statistični algoritmi, ki pa se vse doslej (vsaj kolikor je meni znano) niso spuščali v pravi POMEN besedil, temveč so se omejevali na besede in besedne zveze v mehaničnem smislu.

Največja revolucija na področju iskalnih gonilnikov pa je še pred nami! Dosedanja gola zaporedja znakov (strings of characters) v besedilih se bodo dala računalniku prepoznati s pomočjo vse bolj razvite umetne inteligence. Potem ne bo več tako usodnega pomena, ali smo pri iskanju izbrali ustrezne »ključne besede«, saj bo bolj pomemben POMEN besedil (tudi iskalnega izraza), kot pa znaki s katerimi so zapisani …

*Priporočeni link: http://www.yandex.com/

Anton Tomažič

Pravnik & podjetnik

Moje domače strani

Arhiv spletnega dnevnika

Oznake

Dobre knjige

Dobra glasba

Priporočam

Velika priložnost

Bralci

Understandig the Crisis in the Markets

31. avgust 2008

Koga naj volim?

27. avgust 2008

Vse slovensko pravo na obesku za ključe

21. avgust 2008

Umetna inteligenca za telebane

18. avgust 2008

Brez umetne inteligence je računalnik neumen

11. avgust 2008

Project LLx - 0811

8. avgust 2008

Svetovna zakladnica znanja na dlančniku

Moya knjiga

Moy drugi blog

Moya Muzika

&

Slovenski jezik

Pridite na Facebook

Poglejte še na - Drugi svet

Anton Tomažič

Pravnik & podjetnik

Moje domače strani

Arhiv spletnega dnevnika

Oznake

Dobre knjige

Dobra glasba

Priporočam

Velika priložnost

Bralci

Understandig the Crisis in the Markets

31. avgust 2008

Koga naj volim?

27. avgust 2008

Vse slovensko pravo na obesku za ključe

21. avgust 2008

Umetna inteligenca za telebane

18. avgust 2008

Brez umetne inteligence je računalnik neumen

11. avgust 2008

Project LLx - 0811

8. avgust 2008

Svetovna zakladnica znanja na dlančniku

Moya knjiga

Moy drugi blog

Moya Muzika

&

Slovenski jezik

Pridite na Facebook

Poglejte še na - Drugi svet

Naročite se na Moy Blawg