Kada tačnost ustupi mesto brzini i praktičnosti
Милена Совић
Postalo je već sasvim uobičajeno da osim što se trudi da na svako pitanje ima odgovor, veštačka inteligencija (VI) laska, dodvorava se, ali i zbija slatke šale na račun osobe koja sa njom komunicira. Zbog toga možda i ne čudi ali svakako zabranjiva činjenica što je u današnjem svetu mnogima nezamislivog tehnološkog napretka koji nas sve više udaljava jedne od drugih, veliki broj onih koji se okreću i veruju VI, pa čak i kada znaju da su njeni saveti i preporuke o ozbiljnim životnim pitanjima – pogrešni. A da VI greši i to poprilično baš kada je reč recimo o zdravstvenim problemima, zbog čega joj se kao nekad „Guglu” korisnici često obraćaju, pokazalo je i najnovije istraživanje stručnjaka iz SAD, Kanade i Velike Britanije. Oni su analizirali pet popularnih VI platformi – „Čet džipiti”, „Džeminaj”, „Metu VI”, „Grok” i „Dipsik”, postavljajući im pitanja iz zdravstva. Rezultati su pokazali da je gotovo dve trećine odgovora problematično i visoko problematično. A ono što je karakteristično je što je svaki od njih dat sa visokim stepenom samopouzdanja, iako nijedan od analiziranih sistema nije pružio potpuno tačne i kompletne reference za svoje tvrdnje.
Na pitanje zašto koristimo VI iako znamo da greši, Milena Šović, stručnjak koji se bavi razvijanjem alata veštačke inteligencije, kaže za „Politiku” da korisnici četbotova ne veruju VI bezrezervno, ali da u praksi prave pragmatičnu procenu.
„Brzina dobijanja odgovora, stalna dostupnost i jednostavnost upotrebe često se doživljavaju kao veća korist od mogućnosti povremene greške. Takva logika može da bude razumljiva kada je reč o manje važnim pitanjima, ali postaje problematična kada se prenosi na oblasti u kojima netačan savet može da ima ozbiljnije posledice, poput zdravlja, finansija ili pravnih odluka. Rizik nije samo u tome što mogu da se donesu pogrešni zaključci, već što se vremenom stvara navika oslanjanja na ove alate i onda kada bi provera morala da bude temeljnija”, ukazala je Šovićeva.
Svoje tvrdnje naša sagovornica je argumentovala rezultatima istraživanja koje je nedavno sprovela i to baš o tome koliko korisnici imaju poverenja u velike jezičke modele (Large Language Models – LLM). Povod za ovu svojevrsnu analizu, kako je objasnila, bila je nagla i široka primena LLM-a u svakodnevnom radu i donošenju odluka, naročito među obrazovanim korisnicima.
„Želela sam da utvrdim da li visokoobrazovani korisnici koji se najčešće smatraju da su informisani, digitalno pismeni i kritički nastrojeni prema novim tehnologijama, iako prepoznaju ograničenja i netačnosti velikih jezičkih modela – nastavljaju da se na njih oslanjaju i u kojoj meri ta svest utiče na njihove odluke i svakodnevnu upotrebu”, navela je ona. Anketu je sprovela među 302 ispitanika iz Srbije sa završenim visokim obrazovanjem, od septembra do decembra prošle godine, putem profesionalne mreže „Linkedin”.
Rezultati istraživanja su pokazali da su veliki jezički modeli već postali deo svakodnevne rutine – 94,4 odsto ispitanika ih koristi u svakodnevnom životu, a 81,5 procenata i za složene teme, kao što su zdravlje, pravo, finansije i obrazovanje.
„Ključni paradoks koji smo uočili je – da je čak 84,7 odsto korisnika navelo da je u prošlosti dobilo netačan odgovor od LLM-a, dok 56,3 procenta smatra da ovi sistemi često greše, pa ipak 58 odsto njih se i dalje oslanja na savete. Takođe, 33,1 procenat nastavlja da ih koristi za važne odluke, čak i nakon što su dobili netačan odgovor”, napomenula je naša sagovornica.
Ovi rezultati ukazuju na svesno prihvatanje rizika. Razlog tome je u odgovoru čak 51,6 odsto ispitanika koji su naveli da im LLM pruža osećaj kontrole nad procesom donošenja odluka. „Oni veruju da su dovoljno kritični da sami prepoznaju greške i netačne odgovore”, ocenila je naša sagovornica.
Osim toga, statistika je pokazala i da u digitalnoj eri tačnost sve češće ustupa mesto brzini i praktičnosti.
„Čak 35,8 odsto ispitanika navelo je da im je važnije što LLM pruža odgovore skoro istog trenutka i što je uvek dostupan nego činjenica da ponekad daje netačne informacije. Takav pristup kratkoročno povećava produktivnost, ali dugoročno može da dovede do ozbiljnih posledica, naročito ako se isti obrazac prenese u profesionalno okruženje – postoji rizik da se netačne ili neproverene informacije sve češće koriste kao osnov za strateške odluke”, upozorila je Šovićeva.
Takođe, poverenje u LLM nije isključivo racionalno. Čak 63,5 odsto ispitanika navelo je da netačni odgovori ovih sistema deluju uverljivo i pouzdano, a 45,7 procenata priznaje da je sklono da prihvati odgovor ako je jasan i dobro strukturiran, čak i bez dodatne provere.
„Jasnoća i struktura odgovora, upotreba stručnih termina, kao i samouveren ton LLM-o stvaraju utisak kompetentnosti, čak i kada je sadržaj spornog kvaliteta. LLM su trenirani da daju takve odgovore, duge i gramatički tačno napisane rečenice, napisane u profesionalnom tonu. Čak i kad sadržaj nije tačan, forma je toliko ubedljiva da „zvuči ispravno”, objasnila je Šovićeva.
Šta očekivati u budućnosti?
„Upotreba ovih sistema će nastaviti da raste i postaće još dublje integrisana u profesionalni i privatni život. Pitanje nije da li će VI biti prisutna, već da li će se razvijati kritička kultura njene upotrebe”, zaključila je naša sagovornica.
Nepristrastan izvor informacija
Na pitanje zbog čega su korisnici čet džipitija skloniji da veruju veštačkoj inteligenciji nego ljudima, Milena Šović, stručnjak koji se bavi razvijanjem alata VI, kaže da se veliki jezički modeli (LLM) doživljavaju kao objektivniji izvor. U istraživanju koje je sprovela, čak 58,6 odsto ispitanika smatra da je LLM neutralniji od ljudi. „Mnogi doživljavaju LLM kao nepristrastan izvor informacija jer on nema emocije, stavove, predrasude, interese ili želju da nekome ugodi ili ga osudi. VI daje odgovor koji izgleda neutralan i zasnovan na podacima”, ukazala je naša sagovornica.
Osim toga, kako je objasnila, u komunikaciji sa mašinom, primetno je odsustvo „crvenih zastavica” i kontekstualnih signala koje primećujemo kod ljudi. „Kad čovek ne govori istinu ili nije siguran, često okleva, koristi reči poput mislim, verovatno, možda. Kada postoje neke nelogičnosti u govoru, počne da se crveni ili se vrpolji, ton glasa i izraz lica mu je drugačiji. Kod LLM-a nema tih znakova i naš mozak ne aktivira alarm za sumnju”, ocenila je Šovićeva.
Izbegavanje neprijatnih razgovora sa ljudima
Neki ljudi koriste VI da bi izbegli direktan kontakt sa drugima, bilo zbog socijalne anksioznosti, loših iskustava u prošlosti bilo jednostavno želje da zadrže kontrolu nad razgovorom – jer ih veštačka inteligencija neće prekidati, kritikovati niti će emocionalno reagovati, ukazala je Milena Šović. Napominje da je u istraživanju koje je sprovela posebno problematično to što je čak 51,6 odsto ispitanika navelo da im „razgovor” sa velikim jezičkim alatima pomaže da izbegnu neprijatne razgovore sa ljudima. „U određenim situacijama saveti koje generiše veštačka inteligencija prihvataju se i pre saveta iz neposrednog okruženja. Čak 25,8 odsto ispitanika navelo je da češće sledi savet LLM-a nego člana porodice ili prijatelja. Istovremeno, 16,5 procenata je izjavilo da bi, ukoliko se savet stručnjaka i odgovor VI razlikuju, veću težinu dalo odgovoru koji pruža sistem”, ukazala je naša sagovornica.