sreda, 15.07.2020. ✝ Verski kalendar € Kursna lista
ponedeljak, 27.06.2016. u 22:00 J. J. K.

„Alfago” uči sam, ali ne zna da rasporedi vreme

Kompjuteru koji je pobedio svetskog šampiona u drevnoj kineskoj igri najteže je bilo naučiti da prekine razmišljanje i odigra potez
„Алфаго” је играо мисаону игру „го” против Ли Седол из Јужне Кореје и победио га (Фото Ројтерс)

Mašina koja je veštačkom inteligencijom pobedila čoveka u drevnoj azijskoj misaonoj igri „Alfago” jedan je od najpoznatijih primera tzv. dubokog učenja – mašinskog učenja pomoću neuralnih mreža. Zato je možda iznenađujući podatak da je neke kodove koji su doveli do pobede napravio stari dobri čovek, piše „Gardijan”.

Softver koji je u martu potukao južnokorejskog šampiona u igri „go” sam je sebe naučio da igra ovu staru azijsku igru tako što je odigrao milione simulacija protiv samog sebe. „Alfago” uči tako što proučava ranije ljudske igre, ali takođe igra sam protiv sebe i uči iz sopstvenih grešaka. Ipak neke stvari, pokazalo se, jednostavno ne mogu da se nauče.

„Gugl” planira da postignuća moćne mašine „Alfago” primeni u važnim oblastima kao što su medicina i robotika

Tor Grepel, glavni istraživač u kompaniji „Dip majnd” (u vlasništvu „Gugla” već dve godine), kaže da je sistem ove mašine bio veoma dobar kada treba da izabere deo table na koju će da fokusira razmišljanje, ali ne tako dobar kada treba da prestane da razmišlja i povuče potez.

To se pokazalo kao problem, jer najteži mečevi igre „go” igraju se po složenom vremenskom rasporedu: u igri protiv Lija, na primer, svaki igrač je imao ukupno dva sata za sve poteze, i tri intervala „bio-jomi” od po minut, koje mogu da koriste kada dva sata isteknu. Ako jedan „bio-jomi” ne iskoriste ceo, mogu da ga koriste i na sledećem potezu. Ako istekne minut, zauvek ga gube. Kad igrač potroši sva tri, izgubio je zbog vremena.

„Ljudi upravljaju vremenom na prilično sofisticiran način. U teškim situacijama razmišljaju mnogo duže, a onda brže reaguju u drugim i mi to pokušavamo da oponašamo. Vreme je važan resurs. Što duže možemo da razmišljamo o potezu, u načelu ćemo bolje odigrati, ali vreme je ograničeno. Dakle, našli smo metod da odredimo trenutak u kom algoritam više neće menjati svoje odluke bez obzira na to koliko dalje bude razmišljao”, objasnio je Grepel.

Međutim, umesto da pravila tajminga ugradi u robotovo razumevanje igre, tim je to uneo kao ograničenje i, za razliku od ostatka mašine, algoritam za tajming je na kraju stvoren ručno. Na kraju je ipak usavršen algoritamski, optimizacijom kroz sistem evaluacija.

„Imali smo različite krivulje koje smo poredili. Na primer, da koristi manje vremena na početku, a više kasnije ili obrnuto i testirali smo šta je bilo najbolje”, objašnjava Grepel.

Zato, ne brinite previše da će vam mašine oduzeti posao. Uvek postoji nešto što će čovek morati da uradi, makar samo da pritiska štopericu, piše „Gardijan”.

„Alfago” je krajem prošle godine prvi put pobedio profesionalnog igrača u kineskoj misaonoj igri na ploči koja je stara dva i po milenijuma i komplikovanija čak i od šaha. Ove godine u martu izazivač je bio svetski prvak u igri, Li Sedol iz Južne Koreje, koji je poražen rezultatom 4 prema 1.

Kompjuteri su pre skoro 20 godina savladali svetskog šampiona u šahu. Aj-Bi-Emova mašina „Dip blu” savladala je Garija Kasparova 1997. godine. Međutim, za razliku od šaha, gde ima prosečno 35 mogućnosti i nakon svakog poteza novih 35, kod igre „go” posle svakog poteza ima prosečno 250 mogućnosti. Igra se na ploči 19h19 polja sa crnim i belim istovetnim figurama.

„Gugl” planira da postignuća ove moćne mašine primeni u važnim oblastima kao što su medicina i robotika.

Komentari0
aaf98
Molimo vas da sе u komеntarima držitе tеmе tеksta. Rеdakcija Politikе ONLINE zadržava pravo da – ukoliko ih procеni kao nеumеsnе - skrati ili nе objavi komеntarе koji sadržе osvrtе na nеčiju ličnost i privatan život, uvrеdе na račun autora tеksta i/ili članova rеdakcijе „Politikе“ kao i bilo kakvu prеtnju, nеpristojan rеčnik, govor mržnjе, rasnе i nacionalnе uvrеdе ili bilo kakav nеzakonit sadržaj. Komеntarе pisanе vеrzalom i linkovе na drugе sajtovе nе objavljujеmo. Politika ONLINE nеma nikakvu obavеzu obrazlaganja odluka vеzanih za skraćivanjе komеntara i njihovo objavljivanjе. Rеdakcija nе odgovara za stavovе čitalaca iznеsеnе u komеntarima. Vaš komеntar možе sadržati najvišе 1.000 pojеdinačnih karaktеra, i smatra sе da stе slanjеm komеntara potvrdili saglasnost sa gorе navеdеnim pravilima.

Komentar uspešno dodat!

Vaš komentar će biti vidljiv čim ga administrator odobri.

Prijavite se na našu mailing listu

* Obavezna polja