уторак, 29.09.2020. ✝ Верски календар € Курсна листа
понедељак, 27.06.2016. у 22:00 Ј. Ј. К.

„Алфаго” учи сам, али не зна да распореди време

Компјутеру који је победио светског шампиона у древној кинеској игри најтеже је било научити да прекине размишљање и одигра потез
„Алфаго” је играо мисаону игру „го” против Ли Седол из Јужне Кореје и победио га (Фото Ројтерс)

Машина која је вештачком интелигенцијом победила човека у древној азијској мисаоној игри „Алфаго” један је од најпознатијих примера тзв. дубоког учења – машинског учења помоћу неуралних мрежа. Зато је можда изненађујући податак да је неке кодове који су довели до победе направио стари добри човек, пише „Гардијан”.

Софтвер који је у марту потукао јужнокорејског шампиона у игри „го” сам је себе научио да игра ову стару азијску игру тако што је одиграо милионе симулација против самог себе. „Алфаго” учи тако што проучава раније људске игре, али такође игра сам против себе и учи из сопствених грешака. Ипак неке ствари, показало се, једноставно не могу да се науче.

„Гугл” планира да постигнућа моћне машине „Алфаго” примени у важним областима као што су медицина и роботика

Тор Грепел, главни истраживач у компанији „Дип мајнд” (у власништву „Гугла” већ две године), каже да је систем ове машине био веома добар када треба да изабере део табле на коју ће да фокусира размишљање, али не тако добар када треба да престане да размишља и повуче потез.

То се показало као проблем, јер најтежи мечеви игре „го” играју се по сложеном временском распореду: у игри против Лија, на пример, сваки играч је имао укупно два сата за све потезе, и три интервала „био-јоми” од по минут, које могу да користе када два сата истекну. Ако један „био-јоми” не искористе цео, могу да га користе и на следећем потезу. Ако истекне минут, заувек га губе. Кад играч потроши сва три, изгубио је због времена.

„Људи управљају временом на прилично софистициран начин. У тешким ситуацијама размишљају много дуже, а онда брже реагују у другим и ми то покушавамо да опонашамо. Време је важан ресурс. Што дуже можемо да размишљамо о потезу, у начелу ћемо боље одиграти, али време је ограничено. Дакле, нашли смо метод да одредимо тренутак у ком алгоритам више неће мењати своје одлуке без обзира на то колико даље буде размишљао”, објаснио је Грепел.

Међутим, уместо да правила тајминга угради у роботово разумевање игре, тим је то унео као ограничење и, за разлику од остатка машине, алгоритам за тајминг је на крају створен ручно. На крају је ипак усавршен алгоритамски, оптимизацијом кроз систем евалуација.

„Имали смо различите кривуље које смо поредили. На пример, да користи мање времена на почетку, а више касније или обрнуто и тестирали смо шта је било најбоље”, објашњава Грепел.

Зато, не брините превише да ће вам машине одузети посао. Увек постоји нешто што ће човек морати да уради, макар само да притиска штоперицу, пише „Гардијан”.

„Алфаго” је крајем прошле године први пут победио професионалног играча у кинеској мисаоној игри на плочи која је стара два и по миленијума и компликованија чак и од шаха. Ове године у марту изазивач је био светски првак у игри, Ли Седол из Јужне Кореје, који је поражен резултатом 4 према 1.

Компјутери су пре скоро 20 година савладали светског шампиона у шаху. Ај-Би-Емова машина „Дип блу” савладала је Гарија Каспарова 1997. године. Међутим, за разлику од шаха, где има просечно 35 могућности и након сваког потеза нових 35, код игре „го” после сваког потеза има просечно 250 могућности. Игра се на плочи 19х19 поља са црним и белим истоветним фигурама.

„Гугл” планира да постигнућа ове моћне машине примени у важним областима као што су медицина и роботика.

Коментари0
69e4b
Молимо вас да се у коментарима држите теме текста. Редакција Политике ONLINE задржава право да – уколико их процени као неумесне - скрати или не објави коментаре који садрже осврте на нечију личност и приватан живот, увреде на рачун аутора текста и/или чланова редакције „Политике“ као и било какву претњу, непристојан речник, говор мржње, расне и националне увреде или било какав незаконит садржај. Коментаре писане верзалом и линкове на друге сајтове не објављујемо. Политика ONLINE нема никакву обавезу образлагања одлука везаних за скраћивање коментара и њихово објављивање. Редакција не одговара за ставове читалаца изнесене у коментарима. Ваш коментар може садржати највише 1.000 појединачних карактера, и сматра се да сте слањем коментара потврдили сагласност са горе наведеним правилима.

Комeнтар успeшно додат!

Ваш комeнтар ћe бити видљив чим га администратор одобри.

Пријавите се на нашу маилинг листу

* Обавезна поља