„Алфаго” учи сам, али не зна да распореди време
Машина која је вештачком интелигенцијом победила човека у древној азијској мисаоној игри „Алфаго” један је од најпознатијих примера тзв. дубоког учења – машинског учења помоћу неуралних мрежа. Зато је можда изненађујући податак да је неке кодове који су довели до победе направио стари добри човек, пише „Гардијан”.
Софтвер који је у марту потукао јужнокорејског шампиона у игри „го” сам је себе научио да игра ову стару азијску игру тако што је одиграо милионе симулација против самог себе. „Алфаго” учи тако што проучава раније људске игре, али такође игра сам против себе и учи из сопствених грешака. Ипак неке ствари, показало се, једноставно не могу да се науче.
„Гугл” планира да постигнућа моћне машине „Алфаго” примени у важним областима као што су медицина и роботика
Тор Грепел, главни истраживач у компанији „Дип мајнд” (у власништву „Гугла” већ две године), каже да је систем ове машине био веома добар када треба да изабере део табле на коју ће да фокусира размишљање, али не тако добар када треба да престане да размишља и повуче потез.
То се показало као проблем, јер најтежи мечеви игре „го” играју се по сложеном временском распореду: у игри против Лија, на пример, сваки играч је имао укупно два сата за све потезе, и три интервала „био-јоми” од по минут, које могу да користе када два сата истекну. Ако један „био-јоми” не искористе цео, могу да га користе и на следећем потезу. Ако истекне минут, заувек га губе. Кад играч потроши сва три, изгубио је због времена.
„Људи управљају временом на прилично софистициран начин. У тешким ситуацијама размишљају много дуже, а онда брже реагују у другим и ми то покушавамо да опонашамо. Време је важан ресурс. Што дуже можемо да размишљамо о потезу, у начелу ћемо боље одиграти, али време је ограничено. Дакле, нашли смо метод да одредимо тренутак у ком алгоритам више неће мењати своје одлуке без обзира на то колико даље буде размишљао”, објаснио је Грепел.
Међутим, уместо да правила тајминга угради у роботово разумевање игре, тим је то унео као ограничење и, за разлику од остатка машине, алгоритам за тајминг је на крају створен ручно. На крају је ипак усавршен алгоритамски, оптимизацијом кроз систем евалуација.
„Имали смо различите кривуље које смо поредили. На пример, да користи мање времена на почетку, а више касније или обрнуто и тестирали смо шта је било најбоље”, објашњава Грепел.
Зато, не брините превише да ће вам машине одузети посао. Увек постоји нешто што ће човек морати да уради, макар само да притиска штоперицу, пише „Гардијан”.
„Алфаго” је крајем прошле године први пут победио професионалног играча у кинеској мисаоној игри на плочи која је стара два и по миленијума и компликованија чак и од шаха. Ове године у марту изазивач је био светски првак у игри, Ли Седол из Јужне Кореје, који је поражен резултатом 4 према 1.
Компјутери су пре скоро 20 година савладали светског шампиона у шаху. Ај-Би-Емова машина „Дип блу” савладала је Гарија Каспарова 1997. године. Међутим, за разлику од шаха, где има просечно 35 могућности и након сваког потеза нових 35, код игре „го” после сваког потеза има просечно 250 могућности. Игра се на плочи 19х19 поља са црним и белим истоветним фигурама.
„Гугл” планира да постигнућа ове моћне машине примени у важним областима као што су медицина и роботика.
Подели ову вест

Комeнтар успeшно додат!
Ваш комeнтар ћe бити видљив чим га администратор одобри.