недеља, 09.08.2020. ✝ Верски календар € Курсна листа
петак, 21.02.2020. у 20:00 Александра Исаков

Информатичари на стазама Николе Тесле

Четворица суботичких информатичара добила су прву награду за систем напредног препоручивања садржаја, и ово решење је један корак ка стварању алата за „лекторисање” текста на српском језику
Борко Растовић, Стеван Острогонац и Тибор Рац (Фото: А. Исаков)

Суботица – Ове године прву награду на конкурсу „Стазама Николе Тесле” Савеза инжењера и техничара Србије освојила је група информатичара коју чине др Стеван Острогонац, Тибор Рац, Роберт Хајнал и Борко Растовић. Награђени су за идеју напреднијег система за аутоматско генерисање препорука који обухвата коришћење различитих типова података којима располажу сајтови за електронско пословање. Тема не говори много онима који нису у свету информатике, али ако се поједностављено каже – омогућава корисницима да лакше пронађу оглас, садржај који траже, а на основу њихових и претходних интересовања људи за које систем процени да су им слични – постаје јаснија.

„Систем за аутоматско препоручивање садржаја је интуитивна ствар. То је алгоритам који вам сервира садржај на сајту у складу са оним што тај систем претпоставља да је ваше интересовање, а на основу онога што сте раније гледали, на основу кључних речи унетих у претраге. Ми смо направили побољшања постојећег алгоритма. Зато награда није везана само за идеју већ за читав контекст и систем који је разрађен пре него што смо дошли до научне димензије овог пројекта”, каже за „Политику” др Стеван Острогонац.

Награђена група информатичара запослена је у приватној компанији у Суботици, а рад на стварању новог система довољно осетљивог да препозна потребе корисника отпочео је, наравно, као део комерцијалних потреба фирме. Корисници компјутера препознаће у овом опису да су то оне рекламе, то јест садржаји који их „прате” неко време након што су претраживали одређени појам. У исто време, овај фини инструмент помаже корисницима да лакше дођу до оног што траже, и на томе је пре две године почео да ради Тибор Рац, задужен за рад са клијентима. Међутим, каже Борко Растовић, менаџмент компаније им даје одрешене руке да наставе са истраживачким радом и тада им се у тиму придружује и Стеван Острогонац који је пре тога радио на Факултету техничких наука.

„Ми смо радили анализе текстова огласа, структурираних података које прикупљају особе задужене за то, као и интеракције корисника са садржајима. Побољшање тог система подразумева и значајне техничке проблеме, јер се ради о великим скуповима података, па иако је теоријски овакав алгоритам могао да се дефинише и пре 50 година, за реализацију су били потребни данашњи рачунари”, наставља Острогонац.

Иновативни део њиховог решења односи се на обраду текста у слободној форми, а то је управо област у којој информатичари нису још довољно урадили када је у питању српски језик. „Ово је сада искорак ка машинском учењу и ка науци о подацима”, каже Растовић.

„За анализу текста на српском не постоје добри алати који су слободни за употребу и потребно их је обезбедити, јер је то важан фактор у очувању нашег језика и културе”, каже Острогонац који се и на ФТН-у бавио говорним и језичним технологијама. Саговорници „Политике” истичу да за све светске језике овакви алати већ постоје и они се базирају, пре свега, на великим базама текстуалних података. Таква база за српски језик не постоји. „Немамо адекватне језичке ресурсе. Иако они постоје у Србији, затворени су, недоступни информатичарима. Кључна ствар у даљем развоју језичких алата је да се подаци отворе, да се отворе анотиране базе текстова и други ресурси који могу бити корисни за истраживање. Када бисмо имали некакву здружену базу података, када би сваки сајт дао податке на нивоу Србије, то би био невероватно користан и моћан алат за развој језичких апликација и технологија”, каже Острогонац.

Стварањем ових алата добили бисмо и за српски језик програм за лекторисање текста, на нивоу квалитета на ком су такви алати за енглески и друге светске језике, односно могли бисмо формулисати језички модел који осигурава правописну и граматичку исправност поруке. „То би могло да помогне и у комуникацији на друштвеним мрежама, где је начин изражавања прилично деградиран”, каже Острогонац.

Коментари0
5a12b
Молимо вас да се у коментарима држите теме текста. Редакција Политике ONLINE задржава право да – уколико их процени као неумесне - скрати или не објави коментаре који садрже осврте на нечију личност и приватан живот, увреде на рачун аутора текста и/или чланова редакције „Политике“ као и било какву претњу, непристојан речник, говор мржње, расне и националне увреде или било какав незаконит садржај. Коментаре писане верзалом и линкове на друге сајтове не објављујемо. Политика ONLINE нема никакву обавезу образлагања одлука везаних за скраћивање коментара и њихово објављивање. Редакција не одговара за ставове читалаца изнесене у коментарима. Ваш коментар може садржати највише 1.000 појединачних карактера, и сматра се да сте слањем коментара потврдили сагласност са горе наведеним правилима.

Комeнтар успeшно додат!

Ваш комeнтар ћe бити видљив чим га администратор одобри.

Пријавите се на нашу маилинг листу

* Обавезна поља