четвртак, 21.06.2018. ✝ Верски календар € Курсна листа
Последња измена 23:20

Српски језик неспреман за дигиталну будућност

Аутор: Ј. Кавајанедеља, 30.09.2012. у 22:00
Идеја је да се „паметним” уређајима једног дана обраћамо на српском

Симпатични јапански робот „асимо” ћаскао је недавно с Београђанима на енглеском. Ако желимо да му једног дана затражимо кафу на српском потребно је да му обезбедимо „уџбенике” из којих ће учити наш језик.

Да би осигурао себи опстанак у дигиталној будућности, неопходно је да језик има дигитализоване ресурсе. Према резултатима најновијег истраживања, српски је нажалост у групи оних који су у умреженом друштву информација и знања осуђени да нестану.

– Наш језик није припремљен за дигитално доба. Као што су поједини језици који нису имали писмо изумрли с последњим говорником, мислимо да језицима који немају добру подршку технологија прети дигитално изумирање, односно потиснуће их велики светски језици – каже професор математике Иван Обрадовић, који је са групом домаћих информатичара и лингвиста урадио анализу за српски језик у оквиру студије Технолошког савеза за вишејезичну Европу (МЕТА-НЕТ).

Језичке технологије већина људи редовно користи. На пример, за проверу граматичке исправности („спел чек” за енглески или РАС за српски). Ту спадају и интерактивне „секретарице” на смартфонима и системи аутоматског превођења попут популарног „Гугловог” преводиоца.

Језичке технологије, посебно машинско превођење, у највећој мери се ослањају на статистичке методе које захтевају невероватно велики број писаних и говорних фајлова, што је проблем за језике с малим бројем говорника. Често су непрецизне, што се види у неразумљивим машински преведеним упутствима за техничке производе, али и другде.

– Недавно сам добио писмо од жене која се представља као „промашај Селена”. Систем је механички превео енглеску реч „госпођица” као „промашај” јер се исто пише и изговара (miss). Дигитализовани језички ресурси побољшавају те преводе – објашњава Обрадовић, директор Информативног центра Београдског универзитета.

Дигитализација језичких ресурса је производња у дигиталном облику онога што смо навикли да срећемо у штампаном: речника, граматика, текстова, информација. Врло су важни паралелни корпуси на више језика, који су основа за машинско превођење.

У студији коју су за МЕТА-НЕТ урадили домаћи истраживачи, предвођени професором Душаном Витасом са Математичког факултета, српски је добио две јединице (за аутоматско превођење и граматичку проверу) и две двојке (за синтезу говора и расположивост језичких ресурса).

Исте оцене су добили бугарски, мађарски, румунски, грчки и језици земаља бивше СФР Југославије. Најбоље је оцењен енглески (четворком), а тројку су добили немачки, француски, холандски, италијански и шпански.

Холандски је, каже Обрадовић, добар пример да и мали језици могу да добију високо место на лествици. Иако нема велики број говорника, тамошња стручна јавност је препознала значај дигитализације.

Оно што енглески, француски и немачки имају, а српски (тренутно) нема јесте управо обимна језичка збирка у електронском облику.

Оливера Дурбаба, професор на катедри за германистику Филолошког факултета, каже да Немци овај посао раде веома темељно и развијају корпусне базе деценијама.

– Немачки и српски, у том смислу, не могу да се пореде, јер су немачки ресурси много обимнији и људи су обучени да направе спону између технологије и лингвистичке обраде. Код нас базе постоје, али су мале и неповезане.

Овај посао тражи ширу сарадњу лингвиста и информатичара и свих који се баве језиком и препознају значај информационих технологија за језик, наглашава професор Обрадовић.

Ако српски у неком будућем истраживању заради петицу, да ли то значи да ће зависност од енглеског бити мања?

– У Београду већ имамо неколико паметник кућа. Идеја је да сутра у управљању говорним језиком можемо да се обраћамо паметним уређајима на српском. Такође, уколико бисмо имали висок ниво подршке за машинско превођење, могли бисмо да користимо свој језик, а да га машина преводи. Не може се очекивати да ће рачунари савршено радити књижевне преводе, али у пословној комуникацији би то било сасвим могуће – закључује Обрадовић.

----------------------------------------------

Интернет не доноси пропаст

У јавности се често води полемика о томе да ли ће начин комуникације на интернету нанети штету језику. Др Оливера Дурбаба, која је проучавала језик на „Фејсбуку” и форумима, верује да интернет неће довести до пропасти српског.

– Тај језик, без обзира што је писан, носи све особености говорног језика. Он се сада само измешта у други медиј, што нама истраживачима олакшава посао, јер постоји у писаној форми. Наравно да то није књижевни стандард, али од разговорног стила и не очекујемо да има књижевни стил. Проблем настаје онда када у писани говор неосновано убацујемо елементе разговорног стила: у саставима, семинарским радовима или у штампи.


Коментари4
7bcab
Молимо вас да се у коментарима држите теме текста. Редакција Политике ONLINE задржава право да – уколико их процени као неумесне - скрати или не објави коментаре који садрже осврте на нечију личност и приватан живот, увреде на рачун аутора текста и/или чланова редакције „Политике“ као и било какву претњу, непристојан речник, говор мржње, расне и националне увреде или било какав незаконит садржај. Коментаре писане верзалом и линкове на друге сајтове не објављујемо. Политика ONLINE нема никакву обавезу образлагања одлука везаних за скраћивање коментара и њихово објављивање. Редакција не одговара за ставове читалаца изнесене у коментарима. Ваш коментар може садржати највише 1.000 појединачних карактера, и сматра се да сте слањем коментара потврдили сагласност са горе наведеним правилима.

Иван Обрадовић
У Белој књизи за српски језик аутори наводе: "Значајан помак је у овом домену (говорна интеракција) учинила група са Техничког факултета Универзитета у Новом Саду када је израдила, поред говорних база података, лексичку базу од преко 4 милиона акцентованих облика речи српског језика и више од 3 милиона облика речи хрватског језика. Коришћењем ових ресурса развијене су различите апликације из домена аутоматског препознавања говора и претварања текста у говор. Препознавање и синтеза говора за српски су ушли у комерцијалну употребу кроз фирму Alfa-Num, која је потекла са Универзитета у Новом Саду. Ова компанија успешно послује и у другим државама које су настале на простору бивше Југославије – у Хрватској, Македонији, Босни и Херцеговини и Црној Гори. Компанија AlfaNum има значајан број корисника међу српским компанијама. Интегрални текст Беле књиге доступан је на веб адреси: http://www.meta-net.eu/whitepapers/volumes/serbian
D P
Mislim da bi autor teksta trebalo da poseti www.alfanum.co.rs, pa da, eventualno, napravi korekcije u članku ili napiše novi članak.
M. S.
Gospoda koja navode da su uradila "analizu za srpski jezik u okviru studije Tehnološkog saveza za višejezičnu Evropu" izgleda nisu obaveštena da za srpski jezik već duže vreme postoje kvalitetne tehnologije za govornu komunikaciju čovek-mašina, razvijene na Fakultetu tehničkih nauka u Novom Sadu (na sajtu projekta AlfaNum svako ih može isprobati). To je nemoguće promašiti ako na Guglu potražite "govorne tehnologije srpski", što je, izgleda, za potrebe ove analize bilo suviše komplikovano. Ove tehnologije (a to su sinteza govora, koja omogućuje računaru da se obrati čoveku, i prepoznavanje govora, koje mu omogućuje da prepozna šta je čovek rekao) primenjene su u okviru desetina govornih automata u Srbiji i okruženju, ali i kao pomagala stotinama osoba sa invaliditetom - od kojih su neka priznata i od strane Republičkog zavoda za zdravstveno osiguranje. Primera radi, i sajtovi RTS i RTV odnedavno imaju mogućnost konverzije pisanih vesti u govor na srpskom (potražite natpis "Čitaj mi!").
Dejan R. Popovic, dipl. inz.
“Evropska ideja” pociva na verovanju da bez obzira na istoriske, kulturne i jezicke razlike, Evropa cini jedinstvenu politicku zajednicu. Cini da jezicke razlike predstavljaju nepremostivu prepreku za ostvarenje ove ideje. Izlaz je, izgleda, u primeni naprednih jezickih, informaciono-komuniacionih tehnologija. "Guglovom" programu za prevodjenje su potrebna znacajna poboljsanja. Alternativa je da se u službenu upotrebu u EU uključi i jezik esperanto, uz nadu i želju da se posle određenog perioda (npr. 10 ili 20 godina) taj ili drugi jezik (npr. engleski, standardni, globalni ili uprošćeni) postane jedini službeni jezik, čime bi se obezbedilo lakše komuniciranje, informisanje i sticanje znanja šire javnosti, kao i racionalno, efikasno i ekonomično korišćenje ljudskih, informacionih i komunikacionih resursa.

Комeнтар успeшно додат!

Ваш комeнтар ћe бити видљив чим га администратор одобри.

Почетна / Спектар /

Архива Импресум О нама Контакт Претплата Оглашавање Правила коришћења Бизнис Клуб

Пријавите се на нашу маилинг листу

* Обавезна поља