Veštačka inteligencija krade i koristi stvarne fotografije dece

Jovana Milovanović

12. 06. 2024. 11:10

(Фотографије Фрипик)

Aktivisti za ljudska prava tvrde da popularni skup podataka za obuku veštačke inteligencije (VI) jeste „krađa i oružavanje” lica brazilske dece bez njihovog znanja ili saglasnosti. Više od 170 fotografija i ličnih podataka dece iz Brazila je prenamenjeno skupom podataka otvorenog koda bez njihovog znanja ili saglasnosti i korišćeno za obuku VI, tvrdi se u novom izveštaju koji je objavio „Human Rights Watch”.

Narušena privatnost

Fotografije su izvučene iz sadržaja objavljenog 2023. i sredinom devedesetih. „Human Rights Watch” tvrdi da je lične podatke i fotografije ove dece prikupilo skladište podataka „Common Crawl”, a URL linkovi koji su povezani sa njima uključeni u „LAION-5B”, skup podataka koji pomaže u obučavanju podataka za VI startapove.

‒ Njihova privatnost je narušena u prvom slučaju kada se njihova fotografija izgrebe i ubaci u ove skupove podataka. A onda se ovi alati veštačke inteligencije obučavaju na ovim podacima i stoga mogu da stvore realistične slike dece ‒ kaže Hie Jung Han, istraživač dečjih prava i tehnologije i istraživač koji je pronašao ove slike, prenosi „Wired”.

Kako kaže, tehnologija je razvijena na takav način da je svako dete koje ima bilo koju svoju fotografiju ili video na mreži sada u opasnosti jer bi svaki zlonamerni akter mogao da snimi tu fotografiju, a zatim da koristi ove alate da manipuliše kako god želi.

Skup podataka napravila nemačka neprofitna organizacija

„LAION-5B” je zasnovan na spremištu podataka „Common Crawl” , koje je kreirano grebanjem veba i stavljeno na raspolaganje istraživačima, i korišćen je za obuku nekoliko VI modela, uključujući alat za generisanje slike „Stability AI’s Stable Diffusion”. Napravljen od strane nemačke neprofitne organizacije „LAION”, skup podataka je otvoreno dostupan i sada uključuje veze do više od 5,85 milijardi parova slika i natpisa, prema njenoj veb stranici.

„LAION” kaže da je uklonio veze do slika koje je označio „Human Rights Watch”. Portparol Nejtan Tajler izjavio je da je organizacija već preduzela akciju.

‒ „LAION-5B” je uklonjen kao odgovor na izveštaj sa Stanforda koji je pronašao veze u skupu podataka koje upućuju na nezakonit sadržaj na javnom vebu ‒ kaže on, dodajući da organizacija trenutno radi na tome da se uklone sve poznate reference na nezakonit sadržaj.”

Sa Jutjuba, maminih i sličnih blogova

Fotografije dece koje su istraživači pronašli potekle su sa maminih blogova i drugih ličnih, porodiljskih ili roditeljskih blogova, kao i fotografije sa jutjub video-snimaka sa malim brojem pregleda, koje su naizgled otpremljene da bi se podelile sa porodicom i prijateljima.

‒ Samo gledajući kontekst gde su objavljeni, uživali su u očekivanju i meri privatnosti ‒ kaže Hie i dodaje da većinu ovih slika nije bilo moguće pronaći na mreži putem obrnute pretrage slika.

Podaci sadrže i materijal o seksualnom uznemiravanju

U decembru su istraživači sa Univerziteta „Stanford” otkrili da podaci o obuci veštačke inteligencije koje je prikupio „LAION-5B” sadrže materijal o seksualnom zlostavljanju dece. Problem eksplicitnih dipfejksa je u porastu, čak i među učenicima američkih škola, gde su navikli da maltretiraju drugove iz razreda, posebno devojčice. Hie se brine da bi, osim korišćenja dečjih fotografija, baza podataka mogla da otkrije potencijalno osetljive informacije, kao što su lokacije ili medicinski podaci.

Dipfejk su sintetički mediji u kojima je osoba na postojećoj slici ili video-snimku zamenjena nečijim likom. Iako čin kreiranja lažnog sadržaja nije nov, dipfejk koristi moćne tehnike od mašinskog učenja i veštačke inteligencije za manipulisanje ili generisanje vizuelnog i audio sadržaja koji može lakše zavarati. Brazilsko zakonodavstvo trenutno razmatra zakone koji bi regulisali stvaranje dipfejkova, a u SAD, predstavnica Aleksandrija Okasio-Kortez iz Njujorka je predložila zakon koji bi omogućio ljudima da tuže ako mogu da dokažu da je dipfejk nalik na njih napravljen bez saglasnosti.