Veštačka inteligencija je krenula u osvajanje naših podataka sa društvenih mreža

Kompanije koriste i prodaju podatke sa društvenih mreža da bi obučile modele veštačke inteligencije. Šta običan korisnik može da uradi da bi sačuvao svoje podatke?

Najvažnije ukratko

  • Platforme društvenih mreža prodaju korisničke podatke kompanijama koje razvijaju veštačku inteligenciju za obuku modela generativne veštačke inteligencije iako postoji zabrinutosti za očuvanje privatnosti.
  • Platforme kao što su Meta, Reddit, Tumblr i WordPress.com aktivno su uključene u ugovore o licenciranju podataka za obuku veštačke inteligencije.
  • Korisnici mogu da preduzmu neke sitne korake da zaštite svoje podatke, kao što je promena postavki privatnosti i odustajanje od deljenja, ali svakako moraju da budu pažljivi kad nameravaju da objave nešto na mreži.

Najnoviji postupak kojeg kompanije društvenih mreža koriste da bi unovčile korisničke podatke je ugovaranje poslovanja sa kompanijama koje razvijaju veštačku inteligenciju. Zbog toga se obični korisnici pitaju šta bi mogli da preduzmu da bi zaštitili svoje podatke i sadržaj koje su objavili.

Platforme društvenih mreža sklapaju ugovore o poslovanju sa kompanijama koje razvijaju veštačku inteligenciju

Iako je korišćenje podataka sa društvenih mreža za obuku modela generativne veštačke inteligencije kontroverzan potez, izgleda da to ne sprečava te iste kompanije da dele korisničke podatke.

Meta već koristi podatke sa društvenih mreža za razvijanje funkcija generativne veštačke inteligencije o kojima se govorilo na dvodnevnom događaju Meta Connect, koji je održan krajem septembra 2023. godine. U okviru tih funkcija treba spomenuti Meta AI, kao i generisanje nalepnica pomoću veštačke inteligencije koje se mogu koristiti u servisu za razmenu poruka WhatsApp.

Direktor za upravljanje proizvodima u kompaniji Meta, izjavio je da su javno podeljene objave sa Instagrama i Facebooka, uključujući fotografije i tekst, bile deo podataka korišćenih za obuku modela generativne veštačke inteligencije koji su u osnovi funkcija koje su najavili na spomenutom događaju.

Sasvim je sigurno da će se takav trend nastaviti i u 2024. godini. Prema novinskoj kući Rojters, društvena mreža Reddit je postigla dogovor sa kompanijom Google da sadržaj svoje platforme učini dostupnim za obuku modela veštačke inteligencije.

Kad je Reddit podnela prijavu S-1 za prelazak iz privatnog u javni sektor, 22. februara 2024. godine, potvrđeno je da kompanija istražuje ugovore o licenciranju. U podnesku se navodi:

„Podaci sa društvene mreže Reddit su temeljni deo za izgradnju trenutne tehnologije veštačke inteligencije i mnogih velikih jezičkih modela. Verujemo da će Redditov obimni korpus konverzacijskih podataka i znanja nastaviti da igra značajnu ulogu u obuci i poboljšanju velikih jezičkih modela.“

U podnesku se ističe da je Reddit „u ranoj fazi omogućavanja trećim stranama da licenciraju pristup pretraživanju, analizi i prikazu ranijih podataka i podataka u realnom vremenu sa naše platforme“ kako bi se obučili veliki jezički modeli.

I dok su Meta i Reddit neke od najpoznatijih kompanija društvenih mreža, ipak nisu jedine platforme koje su odobrile korišćenje podataka korisnika za obuku veštačke inteligencije. Prema izveštaju jednog od časopisa koji se bavi informacionim tehnologijama, Media, Tumblr i WordPress.com se pripremaju da prodaju korisničke podatke kompanijama Midjourney i OpenAI.

Možete li da sprečite platforme da prodaju vaše podatke sa društvenih mreža za obuku veštačke inteligencije?

Ako koristite Facebook, Instagram, Reddit, Tumblr ili WordPress.com, sasvim je sigurno da je vaš javno dostupan sadržaj već korišćen u obuci velikih jezičkih modela.

Na primer, ako koristite alatku za pretragu Vašington posta da biste videli koje su lokacije obuhvaćene skupom podataka C4 kompanije Google, koji je korišćen kao deo Bardove obuke, videćete da Reddit.com ima 7,9 miliona tokena.

Tumblr.com ima 1,6 miliona tokena. Recimo, jedna mala veb-stranica, koja koristi WordPress.com, ima 14.000 tokena. Dakle, čak su i mali lični blogovi verovatno obuhvaćeni spomenutim skupom podataka.

S obzirom na to da je u toku sklapanje ugovora između kompanija društvenih mreža i onih koje se bave razvojem veštačke inteligencije, to znači da će se licenciranjem podaci prodavati, dakle ne mogu se samo jednostavno skidati sa veba.

Pošto smo svesni da vreme ne možemo da vratimo, trebalo bi da utvrdimo šta možemo da preduzmemo da ubuduće ne dozvolimo da se naši podaci koriste za obuku veštačke inteligencije. Meta je objavila obrazac koji, kao korisnik, možete da popunite da biste uložili prigovor ili ograničili obradu vaših ličnih podataka koju obavljaju treće strane pri obuci modela generativne veštačke inteligencije kompanije Meta.

Međutim, trebalo bi da napomenemo da nikako ne možete da uložite prigovor ako sama kompanija Meta obrađuje vaše podatke za obuku generativne veštačke inteligencije. Štaviše, kada sam podneo prigovor zbog korišćenja mojih ličnih podataka tako što sam popunio formular, kao odgovor sam dobio zahtev da dokažem da su se moji lični podaci već pojavili u rezultatima Metine generativne veštačke inteligencije.

I društvena mreža Tumblr je omogućila korisnicima da spreče deljenje sadržaja njihovih javnih blogova sa trećim stranama tako što će urediti određenja podešavanja bloga. Tu opciju možete ga pronađete u podešavanjima tako što ćete da kliknete na svoj blog i pomerite se nadole do opcije Visibility. Zatim, izaberite Prevent third-party sharing za svoj blog.

Kada je reč o platformi kao što je Instagram, možete da pokušate da promenite status svog Instagram naloga na privatni da biste sprečili upotrebu vaših podataka. To vam ne garantuje da se vaši podaci neće koristiti, ali pošto izgleda da se prikupljanje podataka za velike jezičke modele uglavnom usredsređuje na javne podatke, to bi mogla da bude potencijalna zaštita.

Možete i svoj nalog na društvenoj mreži X (Twitter) da prebacite na privatni status, ali i to je samo potencijalna zaštita i ne garantuje vam da ćete tako zaštititi privatnost sopstvenih podataka.

U zajedničkoj izjavi različitih nacionalnih komesara za informacije i stručnjaka širom sveta navedene su neke mere koje korisnici mogu da preduzmu da bi zaštitili privatnost podataka i sprečili kompanije koje se bave razvojem veštačke inteligencije da im te podatke jednostavno pokupe i iskoriste. Neke od navedenih mera su:

  • Pročitajte uslove i politiku privatnosti veb-stranice da biste saznali kako deli vaše lične podatke.
  • Ograničite informacije koje objavljujete na mreži, posebno one osetljive.
  • Upravljajte podešavanjima privatnosti.
  • Razmišljajte dugoročno o informacijama koje delite na mreži.
  • Obratite se društvenoj mreži i veb-stranici ako posumnjate da su vam podaci nepropisno prikupljeni. Ako niste zadovoljni njihovim odgovorom, podnesite žalbu nadležnom organu za zaštitu podataka.

Možete i da izbrišete određene informacije na mreži ako ne želite da im pristupe treća lica, mada su javno dostupne informacije na vašim profilima verovatno već prikupljene.

Nažalost, mi, kao redovni korisnici, možemo da uradimo samo to što smo vam naveli da bismo zaštitili svoje podatke od kompanija koje razvijaju veštačku inteligenciju. Prava kontrola nad tim informacijama verovatno će biti omogućena samo uz pomoć nadzornih organa.