Zbunili smo najnapredniju veštačku inteligenciju

Naučnici sa Univerziteta Berkli, Vašington i Čikago stvaraju veliku kolekciju fotografija koje zbunjuju veštačku inteligenciju. Dok se najrazvijenija veštačka inteligencija obučena za prepoznavanje fotografija zbunjeno pita šta se nalazi na slici, ljudi bez problema to uspevaju da prepoznaju. Zbog čega je veštačka inteligencija potpuno izgubljena kad joj se prikažu određene slike? Zbog toga što je svaka slika pred kojom je veštačka inteligencija zbunjena, u stvari, pažljivo izabrana da bi je odvela na pogrešan put zaključivanja. Do sada su naučnici sa Univerziteta Berkli, Vašington i Čikago uspeli da prikupe 7.000 takvih fotografija pred kojima je najsavremenija tehnologija potpuno izgubljena. Jedan od doktoranata sa Univerziteta Berkli kaže da je sadašnja tehnologija mašinskog učenja prilično krhka. Prema njegovim rečima, ostali istraživači koriste veštačke podatke da bi stvorili što robusniji sistem, dok njihov tim pokazuje da modeli prave izuzetno ozbiljne i konstantne greške kad se koriste pravi podaci, odnosno, prave fotografije.

Da bismo shvatili o čemu se radi, trebalo bi da se vratimo nekoliko koraka unazad. Tokom proteklih nekoliko godina, proces prepoznavanja fotografija išao je dobrim putem i to prilično brzo. Proces se uspešno odvijao zahvaljujući otvorenom skupu podataka koji se stalno uvećavao, a koji je tvorevina Univerziteta Stanford, koji je skup podataka nazvao ImageNet. Kolekcija trenutno broji preko 14 miliona fotografija koje su označene natpisima kao što su „drvo“ или „nebo“. Ta ogromna baza podataka predstavlja skup za obučavanje или referencu za nove sisteme veštačke inteligencije koja treba na osnovu toga da nauči kako da prepozna fotografije. Ceo postupak neodoljivo podseća na proces u kome deca koriste slikovnice da bi polako naučila nove reči. Veštačka inteligencija koja je podučavana pomoću baze podataka ImageNet – koja vam je poznata preko servisa Bing kompanije „Majkrosoft“ – postala je izuzetno precizna, odnosno, uspeva da prepozna objekte u 95% slučajeva i mnogo je bolja os većine ljudi.

Međutim, preostalih 5% predstavljaju izuzetno veliki problem. Od 2017. godine, računari ne napreduju na polju prepoznavanja fotografija. Zbog toga naučnici pokušavaju da pronađu postupke koje bi koristili da bi shvatili tih 5% fotografija koje računari ne mogu da savladaju. Tim koji je skupio novu kolekciju okrenuo se mreži Flickr u potrazi za slikama za koje su pretpostavili da mogu zbuniti napredne programe. Pokazali su ih modelima veštačke inteligencije koji su obučavani na skupu koji se nalazi u ImageNetu i ako su uspele da ih zbune, dodavali su ih novom skupu podataka koji su nazvali ImageNet-A. U suštini, ta baza podataka je anti- ImageNet. Tih 7.000 fotografija smanjuju procenat tačnosti veštačke inteligencije sa 90% na samo 2%. Da, dobro ste pročitali. Najbolji modeli veštačke inteligencije za prepoznavanje fotografija su pogrešili devedeset i osam puta u sto slučajeva. Zbog čega sistemi veštačke inteligencije nisu uspeli da protumače te fotografije? Odgovor na to pitanje je izuzetni kompleksan. Podučavanje veštačke inteligencije u sadašnjem trenutku podrazumeva ubacivanje ogromnog broja podataka u crnu kutiju – drugim rečima, o njenoj preciznosti možete suditi samo na osnovu konačnog rezultata, a ne na osnovu procesa pomoću kojih se došlo do takvog zaključka. Ako ta crna kutija vidi dovoljno različitih fotografija drveta da bi mogla da prepozna novo drveće na novim slikama, onda smo uspeli u svom poduhvatu. (Taj proces koji se stalno ponavlja poznat je pod nazivom mašinsko učenje.) Problem se sastoji u tome što ne znamo zbog čega je veštačka inteligencija odlučila da je drvo drvo. Da li zbog oblika drveta, boje, konteksta или teksture? Da li zbog toga što drvo ima neku jedinstvenu osnovnu geometriju koju ljudi nikad ne prepoznaju? Ne znamo. O veštačkoj inteligenciji sudimo prema njenim odgovorima, ali ne prema procesu zaključivanja, što znači da od nje možemo dobiti razne i neočekivane predrasude, što predstavlja najveći problem kada sisteme veštačke inteligencije koristimo u oblastima tehnologije kao što su autonomna vozila или kriminalno pravo. To, isto tako, znači da sistemi prepoznavanja slika nisu realno inteligentni već su usko specijalizovani u igri uparivanja.

Osnovna svrha stvaranja baze podataka ImageNet-A je varanje veštačke inteligencije da bi se otkrilo zašto određene fotografije zbunjuju pomenute sisteme. Na primer, kad veštačka inteligencija na nekoj od slika veverice prepozna foku, nedostatak inteligencije i razmišljanja postaje očigledan. Sistem se oslanja samo na teksturu tih životinja, ali ne obazire se na njihovu relativnu veličinu или oblik da bi ih prepoznao. Izgleda da sisteme najviše zbunjuju slike objekata na kojima je važno prepoznati njihov oblik. Dakle, naučnici su u bazi ImageNet-A uspešno pronašli 7.000 fotografija koje sadrže slepu tačku za veštačku inteligenciju. Da li to znači da te slike mogu da se dodaju novom skupu za obučavanje i reše problem? Verovatni ne mogu. Pošto u realnom svetu postoje raznolikost i kompleksnost, obučavanje pomoću tih fotografija verovatno neće moći da upravlja ukupnim obimom vizuelnih ulaza. Kad bi prikupili i obeležili bilion slika, možda bi uspeli da se reše nekih slepih tačaka, ali to ne bi bilo od pomoći kad bi se pojavio neki novi scenario или kad bi se promenila realna slika.

Drugim rečima, jednostavno dodavanje fotografija trenutnim skupovima podataka za mašinsko učenje ne može da popravi suštinske nedostatke njegove logike. Uvek će postojati fotografije kojih računar prethodno nije dovoljno video da bi mogao precizno da ih prepozna. Šta bi naučnici mogli da urade da bi zatvorili tu razliku od 5%? Stručnjaci smatraju da bi trebalo razviti nove metodologije van okvira sadašnjeg mašinskog učenja i tako stvoriti prefinjenije sisteme veštačke inteligencije. Ili, pošto smo svesni da to ne mogu da urade, bolje je bi bilo prepustiti ljudima da bar na kratko ponosno istaknu svoju nadmoć nad mašinama.

5456-zbunili-smo-najnapredniju-vestacku-inteligenciju