Tjuringov test je zastareo. Vreme je da napravimo novi standard za veštačku inteligenciju

Glavni stručnjak za Aleksu smatra da stari standard u računarstvu ne odgovara današnjoj eri veštačke inteligencije. Ove godine se navršava 70 godina otkako je Alan Tjuring objavio svoj rad uvodeći koncept Tjuringovog testa kao odgovor na pitanje „Mogu li mašine da razmišljaju?“ Cilj testa je bio da se utvrdi da li mašina može da pokaže razgovorno ponašanje koje se ne razlikuje od čovekovog. Tjuring je predvideo da će do 2000. godine prosečan čovek imati manje od 70 procenata šanse da razlikuje veštačku inteligenciju od čoveka u igri imitacije u kojoj treba da se pogodi ko odgovara na pitanja – čovek или veštačka inteligencija – kad je onaj ko odgovara skriven od pogleda onog koji pogađa. Zašto savremena tehnologija nije uspela da postigne taj cilj ni 20 godina posle predviđenog roka? Smatram da cilj koji je postavio Tjuring nije koristan za naučnike koji se bave veštačkom inteligencijom. Tjuringov test obiluje ograničenjima, a o nekima od njih je pisao i sam Tjuring u svom naučnom radu. Dok je veštačka inteligencija danas svuda prisutna i predstavlja sastavni deo naših telefona, automobila i domova, sve je očiglednije da se ljudi mnogo više brinu o tome da njihova interakcija sa mašinama bude korisna, jednostavna i transparentna – i da se više niko ne bavi konceptom mašina koje se ne mogu razlikovati od ljudi. Zbog toga je vreme da znanje koje je sedam decenija služilo kao inspiracija ostavimo po strani i postavimo novi izazov koji podjednako inspiriše kako one koji se bave teorijom, tako i one koji se bave praksom.

Tjuringov test i popularna mašta

U godinama koje su usledile posle predstavljanja Tjuringovog testa, on je služio kao zvezda vodilja za naučnike koji su se bavili veštačkom inteligencijom. Najraniji razgovorni roboti 60-ih i 70-ih, ELIZA i PARRY , bili su usredsređeni na polaganje testa. Još 2014. godine, robot Judžin Gustman izjavio je da je položio Tjuringov test jer je prevario 33 procenta ispitanika da je čovek. Međutim, kao što su drugi istakli, procena da je prevareno 30 procenata ispitanika je proizvoljna. Čak i tada, takva „pobeda“ nekima je izgledala kao zastarela.

Ipak, Tjuringov test nastavlja da pokreće popularnu maštu. Jezički model OpenAI’s Generative Pre-trained Transformer 3 (GPT- 3) pokrenuo je niz novinskih članaka o potencijalu da pobedi Tjuringov test. Slično tome, i dalje novinari, uspešni poslovni ljudi i mnogi drugi pitaju: „Kada će Aleksa da položi Tjuringov test?“ Iako je Tjuringov test jedan od načina za merenje Aleksine inteligencije, postavlja se pitanje da li je ispravan i relevantan metod. Da bismo odgovorili na to pitanje, vratimo se u vreme kada je Tjuring prvi put izložio svoju tezu. Te 1950. godine, tek je trebalo da se proda prvi komercijalni računar, osnovni radovi o optičkim kablovima biće objavljeni za četiri godine, a polje za razvoj veštačke inteligencije još nije bilo zvanično uspostavljeno – to će se desiti 1956. godine. Sada naši telefoni imaju 100.000 puta veću računarsku snagu od Apola 11, a zajedno sa računarstvom u oblaku i povezanosti putem širokog propusnog opsega, veštačka inteligencija sada može na osnovu ogromnih količina podataka da donese odluke u roku od nekoliko sekundi.

Iako je Tjuringova izvorna vizija i dalje inspirativna, tumačenje njegovog testa kao konačnog znaka napretka veštačke inteligencije ograničena je erom u kojoj je predstavljena. Kao prvo, Tjuringov test skoro u potpunosti odbacuje odlike mašine veštačke inteligencije, koje se ogledaju u brzom izračunavanju i pretraživanju informacija, što su neke od najefikasnijih funkcija savremene veštačke inteligencije. Isticanje potrebe da veštačka inteligencija mora da prevari čoveka da bi prošla Tjuringov test znači da bi trebalo da napravi pauzu pre nego što odgovori na pitanja, kao što su, „da li znate koliko iznosi kvadratni koren od 3434756?“ или „koliko je Sijetl udaljen od Bostona?“ U stvarnosti, veštačka inteligencija odmah zna odgovore, a pravljenje pauza da bi odgovori zvučali kao da ih daje čovek nije najbolje korišćenje njenih sposobnosti. Štaviše, Tjuringov test ne uzima u obzir sve veću sposobnost veštačke inteligencije da koristi senzore da čuje, vidi i oseti spoljni svet. Umesto toga, ograničen je samo na tekst.

Da bi veštačka inteligencija danas bila korisnija, njeni sistemi moraju efikasno da izvršavaju naše svakodnevne zadatke. Ako tražite od vašeg inteligentnog asistenta da vam isključi svetla u garaži, sigurno niste nameravali da ćaskate sa njim. Umesto toga, želeli biste da ispuni vaš zahtev i obavesti vas jednostavnim, „u redu“ или „završeno“. Čak i kada počnete malo duži razgovor sa inteligentnim asistentom o nekoj aktuelnoj temi или tražite od njega da detetu pročita priču, i dalje biste želeli da znate da je reč o veštačkoj inteligenciji, a ne o čoveku. U stvari, „zavaravanje“ korisnika da se s druge strane nalazi čovek predstavlja pravi rizik. Zamislite distopijske posledice takvih okolnosti, od koji smo neke već videli u slučaju botova koji seju dezinformacije или u slučaju falsifikovanih video-sadržaja.

Novi značajni izazovi za veštačku inteligenciju

Umesto da se bavimo stvaranjem veštačke inteligencije koja se neće razlikovati od ljudi, trebalo bi da se usredsredimo na stvaranje veštačke inteligencije koja će poboljšati ljudsku i tako nam olakšati naš svakodnevni život na pravedan i sveobuhvatni način. Značajni osnovni cilj je da se stvori veštačka inteligencija koja će imati odlike slične ljudskoj inteligenciji – uključujući zdrav razum, samonadzor i znanje jezika – i sa tim kombinuje sve prednosti mašine, kao što su brza pretraživanja, opoziv memorije i izvršavanje zadataka u vaše ime. Konačni rezultat je učenje i izvršavanje različitih zadataka i prilagođavanje novim situacijama, daleko iznad onog što prosečna osoba može da uradi. Takvi ciljevi usmeravaju istraživanja na oblasti koje su zaista važne – senzorno razumevanje, razgovor, široko i duboko znanje, efikasno učenje, obrazloženje za donošenje odluka i uklanjanje neprimerene pristrasnosti или predrasuda (tj. isticanje pravičnosti). Napredak u tim oblastima može se meriti na razne načine. Jedan od pristupa je razbijanje izazova na sastavne zadatke. Na primer, Kaggle-ov „Izazov apstrakcije i obrazloženja“ usredsređuje se na rešavanje zadataka rasuđivanja koje veštačka inteligencija ranije nije videla. Drugi pristup je stvaranje velikog stvarnog izazova za interakciju čovek-računar, kao što je { Alexa Prize Socialbot Grand Challenge – takmičenje usmereno na razgovornu veštačku inteligenciju

U stvari, kada je 2016. godine pokrenut izazov Aleksa, vođena je intenzivna rasprava o tome kako treba ocenjivati konkurentske „društvene robote“. Da li pokušavamo da uverimo ljude da je robot čovek, primenjujući verziju Tjuringovog testa? Ili pokušavamo da veštačku inteligenciju osposobimo da vodi uobičajene razgovore kako bismo unapredili učenje или omogućili zabavu?

Odlučili smo da počnemo od situacije u kojoj se od društvenih robota traži da razumno i angažovano razgovaraju 20 minuta sa ljudima o raznovrsnim popularnim temama, uključujući zabavu, sport, politiku i tehnologiju. Tokom postupnih faza koje vode do finala, ispitanici se izjašnjavaju da li bi želeli da ponovo razgovaraju sa robotima i daju im ocene. U finalu, nezavisne sudije procenjuju koherentnost i prirodnost razgovora i dodeljuju ocenu na skali od 1 do 5. Ako bilo koji od robota tokom razgovora od 20 minuta dobije ocenu 4,0 или više, tada je uspeo da odgovori na izazov, što se još nije desilo.

Sveopšte prihvatanje veštačke inteligencije, kao što je Aleksa, u našem svakodnevnom životu još je jedna neverovatna prilika za merenje napretka u veštačkoj inteligenciji. Iako takve njene usluge zavise od konverzacijskih veština koje su slične ljudskim kako bi se izvršili jednostavni zadaci (npr. uključivanje alarma) i složeni zadaci (npr. planiranje vikenda), da bi se iz veštačke inteligencije izvukla maksimalna korist, trebalo bi iz konverzacijske preći u ambijentalnu veštačku inteligenciju, koja odgovara na vaše zahteve kada vam zatreba, predviđa vaše potrebe i povlači se kada vam nije potrebna. Na primer, Aleksa može da detektuje zvuk lomljenja stakla i upozori vas na ono što se dešava. Ako uključite alarm pre odlaska na spavanje, predlaže vam da isključite svetlo koje je ostalo uključeno. Još jedan aspekt takve veštačke inteligencije je da treba da bude stručnjak za veliki i sve veći broj zadataka, što je moguće samo ako postoji sposobnost za opšte učenje umesto za razvijanje inteligencije za specifični zadatak.

Ništa od navedenog ne može da opovrgne Tjuringovu prvobitnu viziju – Tjuringova „igra imitacije“ osmišljena je kao misaoni eksperiment, a ne kao konačni test kojim se meri koliko je korisna veštačka inteligencija. Međutim, došlo je vreme da se Tjuringov test stavi sa strane, ali da nas smela vizija Alana Tjuringa podstakne da ubrzamo napredak u izgradnji veštačke inteligencije koja će pomoći ljudima.