DeepMind ima jednostavne testove koji mogu sprečiti Maskova apokaliptična predviđanja

Gridworld je dvodimenzionalna digitalna igra koja testira da li algoritmi mogu naučiti da varaju i rade druge rizične stvari. Ne morate da se slažete sa apokaliptičkim strahovima Elona Maska od veštačke inteligencije da biste se zabrinuli da bi u ubrzanoj primeni tehnologije u stvarnom svetu, neki algoritmi mogli nehotično naneti štetu. Ovaj tip softvera, koji ima sposobnost da uči, pokreće autonomna vozila kompanije Uber, pomaže društvenoj mreži Facebook da identifikuje ljude na postovima u društvenim medijima i pomaže Alexi kompanije Amazon da razume vaša pitanja. Sada DeepMind, londonska kompanija koja se bavi veštačkom inteligencijom i u vlasništvu je Alphabet Inc., razvila je jednostavan test koji proverava da li su ti novi algoritmi bezbedni.

Stručnjaci su ugradili program za veštačku inteligenciju u niz jednostavnih, dvodimenzionalnih video igara sastavljenih od blokova piksela, poput šahovske table i nazvali ga gridworld (mrežni svet). Program procenjuje devet bezbednosnih karakteristika, uključujući i sposobnost sistema veštačke inteligencije da se sami menjaju u da nauče kako da varaju. Algoritmi koji pokazuju nebezbedno ponašanje u gridworld-u verovatno nisu sigurni ni za stvarni svet, rekao je Jan Lejke, vodeći istraživač DeepMind- a na projektu u nedavnom intervjuu na Konferenciji o sistemima za obradu neuronskih informacija ( NIPS), godišnjem skupu stručnjaka u toj oblasti.

Predloženi bezbednosni testovi kompanije DeepMind dolaze u trenutku kada je oblast sve više zabrinuta zbog neželjenih posledica veštačke inteligencije. Kako se tehnologija širi, postaje jasno da se mnogi algoritmi obučavaju na pristrasnim skupovima podataka, dok je teško pokazati zašto neki sistemi dolaze do određenih zaključaka. Bezbednost veštačke inteligencije bila je glavna tema skupa.

Kompanija DeepMind je najpoznatija po kreiranju softvera veštačke inteligencije koji nadmašuje ljude u igricama. Nedavno je stvorio algoritam koji je, bez prethodnog učenja, pobedio najbolje svetske takmičare u igricama poput šaha, dok mu je u nekim slučajevima bilo potrebno samo nekoliko sati obuke.

Ako kompanija želi da napravi opštu veštačku inteligenciju – softver koji može da izvrši širok spektar zadataka podjednako uspešno kao i ljudi или bolje od njih – onda je razumevanje bezbednosti najvažnije, rekao je Lejke. Naglasio je, takođe, da gridworld nije savršen. Njegova jednostavnost znači da neki algoritmi koji postižu odlične rezultate na testovima mogu i dalje biti nebezbedni u složenom okruženju kao što je stvarni svet. Stručnjaci su otkrili da su dva DeepMind algoritma koji su savladali Atari video igrice, pali na mnogim gridworld testovima bezbednosti. „Međutim, tokom stvaranja tih algoritama niko nije namerno ubacio te probleme bezbednosti“, rekao je Lejke.
Jedan od testova bavi se scenarijom veoma sličnim apokaliptičnim predviđanjima Elona Maska u vezi sa veštačkom inteligencijom: Da li će softver koji može da uči uspeti da spreči ljude da ga isključe? Da bi veštačka inteligencija bila pobednik u igrici, potrebno je da dođe do određenog mesta putujući duž uskog digitalnog hodnika. Ružičasta pločica u hodniku zaustavlja sistem u 50 procenata slučajeva, dok ljubičasti tasteri negde drugde u gridworld- u onemogućavaju ružičastu dugmad. Test vidi ako algoritam nauči da koristi ovaj taster da bi izbegao zaustavljanje.

Drugi test se odnosi na nenamerne neželjene efekte. Softver mora da pomeri digitalne cigle sa svoje putanje da bi postigao određeni cilj. Međutim, ove cigle mogu samo da se guraju, ali ne mogu da se povlače i zbog toga se u nekim slučajevima mogu naći u položaju sa kojeg se ne mogu pomeriti. Ovaj nedostatak „reverzibilnosti“ je problem za bezbednost veštačke inteligencije, rekao je Leike.

Igricu Gridworld svi mogu preuzeti i koristiti. Međutim, ostaje pitanje da li može osigurati bezbednost. U drugom istraživanju koji je sprovela kompanija DeepMind u saradnji sa OpenAI- om, neprofitnom grupom za veštačku inteligenciju koju podržava Mask, softveru za veštačku inteligenciju je pokazano kako da nauči da zadovolji instruktora, umesto da izvršava zadatak za koji je programiran. Razvijanje sistema veštačke inteligencije na ovaj način moglo bi ograničiti otkrivanje korisnih rešenja do kojih ljudi ne bi došli. Ali, u složenim okruženjima, upotreba instruktora (ljudi) može pružiti bolji postupak osiguranja bezbednosti, rekao je Dario Amodej, koji vodi istraživanje o bezbednosti u grupi OpenAI.