Тјурингов тест је застарео. Време је да направимо нови стандард за вештачку интелигенцију

Главни стручњак за Алексу сматра да стари стандард у рачунарству не одговара данашњој ери вештачке интелигенције. Ове године се навршава 70 година откако је Алан Тјуринг објавио свој рад уводећи концепт Тјуринговог теста као одговор на питање „Могу ли машине да размишљају?“ Циљ теста је био да се утврди да ли машина може да покаже разговорно понашање које се не разликује од човековог. Тјуринг је предвидео да ће до 2000. године просечан човек имати мање од 70 процената шансе да разликује вештачку интелигенцију од човека у игри имитације у којој треба да се погоди ко одговара на питања – човек или вештачка интелигенција – кад је онај ко одговара скривен од погледа оног који погађа. Зашто савремена технологија није успела да постигне тај циљ ни 20 година после предвиђеног рока? Сматрам да циљ који је поставио Тјуринг није користан за научнике који се баве вештачком интелигенцијом. Тјурингов тест обилује ограничењима, а о некима од њих је писао и сам Тјуринг у свом научном раду. Док је вештачка интелигенција данас свуда присутна и представља саставни део наших телефона, аутомобила и домова, све је очигледније да се људи много више брину о томе да њихова интеракција са машинама буде корисна, једноставна и транспарентна – и да се више нико не бави концептом машина које се не могу разликовати од људи. Због тога је време да знање које је седам деценија служило као инспирација оставимо по страни и поставимо нови изазов који подједнако инспирише како оне који се баве теоријом, тако и оне који се баве праксом.

Тјурингов тест и популарна машта

У годинама које су уследиле после представљања Тјуринговог теста, он је служио као звезда водиља за научнике који су се бавили вештачком интелигенцијом. Најранији разговорни роботи 60-их и 70-их, ELIZA и PARRY, били су усредсређени на полагање теста. Још 2014. године, робот Јуџин Густман изјавио је да је положио Тјурингов тест јер је преварио 33 процента испитаника да је човек. Међутим, као што су други истакли, процена да је преварено 30 процената испитаника је произвољна. Чак и тада, таква „победа“ некима је изгледала као застарела.

Ипак, Тјурингов тест наставља да покреће популарну машту. Језички модел OpenAI’s Generative Pre-trained Transformer 3 (GPT-3) покренуо је низ новинских чланака о потенцијалу да победи Тјурингов тест. Слично томе, и даље новинари, успешни пословни људи и многи други питају: „Када ће Алекса да положи Тјурингов тест?“ Иако је Тјурингов тест један од начина за мерење Алексине интелигенције, поставља се питање да ли је исправан и релевантан метод. Да бисмо одговорили на то питање, вратимо се у време када је Тјуринг први пут изложио своју тезу. Те 1950. године, тек је требало да се прода први комерцијални рачунар, основни радови о оптичким кабловима биће објављени за четири године, а поље за развој вештачке интелигенције још није било званично успостављено – то ће се десити 1956. године. Сада наши телефони имају 100.000 пута већу рачунарску снагу од Апола 11, а заједно са рачунарством у облаку и повезаности путем широког пропусног опсега, вештачка интелигенција сада може на основу огромних количина података да донесе одлуке у року од неколико секунди.

Иако је Тјурингова изворна визија и даље инспиративна, тумачење његовог теста као коначног знака напретка вештачке интелигенције ограничена је ером у којој је представљена. Као прво, Тјурингов тест скоро у потпуности одбацује одлике машине вештачке интелигенције, које се огледају у брзом израчунавању и претраживању информација, што су неке од најефикаснијих функција савремене вештачке интелигенције. Истицање потребе да вештачка интелигенција мора да превари човека да би прошла Тјурингов тест значи да би требало да направи паузу пре него што одговори на питања, као што су, „да ли знате колико износи квадратни корен од 3434756?“ или „колико је Сијетл удаљен од Бостона?“ У стварности, вештачка интелигенција одмах зна одговоре, а прављење пауза да би одговори звучали као да их даје човек није најбоље коришћење њених способности. Штавише, Тјурингов тест не узима у обзир све већу способност вештачке интелигенције да користи сензоре да чује, види и осети спољни свет. Уместо тога, ограничен је само на текст.

Да би вештачка интелигенција данас била кориснија, њени системи морају ефикасно да извршавају наше свакодневне задатке. Ако тражите од вашег интелигентног асистента да вам искључи светла у гаражи, сигурно нисте намеравали да ћаскате са њим. Уместо тога, желели бисте да испуни ваш захтев и обавести вас једноставним, „у реду“ или „завршено“. Чак и када почнете мало дужи разговор са интелигентним асистентом о некој актуелној теми или тражите од њега да детету прочита причу, и даље бисте желели да знате да је реч о вештачкој интелигенцији, а не о човеку. У ствари, „заваравање“ корисника да се с друге стране налази човек представља прави ризик. Замислите дистопијске последице таквих околности, од који смо неке већ видели у случају ботова који сеју дезинформације или у случају фалсификованих видео-садржаја.

Нови значајни изазови за вештачку интелигенцију

Уместо да се бавимо стварањем вештачке интелигенције која се неће разликовати од људи, требало би да се усредсредимо на стварање вештачке интелигенције која ће побољшати људску и тако нам олакшати наш свакодневни живот на праведан и свеобухватни начин. Значајни основни циљ је да се створи вештачка интелигенција која ће имати одлике сличне људској интелигенцији – укључујући здрав разум, самонадзор и знање језика – и са тим комбинује све предности машине, као што су брза претраживања, опозив меморије и извршавање задатака у ваше име. Коначни резултат је учење и извршавање различитих задатака и прилагођавање новим ситуацијама, далеко изнад оног што просечна особа може да уради. Такви циљеви усмеравају истраживања на области које су заиста важне – сензорно разумевање, разговор, широко и дубоко знање, ефикасно учење, образложење за доношење одлука и уклањање непримерене пристрасности или предрасуда (тј. истицање правичности). Напредак у тим областима може се мерити на разне начине. Један од приступа је разбијање изазова на саставне задатке. На пример, Каггле-ов „Изазов апстракције и образложења“ усредсређује се на решавање задатака расуђивања које вештачка интелигенција раније није видела. Други приступ је стварање великог стварног изазова за интеракцију човек-рачунар, као што је {Alexa Prize Socialbot Grand Challenge – такмичење усмерено на разговорну вештачку интелигенцију

У ствари, када је 2016. године покренут изазов Алекса, вођена је интензивна расправа о томе како треба оцењивати конкурентске „друштвене роботе“. Да ли покушавамо да уверимо људе да је робот човек, примењујући верзију Тјуринговог теста? Или покушавамо да вештачку интелигенцију оспособимо да води уобичајене разговоре како бисмо унапредили учење или омогућили забаву?

Одлучили смо да почнемо од ситуације у којој се од друштвених робота тражи да разумно и ангажовано разговарају 20 минута са људима о разноврсним популарним темама, укључујући забаву, спорт, политику и технологију. Током поступних фаза које воде до финала, испитаници се изјашњавају да ли би желели да поново разговарају са роботима и дају им оцене. У финалу, независне судије процењују кохерентност и природност разговора и додељују оцену на скали од 1 до 5. Ако било који од робота током разговора од 20 минута добије оцену 4,0 или више, тада је успео да одговори на изазов, што се још није десило.

Свеопште прихватање вештачке интелигенције, као што је Алекса, у нашем свакодневном животу још је једна невероватна прилика за мерење напретка у вештачкој интелигенцији. Иако такве њене услуге зависе од конверзацијских вештина које су сличне људским како би се извршили једноставни задаци (нпр. укључивање аларма) и сложени задаци (нпр. планирање викенда), да би се из вештачке интелигенције извукла максимална корист, требало би из конверзацијске прећи у амбијенталну вештачку интелигенцију, која одговара на ваше захтеве када вам затреба, предвиђа ваше потребе и повлачи се када вам није потребна. На пример, Алекса може да детектује звук ломљења стакла и упозори вас на оно што се дешава. Ако укључите аларм пре одласка на спавање, предлаже вам да искључите светло које је остало укључено. Још један аспект такве вештачке интелигенције је да треба да буде стручњак за велики и све већи број задатака, што је могуће само ако постоји способност за опште учење уместо за развијање интелигенције за специфични задатак.

Ништа од наведеног не може да оповргне Тјурингову првобитну визију – Тјурингова „игра имитације“ осмишљена је као мисаони експеримент, а не као коначни тест којим се мери колико је корисна вештачка интелигенција. Међутим, дошло је време да се Тјурингов тест стави са стране, али да нас смела визија Алана Тјуринга подстакне да убрзамо напредак у изградњи вештачке интелигенције која ће помоћи људима.