Kovid otkrio ograničenja mašinskog učenja

Algoritmi mašinskog učenja pokazali su da ne mogu da se izbore sa nedoslednošću i da im je potrebna intervencija ljudi Prošlog petka, američki Dow Jones Index popeo se za 1.000 poena. Ministarstvo za rad je izjavilo da se neočekivano otvorilo 2,5 miliona radnih mesta u maju, što je došlo kao dobra vest s obzirom na to da je u užasnom aprilu bez posla ostalo 20 miliona ljudi. Dakle stopa nezaposlenosti se smanjila na 13 procenata u maju u odnosu na 15 kolika je bila u aprilu. Izveštaj je zbunio mnoge ekonomiste i finansijske stručnjake koji su predvideli da će još nekoliko miliona ljudi ostati bez posla. Njihovi modeli mašinskog učenja predvideli su da će stopa nezaposlenosti nastaviti da raste sve dok ne pređe 20 procenata. To nije prvi put da je tehnologija mašinskog učenja zakazala. Izuzetno razvijeni i osetljivi algoritmi mašinskog učenja nisu uspeli da 2016. godine predvide rezultate glasanja za Bregzit kao ni ishod predsedničkih izbora u Sjedinjenim Državama. Neki su takav neuspeh opravdavali činjenicom da je te godine mašinsko predviđanje na osnovu algoritama bilo još u povojima. Ako je to slučaj, onda se pitamo šta se za protekle četiri godine postiglo u računarskom programiranju s obzirom na to da je došlo do prave eksplozije podataka kojim su se obučavali algoritmi dubokog učenja.

U suštini, mašinsko učenje predstavlja zamisao da računar, ako se snabde dovoljnom količinom sirovih podataka, može sam da počne da uviđa uzorke i pravilnosti u brojevima. Može, takođe, da nauči da prepozna, kategorizuje i ubacuje nove podatke koji pristižu u uzorke i pravilnosti koje je stvorio računarski program. Što više podataka pristiže, „inteligencija“ računara postaje snažnija jer uzorci i pravilnosti postaju prefinjeniji i pouzdaniji. Pored svega navedenog, i pandemija je uspela da pokaže koliko su algoritmi nepouzdani. To se posebno odnosi na sisteme mašinskog učenja u internetskoj maloprodaji koji su prvenstveno stvoreni da bi se shvatilo naše ponašanje na mreži. Tokom pandemije, naše ponašanje na mreži je bilo nedosledno i vrlo promenjivo. Novinski izveštaji u mnogobrojnim zemljama zapada koje su održavale u funkciji kupovinu na mreži tokom karantina usredsredili si se na maloprodaju koja je pokušavala da optimizuje snabdevanje toalet-papirom jedne nedelje, da bi se sledeće nedelje borila da nabavi dovoljno društvenih igara.

Poremećaji u mašinskom učenju su rasprostranjeni. Naše kupovne navike na internetu zahtevaju ogroman broj ogranaka računskih sistema koji bi se bavili oblastima kao što su upravljanje inventarom i lancem snabdevanja, marketingom, određivanjem cena, otkrivanjem prevara i tako dalje. Pažljivi posmatrač će odmah uočiti da se mnogi od ovih algoritama zasnivaju na nepromenljivim pretpostavkama o podacima. Jednostavno rečeno, to znači da algoritmi pretpostavljaju da se pravila ne menjaju ili se neće promeniti pod uticajem nekog događaja u budućnosti. Međutim, to se kosi sa osnovnom opomenom koju svaki profesionalni investitor unese malim slovima, a posebno onu koja kaže: „Prethodni učinak nije pretpostavka budućeg učinka.“

Paradoks je u tome što je osnovni zadatak mašinskog učenja da pronađe uzorke i da ih kasnije koristi da bi došao do korisnih predviđanja. Ipak, statičke pretpostavke znače da su skupovi podataka koji su korišćeni za obučavanje modela mašinskog učenja obuhvatili samo osnovne podatke o „najgorem slučaju“. Dakle, nisu očekivali pandemiju. Uz to se često dodaju i predrasude algoritmima pre nego što oni dovedu do računarskog koda, čak i onda kada se oni ne informišu u vezi sa negativnim stavovima kao što je rasizam. Predrasude ulaze kroz način na koji se rešenje mašinskog učenja oblikuje, kad su prisutne „nepoznate nepoznanice“ u skupovima podataka, kao i kako su podaci pripremljeni pre nego što se ubace u računar.

Nagomilavanje takvih predrasuda dovodi do pojave poznate pod nazivom „eho-komora“, koju su stvorili fino naštimovani algoritmi koje koriste te kompanije. Izvorni algoritam nagovara korisnike da duže ostanu na mreži i bombarduje ih ogromnom količinom informacija „eho-komore“ koje služe tome da pojačaju ono što algoritam smatra da korisnik treba da zna. Na primer, ako tražim određeni model pametnog telefona na sajtu za e-kupovinu, buduća pretraživanja će se automatski popuniti nazivom tog telefona čak i pre nego što unesem ceo naziv koji pretražujem. Algoritam se potpuno izgubi ako umesto telefona počnem da pretražujem toalet-papir.

Situacija koja je nastala zbog pandemije korona virusa i dalje je vrlo nestalna i promenljiva. Skupovi podataka koji se koriste za obučavanje, kao i računarski kôd koji oni stvaraju da bi se podesili algoritmi mašinskog učenja, ne mogu da dostignu tu promenljivost. Zbog toga im je potreban stalni ručni, odnosno ljudski nadzor i ispravljanje da ne bi oni sami, a ni ostali prefinjeni automatizovani procesi, bili potpuno onesposobljeni. Čini se da će se stalna i redovna intervencija ljudi u automatizovanim sistemima još dugo obavljati.

5866-kovid-otkrio-ogranicenja-masinskog-ucenja