Ковид открио ограничења машинског учења

Алгоритми машинског учења показали су да не могу да се изборе са недоследношћу и да им је потребна интервенција људи Прошлог петка, амерички Dow Jones Index попео се за 1.000 поена. Министарство за рад је изјавило да се неочекивано отворило 2,5 милиона радних места у мају, што је дошло као добра вест с обзиром на то да је у ужасном априлу без посла остало 20 милиона људи. Дакле стопа незапослености се смањила на 13 процената у мају у односу на 15 колика је била у априлу. Извештај је збунио многе економисте и финансијске стручњаке који су предвидели да ће још неколико милиона људи остати без посла. Њихови модели машинског учења предвидели су да ће стопа незапослености наставити да расте све док не пређе 20 процената. То није први пут да је технологија машинског учења заказала. Изузетно развијени и осетљиви алгоритми машинског учења нису успели да 2016. године предвиде резултате гласања за Брегзит као ни исход председничких избора у Сједињеним Државама. Неки су такав неуспех оправдавали чињеницом да је те године машинско предвиђање на основу алгоритама било још у повојима. Ако је то случај, онда се питамо шта се за протекле четири године постигло у рачунарском програмирању с обзиром на то да је дошло до праве експлозије података којим су се обучавали алгоритми дубоког учења.

У суштини, машинско учење представља замисао да рачунар, ако се снабде довољном количином сирових података, може сам да почне да увиђа узорке и правилности у бројевима. Може, такође, да научи да препозна, категоризује и убацује нове податке који пристижу у узорке и правилности које је створио рачунарски програм. Што више података пристиже, „интелигенција“ рачунара постаје снажнија јер узорци и правилности постају префињенији и поузданији. Поред свега наведеног, и пандемија је успела да покаже колико су алгоритми непоуздани. То се посебно односи на системе машинског учења у интернетској малопродаји који су првенствено створени да би се схватило наше понашање на мрежи. Током пандемије, наше понашање на мрежи је било недоследно и врло промењиво. Новински извештаји у многобројним земљама запада које су одржавале у функцији куповину на мрежи током карантина усредсредили си се на малопродају која је покушавала да оптимизује снабдевање тоалет-папиром једне недеље, да би се следеће недеље борила да набави довољно друштвених игара.

Поремећаји у машинском учењу су распрострањени. Наше куповне навике на интернету захтевају огроман број огранака рачунских система који би се бавили областима као што су управљање инвентаром и ланцем снабдевања, маркетингом, одређивањем цена, откривањем превара и тако даље. Пажљиви посматрач ће одмах уочити да се многи од ових алгоритама заснивају на непроменљивим претпоставкама о подацима. Једноставно речено, то значи да алгоритми претпостављају да се правила не мењају или се неће променити под утицајем неког догађаја у будућности. Међутим, то се коси са основном опоменом коју сваки професионални инвеститор унесе малим словима, а посебно ону која каже: „Претходни учинак није претпоставка будућег учинка.“

Парадокс је у томе што је основни задатак машинског учења да пронађе узорке и да их касније користи да би дошао до корисних предвиђања. Ипак, статичке претпоставке значе да су скупови података који су коришћени за обучавање модела машинског учења обухватили само основне податке о „најгорем случају“. Дакле, нису очекивали пандемију. Уз то се често додају и предрасуде алгоритмима пре него што они доведу до рачунарског кода, чак и онда када се они не информишу у вези са негативним ставовима као што је расизам. Предрасуде улазе кроз начин на који се решење машинског учења обликује, кад су присутне „непознате непознанице“ у скуповима података, као и како су подаци припремљени пре него што се убаце у рачунар.

Нагомилавање таквих предрасуда доводи до појаве познате под називом „ехо-комора“, коју су створили фино наштимовани алгоритми које користе те компаније. Изворни алгоритам наговара кориснике да дуже остану на мрежи и бомбардује их огромном количином информација „ехо-коморе“ које служе томе да појачају оно што алгоритам сматра да корисник треба да зна. На пример, ако тражим одређени модел паметног телефона на сајту за е-куповину, будућа претраживања ће се аутоматски попунити називом тог телефона чак и пре него што унесем цео назив који претражујем. Алгоритам се потпуно изгуби ако уместо телефона почнем да претражујем тоалет-папир.

Ситуација која је настала због пандемије корона вируса и даље је врло нестална и променљива. Скупови података који се користе за обучавање, као и рачунарски кôд који они стварају да би се подесили алгоритми машинског учења, не могу да достигну ту променљивост. Због тога им је потребан стални ручни, односно људски надзор и исправљање да не би они сами, а ни остали префињени аутоматизовани процеси, били потпуно онеспособљени. Чини се да ће се стална и редовна интервенција људи у аутоматизованим системима још дуго обављати.