I kompanija Meta ima novi jezički model mašinskog učenja - Рачунарски факултет

Kako navode u kompaniji, to nije sistem sa kojim možete da razgovarate, već je to istraživački alat. U Meti se nadaju da će ga ljudi koristiti da bi rešili neke od problema koji muče jezičke modele veštačke inteligencije.

Nekoliko poslednjih nedelja, u tehnološkim krugovima se uglavnom razgovara o jezičkim modelima koje su kompanije, kao što su Microsoft, Google i OpenAI, razvile i predstavile javnosti. Međutim, Meta, matična kompanija mreže Facebook, daje značajan doprinos u oblasti veštačke inteligencije, jer je u petak predstavila novi jezički generator pod nazivom LLaMA.

LLaMA nije kao ChatGPT ili Bing, odnosno, nije sistem sa kojim svako može da razgovara. U suštini, to je istraživački alat. U kompaniji kažu da su ga predstavili javnosti nadajući se da će „demokratizovati pristup ovom važnom polju koje se brzo menja“. Drugim rečima. pomoći će stručnjacima da otkriju probleme jezičkih modela veštačke inteligencije, od pristrasnosti i govora mržnje do njihove sklonosti da jednostavno izmisle informacije.

Zbog toga je Meta odlučila da predstavi model LLaMA (koji, zapravo, nije jedan sistem, već kvartet modela različitih veličina) pod „nekomercijalnom licencom koja bi omogućila njegovu upotrebu prvenstveno u istraživačke svrhe“. Pristup ovom jezičkom modelu omogućen je univerzitetima, nevladinim organizacijama i industrijskim laboratorijama.

Kompanija je u svojoj veoma optimističnoj objavi navela da veruje da će svi koji se bave veštačkom inteligencijom – naučnici i stručnjaci, građansko društvo, kreatori politike i privreda – shvatiti da moraju da rade zajedno kako bi razvili jasne smernice oko odgovorne veštačke inteligencije uopšte i posebno odgovornih velikih jezičkih modela. Konačno, tvrde da jedva čekaju da vide šta zajednica može da nauči – i na kraju izgradi – koristeći LLaMA.

U istraživačkom radu, Meta tvrdi da druga najmanja verzija LLaMA modela, LLaMA-13B, radi bolje od popularnog GPT-3 modela kompanije OpenAI „prema većini parametara“, dok najveća, LLaMA-65B, „može da se meri sa najboljim modelima“, kao što su Chinchilla70B kompanije DeepMind i PaLM 540B kompanije Google. (Brojevi u nazivima odnose se na milijarde parametara u svakom modelu – meru veličine sistema i grube procene stepena razvijenosti, mada ove dve osobine ne moraju nužno da idu ruku pod ruku.)

Kada se LLaMA-13B obuči, moći će da se pokrene na jednom data centru koji je opremljen Nvidia Tesla V100 GPU. To je odlična vest za manje institucije koje žele da obave testove na tim sistemima, ali nije od posebnog značaja za pojedinačne istraživače kojima je takva oprema suviše skupa.

Metino predstavljanje sopstvenog sistema veštačke inteligencije nije se poklopilo sa bučnim pojavama mnogih razgovorljivih robota. To možda i nije toliko loše s obzirom na kritike koje je pretrpela kompanija Microsoft kad je brzopleto predstavila Bing javnosti i na pad cena akcija kompanije Google nakon što je njen chatbot pokazao u demo verziji neoprostivo neznanje iz osnova astronomije.

Prisetimo se da ovo nije prvi inteligentni i pričljivi robot kompanije Meta. Među njima je bio BlenderBot, koji nije bio baš najbolje prihvaćen, jer jednostavno nije bio dovoljno dobar. Drugi, koji je nazvan Galactica, bio je dizajniran da piše naučne radove, ali povučen je sa mreže posle samo tri dana, jer je neprestano proizvodio naučne gluposti.

Meta se verovatno nada da će LLaMA kvartet naići na odobravanje javnosti.

Povodom predstavljanja novog modela, oglasio se izvršni direktor Mark Zakerberg u objavi na mreži Facebook: „Danas predstavljamo novi najsavremeniji veliki jezički model veštačke inteligencije pod nazivom LLaMA, dizajniran da pomogne stručnjacima u unapređivanju istraživanja. Veliki jezički modeli su pokazali da imaju veliki potencijal za generisanje teksta, vođenje razgovora, sažimanje pisanog materijala i za komplikovanije zadatke, kao što je rešavanje matematičkih problema ili predviđanje proteinskih struktura. Meta je posvećena ovom otvorenom modelu istraživanja i naš novi model ćemo učiniti dostupnim istraživačkoj zajednici koja se bavi veštačkom inteligencijom.“