4 putanje ka održivoj veštačkoj inteligenciji - Рачунарски факултет

Pomažu manji modeli, bolji čipovi i obnovljivi izvori energije. Tako se AI koristi samo kada je to potrebno.

Autor: Robert Scheier

Regulatori, investitori, kupci, pa čak i zaposleni podstiču kompanije ka minimiziranju klimatskog uticaja svojih AI inicijativa. Sve može da pomogne, od geotermalnih centara podataka do efikasnijih jedinica za grafičku obradu (GPU) . Ali ako zaista žele da se bore protiv klimatskih promena, korisnici veštačke inteligencije takođe moraju da prevaziđu poriv da za rešavanje svakog problema koriste najveće, najškodljivije AI modele.

Zabrinutost da veštačka inteligencija doprinosi globalnom zagrevanju proizilazi iz procena da GPU-ovi koji se koriste za razvoj i održavanje AI modela koriste četiri puta više energije od onih koji služe konvencionalnim aplikacijama u oblaku, i da bi AI mogla biti na putu da koristi onoliko struje koliko i cela Irska.

Kao odgovor, regulatori u Evropi i SAD počinju da zahtevaju od velikih korisnika veštačke inteligencije da izveštavaju o njenom uticaju na životnu sredinu. Agencije za kreditni rejting i klijenti obraćaju veću pažnju na pitanja životne sredine, društva i upravljanja (ESG) kao što su emisije ugljenika, kaže Faith Tailor, potpredsednica globalne održivosti i ESG službenik u kompaniji Kyndryl za globalnu infrastrukturu. Pored toga, ona kaže: „Zaposleni, posebno mlađa generacija, kažu da neće raditi u kompaniji koja nema određene ekološke ciljeve. Mi to vidimo kao faktor regrutovanja i zadržavanja zaposlenih.“

Pošto težnje za održivošću postaju sve veći prioritet, evo četiri načina na koje kompanije uspevaju da racionalizuju svoje AI napore .

Koristite efikasnije procese i arhitekture

Boris Gamazajčikov, viši menadžer za smanjenje emisija u SaaS provajderu Salesforce, preporučuje korišćenje specijalizovanih AI modela da bi se smanjila snaga potrebna za njihovo obučavanje. „Da li je potrebno da model koji za nas piše kôd može takođe da napiše i sonet?“ pita on . „Naša teorija je ne. Naš pristup je bio da kreiramo specifične modele za specifične slučajeve upotrebe, a ne jedan model opšte namene.“

On takođe preporučuje korišćenje zajednice otvorenog koda za modele koji se mogu unapred obučiti za različite zadatke. Kao jedan primer, navodi Metin Llama-2, od kojeg je, kako kaže, stvoreno više od 13.000 varijanti. „Svih tih 13.000 novih modela nije zahtevalo prethodnu obuku“, kaže on. „Razmislite o tome koliko je računanja i ugljenika to uštedelo.“ Salesforceov tim za istraživanje veštačke inteligencije je takođe razvio metode kao što je maksimalni paralelizam, dodaje on, koji efikasno deli računarski intenzivne zadatke kako bi se smanjila upotreba energije i emisije ugljenika.

Umesto da obučava model na svim podacima obuke odjednom, Salesforce obučava model u više „epoha“ u kojima se deo podataka u svakoj od njih malo modifikuje na osnovu rezultata prethodne obuke. To rezultira smanjenjem potrošnje energije, kaže on.

Neki veliki dobavljači servisa u oblaku nude alate i savete kako da veštačka inteligencija postane održivija, kao što je Amazon Web Services, koji pruža savete za korišćenje tehnologije bez servera za eliminisanje neaktivnih resursa, alate za upravljanje podacima i skupovima podataka. AWS takođe ima modele za smanjenje obrade i skladištenja podataka , i alate za infrastrukturu „prave veličine“ za AI primenu. Ako se pravilno koriste, takvi alati mogu pomoći da se minimiziraju računarski resursi potrebni za AI, a samim tim i njihov uticaj na životnu sredinu.

Koristite manje podataka

Smanjenje veličine skupa podataka koji se koristi za obuku modela je jedan od najefikasnijih načina za minimiziranje upotrebe energije i emisije ugljenika vezanih za AI. „Možete smanjiti veličinu mnogih AI modela za red veličine i izgubiti samo dva do tri procenta njegove tačnosti“, kaže profesorka Amanda Stent, direktorka Davis instituta za veštačku inteligenciju Colby koledža. „Ove tehnike su dobro poznate, ali ne tako dobro korišćene kao što bi mogle da budu, jer su ljudi fascinirani veličinom.” Tu je i pitanje koliku pažnju masovni modeli dobijaju u štampi.

Gamazajčikov kaže da najnovija verzija Salesforceovog CodeGen modela, koja omogućava korisnicima da generišu izvršni kôd koristeći prirodni jezik, radi jednako dobro kao i modeli dvostruko veći od njega. Kao grubo pravilo, kaže on, oko 50% smanjenje veličine povlači približno ekvivalentan pad emisije ugljenika.

U servisu za striming videa i muzike Plex, šef nauke o podacima Scott Weston smanjuje veličinu svojih podataka za obuku tako da se fokusira na potrebe. „Ne tražimo samo korisnike koji će se pretplatiti ili napustiti platformu, već i one koji bi trebalo da se pretplate i kako da postignemo da to urade“, kaže on. Obuka modela je jednostavnija jer je skup podataka više fokusiran i ograničen na konkretan poslovni problem koji pokušava da reši, dodaje on. „Onda pobeđuje okruženje jer ne koristimo svo to dodatno računanje za obuku modela“, kaže on.

Weston koristi modeliranje povećanja, izvodeći niz A/B testova da bi utvrdio kako potencijalni klijenti reaguju na različite ponude, a zatim koristi rezultate tih testova za izgradnju modela. Veličina skupova podataka je ograničena poslovnim problemima. „Pazimo kada da radimo značajnije testiiranje, jer ne želimo da remetimo redovan tok komunikacije sa našim klijentima.“

Koristite obnovljivu energiju

Hostovanje AI operacija u centru podataka koji koristi obnovljivu energiju je jednostavan put za smanjenje emisije ugljenika, ali nije bez nedostataka.

Servis za onlajn prevođenje Deepl pokreće svoje funkcije veštačke inteligencije iz četiri objekta za kolokaciju: dva na Islandu, jedan u Švedskoj i jedan u Finskoj. Islandski centar podataka koristi 100% geotermalnu i hidroelektričnu energiju proizvedenu iz obnovljivih izvora. Hladna klima takođe eliminiše 40% ili više od ukupne snage centra podataka koja je potrebna za hlađenje servera jer oni otvaraju prozore umesto da koriste klima-uređaje, kaže Dipl-ov direktor inženjeringa Guido Simon. Troškovi su još jedna velika prednost, kaže on, jer cene struje mogu biti više od 75% niže od onih u Nemačkoj.

Kašnjenje mreže između korisnika i održivog centra podataka može biti problem za aplikacije koje su osetljive na vreme, kaže Stent, ali samo u fazi zaključivanja, gde aplikacija daje odgovore korisniku, a ne u fazi preliminarnog obučavanja.

Deepl, sa sedištem u Kelnu, Nemačka, otkrio je da može da radi i obuku i zaključivanje iz svojih udaljenih objekata za kolokaciju. „Imamo otprilike 20 milisekundi više kašnjenja u poređenju sa centrom podataka koji je bliži nama“, kaže Simon. „Tokom procesa zaključivanja, za početno povezivanje sa AI motorom može biti potrebno 10 povratnih putovanja, što rezultira otprilike 200 do 300 milisekundi kašnjenja zbog daljine, ali možete optimizovati aplikaciju da biste smanjili to početno vreme.“

Brzina internet veze sa udaljenom lokacijom može, naravno, da ublaži probleme sa kašnjenjem. Verne Global Iceland, jedan od Deepl-ovih Islandskih dobavljača, tvrdi da su oni interkonektivna lokacija za sve podmorske kablovske sisteme do i od Islanda, sa redundantnim, visokim kapacitetom optičke povezanosti sa Evropom i SAD.

Još jedno pitanje, kaže Stent, jeste da li „obnovljivi” centar podataka koristi najnovije i najefikasnije GPU ili tenzor procesorske jedinice (TPU). Ako ne, mogao bi da koristi više energije nego konvencionalno napajan, ali moderniji centar podataka. To međutim, nije problem za Deepl, jer on ima svoje „super vrhunske“ servere u objektima za kolokaciju, kaže Simon.

Ne koristite AI uopšte

Dok se o veštačkoj inteligenciji mnogo priča među zaposlenima i kupcima, možda bi je bilo preterano koristiti ako su drugi pristupi lakši za implementaciju i imaju manji uticaj na životnu sredinu. „Uvek pitajte da li je odnos veštačke i mašinske inteligencije (AI/MI) pravi za vaše radno opterećenje“, preporučuje AWS u svojim smernicama za održivost. „Nema potreba za korišćenjem računarski intenzivne veštačke inteligencije kada bi jednostavniji, održiviji pristup mogao da bude dovoljan. Na primer, korišćenje mašinske inteligencije za rutiranje IoT poruka može biti neopravdano; logiku možete da izrazite i pomoću mašine za pravila.“

Pored ekoloških razmatranja, Plex nije u stanju da uloži milione dolara računarstva u obuku najvećih modela. „Bolje je da budete uporni i da se pobrinete da ste sve razmotrili, a ne samo da trošite novac na problem“, kaže Weston.

Kompanija za onlajn igre Mino Games koristi DataGPT, koji integriše analitiku, bazu podataka za keširanje, kao i izdvajanje, prevođenje i učitavanje (ETL) procesa za ubrzavanje upita, kao što su biranje novih funkcija koje će ponuditi igračima. Voditelj analize podataka Diego Caceres poziva na oprez u tome kada da se koristiti AI. „Pažljivo formulirajte poslovni problem i utvrdite da li je možda jednostavna matematika dovoljno dobra“, kaže on.

Tekući izazovi

Pored troškova implementacije održive veštačke inteligencije u okviru distribuiranog radnog opterećenja zasnovanog na oblaku, problem je otkrivanje koje radno opterećenje troši snagu, kaže Yugal Yoshi, partner konsultantske firme Everest Group. Zbog toga, kaže on, većina kompanija se najpre fokusira na poslovni rezultati od AI, a tek onda na održivost.

Još jedan izazov, kaže Gamazajčikov iz Salesforcea, jeste dobijanje informacija od programera o ugljeničnom otisku njihovih temeljnih AI modela. Uz dodatnu regulativu iz izvora kao što su Evropska unija i Komisija za hartije od vrednosti i berze SAD, „ako kompanije još ne obelodanjuju brojeve, moraće uskoro da počnu da to rade“, kaže on.

Još jedan problem je mamac dramatičnih otkrića pokretanih veštačkom inteligencijom, bez obzira na cenu po životnu sredinu.

„Neke kompanije kažu `želimo da budemo održivi`, ali takođe žele da budu poznate po izvrsnosti svoje veštačke inteligencije, a njihovi zaposleni žele da urade nešto revolucionarno“, kaže Stent sa Colby koledža. „Ako ih finansijski pritisci ne primoraju da njihovi AI napori postanu efikasniji“, kaže ona , „nešto drugo će ih udaljiti od održivosti.”

Izvor: CIO