6 projekata mašinskog obučavanja za automatizaciju mašinskog obučavanja

Algoritmi i modeli za mašinsko obučavanje neće uvek biti samo za stručnjake, zahvaljujući ovim najnovijim projektima. Snaga mašinskog obučavanja ima svoju cenu. Kad jednom imate veštine, alatke, hardver i podatke, još uvek postoji složenost koja se tiče stvaranja i finog podešavanja modela za mašinsko obučavanje. Ali, ako je celi smisao mašinskog obučavanja da se automatizuju zadaci koji su ranije zahtevali čoveka na čelu, zar ne bi bilo moguće koristiti mašinsko obučavanje da bi se i iz samog mašinskog obučavanja izdvojio neki deo posla? Kratki odgovor je: kompetentno da. Zbirka tehnika, pod opštim nazivom „automatizovano mašinsko obučavanje“ ili AML (Automated Machine Learning), može smanjiti posao potreban za pripremu modela i njegovo postepeno poboljšavanje radi unapređenja njegove preciznosti.

Automatizovano mašinsko obučavanje je još u ranoj fazi. Danas se primjenjuje kao niz različitih delova i odvojenih tehnologija, ali se brzo oblikuje za proizvodnju i stavlja na raspolaganje prosečnom poslovnom korisniku, umesto stručnjaku za mašinsko obučavanje.

Ovde je šest vodećih automatskih alatki za mašinsko obučavanje.

Auto-sklearn i Auto-Weka

Dva primera automatskog mašinskog obučavanja već u upotrebi dolaze u obliku poboljšanja široko rasprostranjenog projekta Scikit-learn, paketa zajedničkih funkcija mašinskog obučavanja. Scikit-learn sadrži nekoliko različitih „procenjivačkih“funkcija ili metodologija za obučavanje na osnovu pruženih podataka. S obzirom na to da biranje pravog procenjivača može biti dosadno, projekat Auto-sklearn ima za cilj da uštedi nešto od tih tegoba. On sadrži jednu generičku funkciju procenjivača koja vrši sopstvenu analizu da bi se odredio najbolji algoritam i skup hiperparametara za određeni zadatak Scikit-learn-a.

Auto-sklearn još uvek zahteva neke ručne intervencije. Krajnji korisnik mora da odredi ograničenja memorije i vremena koje proces podešavanja sme da koristi. Ali mnogo je lakše napraviti te izbore i pustiti mašinu da vremenom odlučuje o ostalom, nego se mučiti sa biranjem modela i hiperparametara.

Za one koji koriste Javu i paket mašinskog obučavanja Weka , postoji jedan sličan projekat po imenu Auto-Weka. Auto-sklearn je u stvari inspirisan radom na izradi projekta Auto-Weka.

Prodigy

Jedan naporan aspekt kreiranja nadgledanih modela mašinskog obučavanja, na primer za obradu prirodnog jezika, je faza anotacije. Ljudsko biće mora ručno da kreira metapodatke za opis ili objašnjenje podataka koje model koristi.
Taj proces nije moguće potpuno automatizovati – bar za sada. Međutim, moguće je koristiti mašinsko obučavanje da bi se proces ubrzao i da bi bio manje neugodan.

To je polazište alatke za anotacije pod nazivom Prodigy. Koristi se veb interfejs da bi proces obuke bio što brži i očigledniji za modele kojima su potrebni anotirani skupovi podataka. Anotacije koje već postoje u skupu podataka koriste se za upravljanje sledećih anotacija, čime se pomaže ubrzavanje procesa dodavanja anotacija tokom vremena. Prodigy snažno koristi Python kao okruženje za mašinsko obučavanje. On sadrži Python module za obučavanje modela, za njihovo testiranje, za istraživanje anotiranih skupova podataka i za upravljanje rezultata među projektima. Gotovi modeli mogu se izvoziti kao Python paketi i staviti direktno u proizvodnju pomoću bilo koje druge Python aplikacije.

H2o Driverless AI

Još jedna ponuda koja ima za cilj da mašinsko obučavanje bude pristupačnije za nestručnjake je Driverless AI iz firme H2o.ai. Driverless AI (veštačka inteligencija bez vozača) namenjen je poslovnim korisnicima kojima su poznati proizvodi kao što je Tableau, koji žele da steknu saznanja iz podataka, a da ne moraju da ulaze u detalje algoritama mašinskog obučavanja.

Kao i Prodigy, Driverless AI koristi korisnički interfejs. Ovde korisnik izabere jednu ili više ciljnih promenljivih u skupu podataka za rešavanje, a sistem ponudi odgovor. Rezultati se predstavljaju kao interaktivni grafikoni, a objašnjeni su anotacijama na jednostavnom engleskom jeziku.

Za razliku od Prodigyja, Driverless AI je vlasnički proizvod. Veliki deo steka u H2o.ai je otvorenog izvora, ali ova komponenta nije. To je jedan od znakova da će primarni metodi uvođenja mašinskog obučavanja za korisnike van tehničke struke biti komercijalni proizvodi, a ne stekovi otvorenog koda.

Googleovi AutoML i Vizier

U poslednjih nekoliko meseci, Google je ukazao na dva sopstvena – mada potpuno interna – projekta, kao primere kako kompanija sprovodi automatizovano mašinsko obučavanje. Prvi projekat „AutoML“ kreiran je za automatizovanje dizajna višeslojnih modela dubokog učenja.

„Proces dizajniranja mreža često troši značajno vreme i eksperimentisanje stručnjaka sa značajnim iskustvom u mašinskom obučavanju“, kaže Google. Umesto da ljudi testiraju jedan mrežni dizajn dubokog obučavanja za drugim, AutoML za testiranje hiljada mogućih mreža koristi jedan algoritam obučavanja sa pojačavanjem. Povratne informacije iz svakog izvođenja algoritma mogu se koristiti za kreiranje novih arhitektura kandidata za sledeći prolaz. Sa dovoljnim brojem prolaza, mehanizam treninga može da utvrdi koji model konstrukcije donosi bolje rezultate.

Još jedan Google projekat, po imenu Google Vizier opisan u radu objavljenom u avgustu, je „servis za optimizaciju crne kutije“. Na jednostavnijem jeziku, to je način da se pronađu najbolji radni parametri za sistem u slučajevima kada je teško odrediti korelaciju između parametara koje podnosite i rezultata koje dobijete. Prema tom izveštaju, Google je koristio Vizier da bi proučio koliko se njegovih vlastitih usluga može poboljšati podešavanjem ponašanja. Uključeni su primeri „podešavanje parametara korisničkog interfejsa, kao što su fontovi i veličine umanjenih prikaza, sheme boja i razmaka ili parametri za saobraćaj, kao što je relativna važnost različitih signala prilikom određivanja koje stavke će se pokazati korisniku.“

Trenutno je Vizier samo za internu upotrebu Google-a. Ali nije nerazumno očekivati da će Google na kraju ponuditi produktivnu verziju usluge ili ga čak objaviti kao otvoreni izvorni projekat, na isti način kao što je TensorFlow razvijen interno, a zatim objavljen za ceo svet.

Ovaj tekst „6 machine learning projects to automate machine learning“ prvobitno je objavio InfoWorld.

Izvor: IT WORLD

4567-xa-6-projekata-masinskog-obucavanja-za-automatizaciju-masinskog-obucavanja-xa