Pet glavnih razlika između GPT-4 i GPT-3.5 - Рачунарски факултет

Između starijeg GPT-3.5 i sjajnog novog GPT-4 modela postoje neke ključne razlike.

Posle svih nagađanja i tvrdnji u vezi sa sposobnostima GPT-4 modela, dugo očekivana četvrta verzija GPT porodice jezičkih modela predstavljena je javnosti 14. marta 2023. godine.

Iako GPT-4 ne poseduje neke od obećanih i očekivanih karakteristika, najnoviji model ipak predstavlja značajni napredak u odnosu GPT-3.5 i njegove prethodnike. Kakve razlike postoje između GPT-4 i GPT-3.5 modela? Navešćemo neke ključne.

1. GPT-4 i GPT-3.5: Kreativnost

Jedna od najistaknutijih prednosti modela GPT-4 u odnosu na GPT-3.5 je njegova sposobnost da pruži kreativnije odgovore na upite. Naravno, ne kažemo da GPT-3.5 nije izuzetno kreativan. Postoji dugačak popis svega kreativnog za šta je spomenuti model sposoban i za šta se može koristiti. Kao što nam je poznato, on već uveliko prevazilazi mnoge velike jezičke modele u smislu kreativnosti.

Međutim, GPT-4 još više podiže standarde u tom smislu. Iako kreativna prednost GPT-4 možda nije očigledna kada pokušavate da rešite osnovne probleme, razlika u kreativnosti između oba modela postaje očigledna kako zadatak postaje teži i zahteva viši nivo kreativnosti.

Na primer, ako tražite od oba modela da završe kreativni zadatak kao što je pisanje pesme pri čemu treba da koriste engleski i francuski jezik u svakom redu pesme, ChatGPT kojeg pokreće najnoviji GPT-4 model daće bolje rezultate. GPT-4 bi u tom slučaju koristio oba jezika u svakom stihu pesme, dok bi GPT-3.5 umesto toga koristio jedan jezik za jedan stih, a drugi za sledeći stih.

2. GPT-4 i GPT-3.5: slikovni ili vizuelni ulazi

Već dobro znamo da GPT-3.5 može da prihvati samo tekstualne upite. S druge strane, GPT-4 je multimodalan i može da prihvati i tekstualne i vizuelne unose. Da budemo jasni, kada kažemo vizuelni unosi, slika ne mora da bude slika otkucanog upita – može da bude slika bilo čega. Dakle, GPT-4 može da razume i opiše skoro svaku sliku, od slike rukom pisanog matematičkog problema do Reddit memova. Za razliku od GPT-3.5 modela, GPT-4 je i jezički i vizuelni model.

Tokom najave GPT-4 modela, koja je išla uživo, inženjer kompanije OpenAI je uneo u model snimak ekrana stranice Discord servera. GPT-4 je mogao da opiše svaki detalj na njoj, uključujući imena korisnika koji su u to vreme bili na mreži. Modelu je, takođe, dostavljena rukom nacrtana slika koja je predstavljala izgled buduće veb-stranice zajedno sa uputstvima da je pretvori u pravu veb-stranicu, i začudo, GPT-4 je obezbedio radni kôd za veb-stranicu koji odgovara slici.

3. GPT-4 i GPT-3.5: Bezbedniji odgovori

Iako GPT-4 nije savršen, mere koje usvaja da bi obezbedio bezbednije odgovore su dobrodošla nadogradnja u odnosu na model GPT-3.5. U slučaju modela GPT-3.5, kompanija OpenAI se u slučaju odgovora i kontrole njihove bezbednosti u velikoj meri oslanjala na metod moderacije. Drugim rečima, neke od mera koje su obezbeđivale bezbednost odgovora pojavljivale su se naknadno. Dakle, kompanija je pratila šta korisnici rade kao i pitanja koja su postavljali, prepoznavala nedostatke i pokušavala da ih popravi u hodu. U slučaju modela GPT-4, većina tih mera je već ugrađena u sistem na nivou modela. Da bismo bolje objasnili razliku, to je kao da gradite kuću od čvrstog materijala od samog početka u odnosu izgradnju kuće od bilo kakvog materijala, a zatim pokušavate da zakrpite rupe i popravite greške kada se pojave. Prema tehničkom izveštaju kompanije u vezi sa GPT-4 modelom, GPT-4 daje loše odgovore samo u 0,73% slučajeva u poređenju sa 6,48% odgovora u slučaju GPT-3.5.

4. GPT-4 i GPT-3.5: Pouzdanost odgovora

Jedna od mana GPT-3.5 je njegova sklonost da samouvereno nudi besmislene i neistinite informacije. U žargonu veštačke inteligencije, to se naziva „halucinacija veštačke inteligencije“ i može da izazove nepoverenje u informacije koje generiše veštačka inteligencija.

U slučaju GPT-4 modela, halucinacije su i dalje problem. Međutim, prema tehničkom izveštaju o GPT-4 modelu, postoji od 19 do 29 procenata manje verovatnoće da će halucinirati u poređenju sa modelom GPT-3.5. Međutim, ne radi se samo o tehničkom izveštaju. Odgovori GPT-4 modela na ChatGPT-u su primetno pouzdaniji.

5. GPT-4 i GPT-3.5: Kontekstualni prozor

Razlika između GPT-4 i GPT-3.5 o kojoj se manje govori je kontekstualni prozor i veličina konteksta. Od veličine kontekstualnog prozora zavisi koliko podataka model može da zadrži u svojoj „memoriji“ tokom sesije ćaskanje i koliko dugo. GPT-4 ima znatno bolju veličinu konteksta i prozora od svog prethodnika. U praksi, to znači da GPT-4 može bolje i duže da pamti kontekst razgovora, kao i uputstva data tokom razgovora.

Problem sa GPT-3.5 modelom je njegova sklonost da skrene sa teme ili ne prati uputstva dok se razgovor odvija. Mogli biste, na primer, da kažete modelu da vas oslovljava imenom, i to bi funkcionisalo neko vreme, ali onda neće moći da prati uputstva. Iako taj problem i dalje postoji kod modela GPT-4, on je manji zbog boljeg kontekstualnog prozora.

Drugi problem je ograničenje obima teksta koji možete da koristite u jednom pokušaju. Sažimanje dugačkog teksta pomoću GPT-3 modela obično znači da treba tekst podeliti na više delova i onda ga sažimati malo po malo. Poboljšanje dužine konteksta u GPT-4 modelu znači da možete odjednom nalepiti kompletne PDF dokumente i narediti modelu da ga sumira u celini.

GPT-4: Korak napred u odnosu na GPT-3.5

Bez sumnje, GPT-4 je značajan korak napred u odnosu na svoje prethodnike. Iako je još uvek opterećen nekim ograničenjima koje ima GPT-3.5, značajna poboljšanja u nekoliko oblasti i dodavanje novih mogućnosti čine model uzbudljivim novim korakom napred u potrazi za zaista inteligentnim jezičkim modelima veštačke inteligencije.