Šta je obrada prirodnih jezika i čemu služi?

Veštačka inteligencija menja naš pogled na svet. Roboti koji su snabdeveni veštačkom inteligencijom su svuda. Živimo u svetu okruženom mašinskim učenjem koje se nalazi u našim mobilnim telefonima i u uređajima kao što je Aleksa kompanije „Amazon“. Kompanije „Gugl“, „Netfliks“ i one koje se bave podacima, kao i video-igrice koriste veštačku inteligenciju da bi pročešljale ogromni broj podataka. Konačni rezultat je uvid i analiza koji bi u protivnom bili nemogući ili bi mnogo dugo trajali. Zbog toga ne iznenađuje to što mnogobrojna preduzeća svih veličina pomno prate uspehe velikih kompanija koje koriste veštačku inteligenciju i brzo hvataju korak. Međutim, nisu sve tehnologije veštačke inteligencije iste; neke su mnogo uspešnije od drugih. U vezi s tim treba spomenuti obradu prirodnih jezika kao oblik veštačke inteligencije koji se usredsređuje na analizu ljudskog jezika da bi se izveli zaključci, stvorili oglasi, pomogli vam u pisanju tekstualnih poruka (da, stvarno) i za još mnogo toga.

Čemu služi obrada prirodnih jezika?

Obrada prirodnih jezika je tehnologija u povoju koja pokreće mnoge oblike veštačke inteligencije na koje smo navikli, ali njena primena se sve više proširuje. Razmišljajte ovako. Svaki dan, ljudi izgovore hiljade reči koje drugi ljudi tumače da bi obavili mnoštvo aktivnosti. U suštini, govorimo o najjednostavnijoj komunikaciji, ali svi smo svesni da reči imaju mnogo dublje značenje. Uvek postoji kontekst koji izvlačimo iz svega što neko izgovori, što znači da obraćamo pažnju na govor tela ili na ono što neko ponovi nekoliko puta. Obrada prirodnih jezika se ne usredsređuje na promenu glasa, ali izvodi zaključke prema kontekstualnim uzorcima.

I baš tu obrada prirodnih jezika pokazuje svoju vrednost. Navešćemo jedan primer da bismo pokazali koliko je moćna kada se koristi u određenoj situaciji. Kad unosite tekst na telefonu, što mnogi od nas čine svaki dan, vidite predloge reči koji se pojavljuju na osnovu onoga što trenutno unosite. To je primer obrade prirodnih jezika u praksi. To je tako neznatna procedura da je svi uzimamo zdravo za gotovo i to već godinama, međutim, njen značaj je mnogo veći. Hajde da sad sve to primenimo u svetu poslovanja.

Neka kompanija pokušava da odluči kako da se najbolje oglašava svojim korisnicima. Mogla bi da koristi Gugl pretraživač da bi pronašla uobičajene pojmove pretraživanja koje njeni korisnici unose kad traže neki njen proizvod. Obrada prirodnih jezika u tom slučaju omogućava brzo okupljanje podataka u pojmove koji se očigledno odnose na njenu robnu marku kao i one koje nisu uobičajeni. Korišćenje neuobičajenih termina može omogućiti kompaniji da se oglašava na neki novi način.

Dakle, kako radi obrada prirodnih jezika?

Kao što smo prethodno napomenuli, obrada prirodnih jezika je oblik veštačke inteligencije koji analizira ljudski jezik. Postoje mnogi njeni oblici, ali, u suštini, tehnologija pomaže mašinama da razumeju ljudski govor i čak se sporazumevaju na njemu. Ipak, nije lako shvatiti kako obrada prirodnih jezika funkcioniše jer predstavlja napredni oblik veštačke inteligencije koji je tek odnedavno postao održiv i moguć. To znači da ne samo da i dalje saznajemo ponešto novo o toj tehnologiji, već i da nam je još teško da je u potpunosti shvatimo.

Pokušaću da predstavim obradu prirodnih jezika tako da svako može da je razume. Možda se neću dotaći svake tehničke definicije, ali pretpostavljam da bi to mogao da bude najlakši način da shvatimo kako obrada prirodnih jezika funkcioniše.

Prvi korak u obradi zavisi od primene sistema. Sistemi koji se zasnivaju na glasu kao što je „Aleksa“ ili „Guglov Asistent“ moraju da vaše reči prevedu u tekst. To se uglavnom obavlja uz pomoć sistema skrivenih Markovljevih modela ( HMM – Hidden Markov Models). HMM koriste matematičke modele da bi odredili šta ste rekli i da bi vaše reči prebacili u tekst koji može da koristi sistem obrade prirodnih jezika. Najjednostavnije rečeno, HMM slušaju odsečke vašeg govora koji su dugački 10 ili 20 milisekundi i traži foneme (najmanje jedinice govora) da bi ih uporedio sa prethodno snimljenim govorom.

Nakon toga sledi razumevanje jezika i konteksta. Svaki sistem obrade prirodnih jezika koristi pomalo drugačije tehnike, ali u suštini svi su prilično slični. Sistemi pokušavaju da rastave svaku reč na vrste reči (imenice, glagole, itd.). To se dešava kroz niz kodiranih gramatičkih pravila koja se oslanjaju na algoritme koji obuhvataju statističko mašinsko učenje da bi se utvrdio kontekst onoga što ste rekli.

Ako ne govorimo o tehnologiji obrade koja pretvara govor u tekst, sistem preskače prvi korak i odmah prelazi na analizu reči pomoću algoritama i gramatičkih pravila. Konačni rezultat je sposobnost kategorizacije onog što je rečeno na mnogo različitih načina. U zavisnosti od toga koji je glavni fokus softvera obrade prirodnih jezika, rezultati se mogu koristiti na različite načine.

Na primer, SEO aplikacija može da koristi dekodiran tekst da bi izvukla ključne reči koje su povezane sa određenim proizvodom.

Semantička analiza

Kad tumačimo i objašnjavamo obradu prirodnih jezika, važno je spomenuti i semantičku analizu. Neodvojivo je povezana sa obradom i predstavlja okosnicu obrade prirodnih jezika. Semantička analiza je potrebna da bi sistem obrade prirodnih jezika logično razumeo rečenice ljudskog jezika. Kad HMM metod razloži rečenice do njihove osnovne strukture, semantička analiza pomaže procesu da doda sadržaj. Na primer, ako program za obradu prirodnih jezika vidi reč „kosa“, potreban mu je kontekst da bi odredio da li se u tekstu razgovara o dlakama na ljudskoj glavi ili o poljoprivrednoj alatki za košenje.
Ako HMM metod razloži tekst, a obrada prirodnih jezika omogući komunikaciju između čoveka i računara, onda semantička analiza obezbeđuje da sve ima kontekstualnog smisla.

Bez semantičke analize ne bismo imali veštačku inteligenciju na današnjem nivou razvoja. Dok proces napreduje, možemo očekivati da će obrada prirodnih jezika od toga imati još više koristi.

Obrada prirodnih jezika i još mnogo više

Tokom razvoja obrade prirodnih jezika biće unapređen i odnos između čoveka i veštačke inteligencije. Uređaji kao što su „Guglov Asistent“ i „Amazonova Aleksa“, koji probijaju put u naše domove i automobile, ukazuju nam na to da ćemo se i dalje družiti sa veštačkom inteligencijom. Sledećih nekoliko godina prisustvovaćemo još većem napretku veštačke inteligencije, a očekuje se da njeno globalno tržište do 2015. godine dostigne vrednost od 60 milijardi dolara. Ne treba ni da vas upozoravamo na to da morate budno da motrite na veštačku inteligenciju.

4959-sta-je-obrada-prirodnih-jezika-i-cemu-sluzi