Prepoznavanje slova i objekata u računarstvu

Razvojem računarstva, bez sumnje su se razvijale i ostale nauke drastičnim brzinama, i stvarale nove grane već postojećih nauka. Kako je računarstvo, a sa njime i automatika napredovalo, stvorila se potreba za automatskim sistemima koji su samostalno mogli da donose racionalne odluke. Ti sistemi su morali da budu sposobni da nauče kako da donose ispravne odluke posmatranjem i zapažanjem svojstava iz velike količine podataka. Glavna pokretačka snaga ove tada veoma mlade nauke bila su istraživanja u statistici, obradi signala, i automatici. Prvobitno, prepoznavanje oblika se smatralo inženjerskom disciplinom, a danas je to grana mašinskog učenja, i predstavlja nauku samu za sebe.

O čemu se tu zapravo radi. Mnogi ljudi misle da je prepoznavanje oblika ili šablona isključivo zadatak u kome računar treba da vam kaže da li se na slici nalazi kuća, ili ne. Prepoznavanje oblika je više od toga, ali da bi tačno odgovorili na to pitanje, potrebno je pomenuti još jednu nauku koja je imala direktan uticaj pri „rađanju“ prepoznavanja oblika; riječ je o obradi signala. Šta je to signal? Signal predstavlja opis neke fizičke, tj. prirodne pojave. Na primjer, temperatura vazduha je signal koji opisuje vrijeme, ali to isto je i količina padavina, vlažnost vazduha, i slično. Zvuk, slika, i kardiograf su također primjeri signala.

Prepoznavanje oblika je zadatak u kome je potrebno klasifikovati određen uzorak (dio) signala u jednu ili više kategorija (nadgledano učenje), ili pronaći strukture i šablone unutar podataka (ne nadgledano učenje). Jedan primjer smo već naveli, prepoznavanje oblika na slici. Drugi primjeri su konverzija govora u tekst, upravljanje računarom putem govora, prepoznavanje slova, automatska dijagnoza na osnovu uzorka tkiva, automatska dijagnoza srčanih bolesti na osnovu kardiografa.

Jedna od prvih primjena prepoznavanja oblika koja je imala direktan uticaj na društvo je prepoznavanje slova i njihovo pretvaranje u telegrafske kodove u cilju pomoći slijepim osobama koje nisu mogle normalno da čitaju slova, a tvorac ovog sistema 1914 godine bio je Emanuel Goldberg. Mašina je radila tako što bi se rukom pomijerala preko stranice i proizvodila određene tonove kada bi naišla na odgovarajuća slova.

Primjene prepoznavanja objekata

Prepoznavanje oblika ima široku primjenu u naukama, ali i u društvu. Neke od glavnih primjena prepoznavanja oblika su:

  • Automatska dijagnoza u medicini(medicinska slika i računarska vizija)
  • Prepoznavanje lica u sigurnosnim sistemima
  • Preporuke na društvenim mrežama i web sajtovima za kupovinu
  • Automatsko upravljanje procesima
  • Prepoznavanje neispravnih proizvoda u industriji (mašinska vizija)
  • Prepoznavanje rukopisa na čekovima (računarska vizija)
  • Otkrivanje veze između pojedinih gena i pojedinih bolesti (data mining)

Prepoznavanje slova

Prepoznavanje slova predstavlja zadatak u kome je slova ili tekst potrebno konvertovati u slike ili drugi elektronski oblik. Koristi se uglavnom za razvrstavanje pošte, autentifikaciju rukopisa na čekovima, i prikupljanje podataka iz dokumenata. Postaje popularno 1995. godine naučnim radom Jan Likun-a (Yann Lecun). Za prepoznavanje slova, najviše se koriste neuralne mreže zbog svoje sposobnosti da nauče i aproksimiraju veoma nelinearne funkcije, i mogu dobro da generalizuju i donesu induktivne zaključke iz različitih rukopisa i načina pisanja.

Kako radi prepoznavanje slova

1Na slici desno: Koraci prepoznavanja slova. Slike redom: dohvatanje, izdvajanje značajnog dijela, segmentacija riječi, normalizacija(skaliranje), segmentacija slova, klasifikacija.

Prepoznavanje slova je nekada bio složen zadatak, ali danas to nije slučaj. Zadatak se sastoji iz više faza:

  1. Dohvatanje slike
  2. Priprema slike
    1. Izolovanje područija slike koje je značajno
    2. Segmentacija riječi
    3. Segmentacija slova
  3. 3. Klasifikacija

Klasifikatori kao što su neuralne mreže, obično su dizajnirani da klasifikuju pojedinačno slovo. Da bi mogli da prepoznamo tekst, potrebno je pripremiti sliku. Pre-procesiranje uglavnom obuhvata izoštravanje slike, uklanjanje linija, poravnanje , izolovanje značajnog područija, segmentaciju slike, detekciju riječi, i skaliranje. Najbitniji korak kod prepoznavanja slova jeste klasifikacija. Zadatak klasifikacije je da označi izolovanu sliku pojedinačnog znaka sa ASCII kodom tog znaka (pogledajte primjer desno). Klasifikator treba prvo da nauči kako da prepozna određena slova. U tome mu pomaže precizan algoritam, i velika količina test podataka iz kojih klasifikator mora da generalizuje šablon za pojedinačna slova. Za ovu svrhu uglavnom se koriste neuralne mreže.

Jedna od primjena prepoznavanja slova koja ima direktan uticaj na „obične“ korisnike je automatsko prevođenje slike. Ova tehnologija je spoj prepoznavanja slova, i još jedne oblasti informatike, procesiranje jezika, koja je u skorije vrijeme posala popularna razvojem dubokog učenja (deep learninga), koja je također grana mašinskog učenja.

Slika levo: Primjer rada LeNet5 sistema za klasifikaciju slova, slika desno: Automatsko prevođenje teksta na znaku sa Ruskog na Engleski.

23

Automatska dijagnoza u medicini

Automatska dijagnoza u medicini je jedna od glavnih i najširih primjena prepoznavanja oblika. Koristi se prvenstveno u radiologiji u kombinaciji sa X-Ray, MRI, ili Ultrazvučnim tehnikama medicinske slike. Uvođenjem automatske dijagnoze, značajno je smanjen faktor ljudske greške pri dijagnozama, a u isto vrijeme olakšan je rad doktorima. Uglavnom se koristi za detekciju tumora na mozgu i plućima, ali i na drugim mjestima. Osim za tumor, automatska dijagnoza se primjenjuje i na druge bolesti kao što su bolesti arterija, srčane bolesti (analizom kardiografa), i alchajmerove bolesti.

Koraci pri automatskoj dijagnozi:

  1. 4Pre-procerisanje: Filtriranje i priprema slike
  2. Segmentacija: Izolovanje različitih organa na slici
  3. Analiza strukture: Izolovanje „sumnjivih“ dijelova
  4. Klasifikacija: Zaključivanje da li je određena bolest prisutna

Slika desno:Primjer MRI mozga. (a) Normalan mozak; (b) Glioma; (c) Meningioma; (d) Alchajmerova bolest; (e) Alchajmerova bolest sa vizuelnom agnozijom (f) Pikova bolest; (g) Sarkoma; (h) Hantingtonova bolest.

Prepoznavanje lica u sigurnosnim sistemima

Prepoznavanje lica najširu primjenu ima u sigurnosnim sistemima. Korisnici ove tehnologije uglavnom su policija i sigurnosne agencije, međutim, u skorije vrijeme se dosta koristi i na društvenim mrežama za automatsko tagovanje osoba čija lica su vidljiva na slici.

Kada se koristi u sigurnosnim sistemima, uglavnom se koristi na graničnim prelazima, velikim kompanijama, aerodromima, ili u prometnim ulicama.

5Ovaj sistem se pokazao veoma uspješnim, i pomogao je policiji SAD-a da u Januaru, 2001 godine na „Super Bowl XXXV“ uhvati čak 19 ljudi koji su počinili manja krivična djela.

Drugi primjer upotrebe je od strane Meksičkih vlasti na predsjedničkim izborima 2000 godine. Meksičke vlasti su koristile sistem za prepoznavanje lica kako bi identifikovale prevarante koji su pokušali više puta da glasaju pod različitim imenima tako što su poredili lice osobe sa onim koji su prethodno glasali.

Slika desno: Sistem za prepoznavanje lica u šoping centru.

Autor: Stanko Kovačević

3944-prepoznavanje-slova-i-objekata-u-racunarstvu