OCR softver – istorijat

OCR sistem je mehanička ili elektrosnka konverzija slika kucanog (na pisaćoj mašini) ili štampanog kao i pisanog teksta u editabilan oblik na mašini (današnji računari). Jednostavan primer koji bi objasnio namenu ovakvog softvera je da pretpostavimo da imamo biblioteku koja u današnje vreme želi da prebaci svoje knjige i u elektronsku formu. Jedno rešenje bi bilo da se zaposli dosta ljudi koji bi prekucavali svaku knjigu na računaru. To bi zaista potrajalo, a i koštalo. Mnogo bi bilo bolje da postoji neki mehanizam automatskog prebacivanja koji bi svaku skeniranu sliku prebacio u editabilan tekst, a samo par ljudi da nadgleda da li je sve u redu. Takav proces bi uštedeo dosta vremena i novca. Ovakav opisan mehanizam je upravo OCR softver.

OCR se primenjuje i u raznim oblastima kao npr. automatsko prepoznavanje registarskih tablica, očitavanje dokumenata kao što su pasoši, čekovi, priznanice, fakture, itd.

Prvi pokušaji

Još odavno postoji velika želja naučnika da unaprede mašine tako da imaju sposobnosti koje čovek ima, kao na primer čitanje, pisanje, gledanje stvari itd. Prepoznavanje karaktera vodi još poreklo od davne 1870 godine. Te godine je C.R. Carey sa univerziteta Boston Masačusets izumeo retinalni skener. To je bio sistem za prenos slika koji je sadržao mozaik fotoćelija. Dve decenije kasnije je Poljak P. Nipkow izumeo sekvencijalni skener koji je bio važan napredak za modernu televiziju i mašine za čitanje.

Tokom prve decenije dvadesetog veka bilo je nekoliko pokušaja da se napravi uređaj koji bi pomogao slepima, kroz eksperemente sa OCR-om. Ipak, moderna verzija OCR se nije pojavila sve do sredine 1940-te kad su počeli da se pojavljuju digitalni računari. Razvoj se nastavio dalje, pronalazeći upotrebu u svetu poslovanja.

Početak OCR-a

Do 1950-te tehnološka revolucija je brzo napredovala te je elektronska obrada podataka postajala značajno polje rada. Podaci su se unosili kroz bušene kartice i bilo je potrebno naći neko finansijski efikasno rešenje za sve ve
e potrebe unošenje podataka.U isto to vreme tehnologija za razvoj mašina za čitanje je postala dovoljno razvijena za upotrebu i do sredine 1950-te OCR mašine su postale komercijalno dostupne. Prva prava OCR mašina za čitanje je postavljena 1954 godine. Ova mašina se koristila za konverziju izveštaja o prodaji, koji su bili pisani štampanim slovima, u bušene kartice kao ulaz u računar.

Prva generacija OCR-a

Mašine proizvedene u periodu od 1960 do 1965 se mogu nazvati prvom generacijom OCR-a. Ova generacija mašina je prepoznavala karaktere određenog fonta i veličine. Simboli su bili specijalno dizajnirani za OCR mašine i prve verzije nisu izgledale ni prirodno. Nakon nekog vremena počele su da se pojavljuju mašine za čitanje više različitih fontova, mogle su da čitaju i do 10 različitih fontova. Broj fontova je bio ograničen metodom prepoznavanja koja se koristila. Metoda, prepoznavanje šablona, je da se svaki karakter poredio sa bazom koja je imala prototip slika za svaki karakter svakog fonta. Kasnije se razvila i metoda prepoznavanje svojstva koja je trebala da omogući prepoznavanje karaktera nezavisno od fonta koji se koristio.

Druga generacija OCR-a

Mašine proizvedene u period od sredine 1960 do 1970 se mogu nazvati drugom generacijom OCR-a. Ovi sistemi su bili u mogućnosti da prepoznaju karaktere pisaćih mašina i postajala je opcija za prepoznavanje ručno štampanih karaktera. Rukom štampani krakteri su bili ograničeni na brojeve, par slova i simbole. Prvi i najpoznatiji sistem ove vrste je bio IBM 1287, koji je bio predstavljen u Americi 1965 godine. Takođe su u tom periodu svoje mašine razvijale i kompanije Hitaki i Tošiba.

U ovom periodu dosta se uradilo na polju standardizacije. Godine1966 detaljne studije OCR zahteva su se završile i definisan je Američki skup OCR karaktera (OCR-A). Stil i dizajn karaktera je bio pogodan za OCR mašine ali i čitljiv za ljude. Evropski font je takođe definisan (OCR-B) koji je bio prirodniji font od Američkog. Bilo je pokušaja da se od ta dva fonta dobije jedan, ali su umesto toga na kraju mašine mogle da prepoznaju i jedan i drugi standard.

Treća generacija OCR-a

Treća generacija OCR-a mašina je proizvedena sredinom 1970 do 1985. Radilo se na prepoznavanju dokumenata slabog kvaliteta, kao i skupova karaktera koji su bili ručno pisani i različitih veličina. Takođe je bila ideja da mašine budu jeftinije i većih performansi, što je omogućio tadašnji brz razvoj hardverske tehnologije.

Iako su počele da se pojavljuju sofisticiranije OCR mašine na tržištu, jednostavni OCR uređaji su i dalje bili jako korisni. Tokom perioda pre nego što su počeli da dominiraju personalni računari i laserski štampači, kucanje je posebno odgovaralo OCR-u. Uniformno razdvajanje slova kao i mali broj fontova su jednostavno dizajnirane OCR uređaje činili jako korisnim. Na običnoj pisaćoj mašini je mogla da se napiše prva verzija teksta a zatim preko OCR uređaja da se ubaci u kompjuter, gde su mogle da se rade dalje izmene i finalne dorade. Na ovaj način programi za obradu teksta, koji su tada bili skupi, moglo je da koristi više ljudi i tako da smanji troškove.

OCR danas

Iako su OCR mašine postale komercijalno dostupne već 1950-ih, samo nekoliko hiljada uređaja je prodato u svetu do 1986 godine. Glavni razlog za to je bila cena sistema. Međutim, kako je počela cena hardvera da opada tako su i OCR sistemi počeli da se pojavljuju kao paket softvera, samim tim je i prodaja porasla. Danas OCR softver može besplatno da se dobije uz kupljen skener koji zadovoljava privatne potrebe, dok za ozbiljniji softver ipak mora da se plati puna cena. Danas sa interneta može da se preuzme besplatan OCR softver (npr. FreeOS) sa osnovnom funkcionalnošću, a verzije koje se plaćaju (npr. Abby FineReader, Ultimate, SoftWriting) mogu prvo da se preuzmu na probno korišćenje koje traje 30 dana a nakon toga da se kupi.

Pored poređenja šablona i svojstva karaktera, koji su radili na prepoznavanju pojedinačnog karaktera, razvila se moderna tehnika koja može da identifikuje celu reč. Ovu tehniku je razvio Caere, i naziva se prediktivno optičko prepoznavanje reči. Tehnika se zasniva na korišćenju neuralnih mreža i veštačke inteligencije. Omogućava računaru da prodje kroz hiljade ili milione načina na koji mogu tačke u reči da se povežu u karaktere. Svaka kombinacija dobija verovatnoću pojavljivanja, a ona sa najvećom se uzima za rešenje.Pomoću matematičkih alogirtama pronalazi se najbolja interpretacija reči bez ispitivanja svake kombinacije.

Još jedna od zanimljivh metoda za prepoznavanje reči jeste da se prvo utvrdi koji je jezik u pitanje, pa da se nakon toga na višem nivou analiziraju reči. Na primer, utvrđeno je da je jezik srpski i program analizira reč stol*ca, prolaskom kroz rečnik lako utvđuje da nedostaje slovo i, tj. da je reč stolica.

Takođe donekle je razvijeno prepoznavanje pisanih karaktera ali za to je potrebno da se obuči sam program i važi pravilo da što je pravilniji, konzistentniji rukopis i sam program bolje radi prepoznavanje.

Autor: Miloš Biljanović, RAF

3598-ocr-softver-istorijat