Kompanija „Soni“ predstavila novu tehnologiju koja čita sa usana

Nova tehnologija bi mogla da poboljša korišćenje savremenih tehnologija, pomogne mnogima, ali i naruši privatnost. Nova tehnologija, koju je kompanija nazvala funkcijom prepoznavanja vizuelnog govora (engl. Visual Speech Enablement), koristi kamere i veštačku inteligenciju da bi pratila pokrete usana sa velike daljine, bez obzira na buku. Međutim, postavlja se pitanje, da li su njene prednosti poboljšavanja pristupačnosti umanjene mogućnošću kršenja privatnosti. Softver za prepoznavanje lica može prepoznati lica u gomili, ali kako bi bilo da prisluškujete razgovore bez pomoći obližnjih mikrofona? Funkcija za prepoznavanje vizuelnog govora kompanije „Soni“ upravo to i čini, koristeći senzore kamera i veštačku inteligenciju za prošireno čitanje sa usana u bilo kom okruženju.

Mark Hanson, kompanijin potpredsednik za proizvodnu tehnologiju i inovacije, dao je ograničeni pregled tehnologije tokom uvodne reči na CES -u. To je novi način upotrebe „Sonijevog“ Intelligent Vision Image Sensor pri čemu se koristi i veštačka inteligencija za izolovanje usana korisnika, a zatim se njihovi pokreti prevode u reči, nezavisno od bilo kakve pozadinske buke, dakle, mikrofon uopšte nije potreban. Udaljenost između senzora i korisnika je gotovo nebitna i može da radi na razdaljini od nekoliko desetina metara, jednostavnim korišćenjem senzora veće rezolucije, rekao je Hanson prošle nedelje. „Soni“ u početku planira da plasira tehnologiju na tržište imajući u vidu nekoliko specifičnih namena, kao što su automatizacija u fabrikama, kiosci i bankomati sa tehnologijom prepoznavanja glasa. Funkcija vizuelnog govora optimizovana je za upotrebu na računarima, iako bi verzije funkcije namenjene potrošačima mogle da se pojave na mobilnom hardveru u budućnosti, kaže Hanson. Na pitanje o potencijalu za upotrebu ove tehnologije u smislu pomoćnog sredstva – kao što je poboljšanje automatski generisanih opisa slika, video-zapisa i dr. или smanjenja potrebe za korišćenjem tastature или drugog pomoćnog sredstva pri pozivanju telefonskih brojeva или automatskim posrednikom za prepoznavanje govora koji zahteva solidnu vezu za prenos podataka i minimalnu pozadinsku buku – Hanson je rekao da softver još nije optimizovan za takve slučajeve upotrebe, ali bi mogao biti u budućnosti.

Uz sve pozitivne strane funkcije za prepoznavanje vizuelnog govora, postoji mogućnost da se ona zloupotrebi. Hanson kaže da tehnologija snima samo usne, a ne lica, pa se ne zadržavaju podaci koji mogu identifikovati korisnika. Ono što ostaje nerešeno je mogućnost kombinovanja funkcije vizuelnog govora sa drugim tehnologijama, od kojih mnoge koriste kamere i mogu da ugrade „Sonijeve“ senzore kombinovane sa veštačkom inteligencijom. Ako bi se funkcija za prepoznavanje vizuelnog govora koristila uz kameru za prepoznavanje lica, podaci bi mogli da se objedine i ponište zaštitu privatnosti koju je kompanija regulisala.
Naravno, svima nam je dobro poznato da danas skoro uopšte ne postoje mediji koji se bave zaštitom privatnosti svojih korisnika. Veb-lokacije vas prate putem kolačića; neki dobavljači interneta i mobilni operateri prodaju vaše podatke. Uprkos protestima u nekim gradovima i državama, tehnologija za prepoznavanje lica već se koristi na ulicama i u prodavnicama. Vreme će pokazati gde se uklapa nešto poput funkcije za prepoznavanje vizuelnog govora.

6122-kompanija-soni-predstavila-novu-tehnologiju-koja-cita-sa-usana