Компанија „Сони“ представила нову технологију која чита са усана

Нова технологија би могла да побољша коришћење савремених технологија, помогне многима, али и наруши приватност. Нова технологија, коју је компанија назвала функцијом препознавања визуелног говора (енгл. Visual Speech Enablement), користи камере и вештачку интелигенцију да би пратила покрете усана са велике даљине, без обзира на буку. Међутим, поставља се питање, да ли су њене предности побољшавања приступачности умањене могућношћу кршења приватности. Софтвер за препознавање лица може препознати лица у гомили, али како би било да прислушкујете разговоре без помоћи оближњих микрофона? Функција за препознавање визуелног говора компаније „Сони“ управо то и чини, користећи сензоре камера и вештачку интелигенцију за проширено читање са усана у било ком окружењу.

Марк Хансон, компанијин потпредседник за производну технологију и иновације, дао је ограничени преглед технологије током уводне речи на CES-у. То је нови начин употребе „Сонијевог“ Интеллигент Висион Имаге Сенсор при чему се користи и вештачка интелигенција за изоловање усана корисника, а затим се њихови покрети преводе у речи, независно од било какве позадинске буке, дакле, микрофон уопште није потребан. Удаљеност између сензора и корисника је готово небитна и може да ради на раздаљини од неколико десетина метара, једноставним коришћењем сензора веће резолуције, рекао је Хансон прошле недеље. „Сони“ у почетку планира да пласира технологију на тржиште имајући у виду неколико специфичних намена, као што су аутоматизација у фабрикама, киосци и банкомати са технологијом препознавања гласа. Функција визуелног говора оптимизована је за употребу на рачунарима, иако би верзије функције намењене потрошачима могле да се појаве на мобилном хардверу у будућности, каже Хансон. На питање о потенцијалу за употребу ове технологије у смислу помоћног средства – као што је побољшање аутоматски генерисаних описа слика, видео-записа и др. или смањења потребе за коришћењем тастатуре или другог помоћног средства при позивању телефонских бројева или аутоматским посредником за препознавање говора који захтева солидну везу за пренос података и минималну позадинску буку – Хансон је рекао да софтвер још није оптимизован за такве случајеве употребе, али би могао бити у будућности.

Уз све позитивне стране функције за препознавање визуелног говора, постоји могућност да се она злоупотреби. Хансон каже да технологија снима само усне, а не лица, па се не задржавају подаци који могу идентификовати корисника. Оно што остаје нерешено је могућност комбиновања функције визуелног говора са другим технологијама, од којих многе користе камере и могу да уграде „Сонијеве“ сензоре комбиноване са вештачком интелигенцијом. Ако би се функција за препознавање визуелног говора користила уз камеру за препознавање лица, подаци би могли да се обједине и пониште заштиту приватности коју је компанија регулисала.
Наравно, свима нам је добро познато да данас скоро уопште не постоје медији који се баве заштитом приватности својих корисника. Веб-локације вас прате путем колачића; неки добављачи интернета и мобилни оператери продају ваше податке. Упркос протестима у неким градовима и државама, технологија за препознавање лица већ се користи на улицама и у продавницама. Време ће показати где се уклапа нешто попут функције за препознавање визуелног говора.