Како је Excel изгубио 16.000 ковид-тестова у Енглеској

Завод за јавно здравље у Енглеској кривицу за грешке у подацима приписује ограничењима Excel табела компаније „Мајкрософт“. Коначно је откривено да је ограничење од милион редова у „Мајкрософтовом“ Excel програму за прорачунске табеле могло да доведе до тога да Завод за јавно здравље Енглеске изгуби скоро 16.000 резултата тестова за ковид-19. Грешка у подацима, која је довела до тога да се 15.841 позитиван тест изостави из званичних дневних података, значи да је апликацијама које се баве праћењем контаката промакло 50.000 потенцијално заразних људи којима није речено да примене мере самоизолације. Завод за јавно здравље био је одговоран за прикупљање резултата тестова из јавних и приватних лабораторија и објављивање дневних ажурирања о броју случајева и урађеним тестовима.

Међутим, пошто се програм тестирања значајно убрзао, већи део посла и даље се обавља ручно, а појединачне лабораторије шаљу Заводу табеле са резултатима. Иако се систем побољшао од првих дана пандемије, ипак, ако се неки од процеса и даље обављају преко телефонских позива или помоћу оловке и папира, можемо да закључимо да је цео поступак далеко од аутоматизованог. У случају о коме говоримо, једна лабораторија је Заводу за јавно здравље послала свој дневни извештај о тестирању у облику CSV датотеке – најједноставнијег могућег формата базе података, дакле, у облику листе вредности које су одвојене запетама. Тај извештај је затим учитан у програм Microsoft Excel, а нови тестови на дну су додати главној бази података.

Међутим, док CSV датотеке могу да буду било које величине, датотеке у програму Microsoft Excel могу имати само 1.048.576 редова – или, у старијим верзијама које Завод, вероватно, и даље користи – само 65.536 редова. Када се отвори CSV датотека дужа од наведених ограничења, доњи редови се, једноставно, исеку и више се не приказују. То значи да је, пошто је лабораторија извршила више од милион тестова, било само питање времена када ће се они изгубити у Excel документу, односно извештају Завода. Софтвер за прорачунске табеле компаније „Мајкрософт“ један је од најпопуларнијих пословних алата на свету, али редовно се у њему појављују грешке које могу бити скупе или чак опасне јер се сасвим лако може користити у ситуацијама за које није направљен и којима није дорастао.

Грешка која се поткрала у Excel програму у компанији ЈПМорган 2013. године, прикрила је губитак од скоро 6 милијарди долара, кад је ћелија погрешно подељена збиром две каматне стопе, а не просечном. Вест је навела Џејмса Квока, професора права на Универзитету у Конектикату, да упозори да је Excel „невероватно крхак“. „Једноставно, не можете да пратите одакле потичу ваши подаци, не постоји ревизијски траг (што значи да можете да прекуцате бројеве потпуно несвесно), а пре свега не постоји једноставан начин за тестирање прорачунских табела. Највећи проблем је тај што свако може направи Excel табеле – и то лоше и погрешне. С обзиром на то да је тако једноставан за употребу, свако мисли да је способан да прави изузетно важне прорачунске табеле, а њих би требало да праве људи који разумеју програмирање и то на методичан и правилно документован начин“, написао је Квок.

Грешке у софтверу за прорачунске табеле промениле су чак и саме темеље људске генетике. Одбор за номенклатуру људских гена је током прошле године променио називе 27 гена јер их је програм компаније „Мајкрософт“ непрестано погрешно форматирао. На пример, гени SEPT1 и MARCH1 промењени су у SEPTIN1 и MARCHF1 пошто су више пута претварани у датуме, док су симболи који су уобичајене речи промењени тако да их граматички алати нису аутоматски исправили. На пример, WARS је сада WARS1.