Zdrowy rozsądek dla sztucznej inteligencji

Paweł Wittich, psycholog, trener, specjalista ds. rekrutacji Akademii Monitoringu Wizyjnego

Wywiad z Simonem Harrisem z IMS Research w zeszłym numerze  zachęcił mnie do napisania kilku słów na temat inteligentnej analizy treści wizyjnej (VCA), stosowanej do obserwacji w czasie rzeczywistym. Przedstawiam alternatywny punkt widzenia i zachęcam do zachowania zdrowego rozsądku.

Błędny punkt wyjścia IMS Research
Simon Harris z IMS Research twierdzi, że operator jest „z natury omylny”, bo „po zaledwie 20 minutach obserwowania dwóch lub więcej monitorów (...) pomija aż do 95% aktywności sceny”.
Badania cytowane przez HOSDB – jednostkę naukowo-badawczą brytyjskiego Ministerstwa Spraw Wewnętrznych (Tickner i Poulton) wskazują, że operatorzy mają znacznie większe możliwości – skuteczność wykrywania postaci w zatłoczonym centrum miasta wynosi dla czterech monitorów 93%, dla 9 – 84%, dla 16 – 64%.
Jeżeli chodzi o czas, to przeciętny człowiek zaczyna tracić czujność po kwadransie; po 30 minutach tylko o 25% (Mackworth). W testach prowadzonych przez Akademię Monitoringu Wizyjnego spotykam osoby, które bez problemów utrzymują stałą, wysoką czujność w dwóch 30-minutowych testach. W Polsce i na świecie operatorzy prowadzą obserwację od 30 minut do 2 godzin, w zależności od miejsca, natężenia zdarzeń i preferencji operatorów. Wniosek: Należy szukać ludzi, którzy mają ponadprzeciętne możliwości, a nie rezygnować z operatorów.
Oprócz specyficznych miejsc, jak stoliki w kasynach, operatorzy nie muszą przez cały czas obserwować 100% sceny. Co pewien czas skanują obraz, ale przede wszystkim szukają odstępstw od normy i wskazówek zdarzeń oraz sprawdzają nowe elementy pojawiające się na scenie. Praca operatora przypomina obserwację płynącej rzeki – w pewnym momencie przestajemy zwracać uwagę na wodę, ale konar, plusk wody, odbicie łusek pod powierzchnią automatycznie przykuwają naszą uwagę.
Twierdzenie, ze operator CCTV jest „z natury omylny”, to jak powiedzieć że kontroler lotu, lekarz lub kierowca ciężarówki są zawodni, bo popełniają błędy. Mimo to tysiące samolotów codziennie lądują na lotniskach całego świata, ładunki docierają na czas, a pacjenci w większości przypadków otrzymują trafną diagnozę. Błędy i katastrofy zdarzają się, ale największym atutem człowieka jest umiejętność wykrywania zagrożeń, zwłaszcza w dynamicznym środowisku.

SAMAE – test Dynamicznej Uwagi (śledzenie kilku obiektów poruszających się niezależnie od siebie, po losowych torach). Wykres reakcji kandydata na operatora CCTV zarejestrowany podczas selekcji dla Urzędu Miejskiego w Zabrzu – czas 30 minut. Pokazuje wzrost i powrót do wysokiego poziomu skuteczności (75%) po spadku w 10 minucie testu. Czas reakcji nieznacznie spada z 1,5 do 2 sekund.

 

Rezygnacja z bogatej wiedzy o człowieku na rzecz kilku algorytmów?
W przeciwieństwie do kilku dostępnych algorytmów VCA dobry operator może wykryć sprawcę na podstawie wielu elementów:
– ubioru (kaptury-młodociani przestępcy, obszerne płaszcze-kieszonkowcy, ubiór niepasujący do innych osób),
– akcesoriów, które pomagają popełnić przestępstwo (narzędzia, torby),
– postawy (agresywna, ukrywanie się),
– sposobu, w jaki obserwują otoczenie (poszukiwanie celu, ukradkowe patrzenie na cel),
– sposobu poruszania się (pewny siebie, wpływ alkoholu lub narkotyków),
– sposobu zajmowania przestrzeni (zajmowanie dogodnej pozycji, zasłanianie celu),
– sposobu, w jaki odnosi się do innych osób lub jak inne osoby reagują na niego,
– komunikowania się z innymi sprawcami (gesty, umówione znaki),
– mimika,
– nienaturalne zachowanie (powstrzymywanie się od wyrażania emocji, nadmierna nerwowość),
– nagła zmiana zachowania (przyspieszenie, zwolnienie, szybki ruch ręką).
Dobry operator łatwo weryfikuje fałszywe alarmy i odróżniania sprawców od osób postronnych. Rzut oka pozwala stwierdzić, czy pasażer jest zniecierpliwiony długim czekaniem na autobus, czy jest agresywny względem innych osób na przystanku.
Dobry operator potrafi wykryć zdarzenie, nawet jeżeli nie go zauważył w polu widzenia kamery – na podstawie zachowania świadków lub nienaturalnego zachowania sprawcy.
Dobry operator przewiduje zagrożenia. Nauczyciel łatwo zauważa ucznia, który ściąga, bo zachowuje się inaczej niż reszta klasy (uczniom wydaje się, że zachowują się naturalnie). Tak samo pojawienie się grupy pijanych, agresywnych osób w polu widzenia kamery zwróci uwagę dobrego operatora, bo będą się „wyróżniać w tłumie”. Zanim dojdzie do niebezpiecznego zdarzenia, operator może powiadomić policję.
VCA wymaga spełniania określonego warunku. Jeżeli zagrożenia są bardziej złożone niż przechodzenie przez płot, to automat może nie wykryć zdarzenia. Przykładowo, zrobienie prymitywnego graffiti zajmuje 1–2 sekundy (prosty znak – dwa maźnięcia sprejem). Jeżeli system wykrywa osoby stojące przez minimum 5 sekund, to grafficiarz nie zostanie wykryty, mimo że zniszczy kilka elewacji, drzwi, szyb.

Miasto a przestrzeń zamknięta
Trudno jest znaleźć zastosowanie VCA do obserwacji w czasie rzeczywistym w przestrzeni miasta. Wyjątkiem może być rozpoznawanie twarzy. Wiele scenariuszy ludzkich zachowań powoduje, że rozsądne ustawienie algorytmów wydaje się niemożliwe.
W przestrzeni zamkniętej stosowanie VCA do obserwacji w czasie rzeczywistym wydaje się prostsze, bo występują charakterystyczne dla miejsca typy zdarzeń i jest ich mniej. Na zamkniętym parkingu można spodziewać się, że osoby wysiądą z samochodu, kierowca zamknie go i udadzą się w stronę wyjścia. Po pewnym czasie wrócą, kierowca otworzy auto – co zajmuje 2–3 sekundy – ewentualnie zapakują zakupy. Każde inne zachowanie wiąże się z chodzeniem po parkingu bez celu (wałęsanie się) lub pozostawaniem przez dłuższy czas w jednym miejscu. Operator jest konieczny do weryfikacji fałszywych alarmów – mąż może palić papierosa, czekając na żonę na parkingu.

Kosztowna i nieefektywna obserwacja

Przedstawiciel IMS Research twierdzi, że w średnich i dużych systemach obserwacja dużej liczby obrazów jest „kosztowna i nieefektywna z powodu niedostatecznej uwagi operatora lub zaburzeń percepcji”. U zdrowych ludzi nie dochodzi do zaburzeń percepcji, które utrudniałyby prowadzenie obserwacji. Niedostateczna uwaga operatora najczęściej wynika z  nadmiernej liczby kamer i złej konfiguracji monitorów.
Moim zdaniem w dużych systemach, w instalacjach krytycznych – lotniskach, portach, fabrykach – zatrudnianie operatorów jest najbardziej uzasadnione i nie oznacza to, że należy zapewnić obsadę proporcjonalną do liczby kamer w systemie.  Należy określić kluczowe obszary nadzorowane przez ludzi – kluczowe kamery, co nie będzie generowało nadmiernych kosztów.
Wszędzie tam, gdzie można stosować procedury, wykrywanie zdarzeń przez człowieka jest dużo prostsze niż w zmiennym środowisku miasta. Jeżeli ustalamy procedurę, że kierowca podczas załadunku przebywa w szoferce, to naruszenie tej zasady łatwo zauważyć. Dla rampy załadunkowej, gdzie pracuje wiele osób, trudno stworzyć tak specyficzny algorytm.
Jednocześnie wiemy, że sprawcy próbują obchodzić zabezpieczenia, co pokazują kolejne, nowe techniki popełniania przestępstw. Wyłącznie człowiek – operator jest zdolny do zmiany sposobu myślenia  w odpowiedzi na bieżącą sytuację i do wykrywania zagrożeń na podstawie różnych, niezależnych wskazówek.

Podsumowanie
Uważam, że VCA wykorzystywana do obserwacji w czasie rzeczywistym, szczególnie tam, gdzie dochodzi do dynamicznych zdarzeń z udziałem ludzi, ma ograniczone możliwości. Nowe algorytmy – wykrywanie bójek, ciągle pozostają daleko w tyle za możliwościami operatorów, którzy mogą szybciej wykrywać osoby niebezpieczne,  zanim jeszcze padnie pierwszy cios. Zastosowanie VCA wymaga, jak każdego środka bezpieczeństwa, diagnozy potencjalnych zysków i problemów w odniesieniu do danego obszaru.

Pytanie: „Czy operatorzy, czy VCA?” do obserwacji w czasie rzeczywistym to pułapka. Rezygnacja z ludzi nakręca spiralę – setki kamer, jak najwięcej megapikseli – duże koszty, małe możliwości skutecznej reakcji. Negatywnym przykładem są tu projekty rozporządzeń dla stadionów EURO 2012.

 
POLECAMY!

Bezpłatnie

Polish (Poland)

Ta strona używa plików cookies. Korzystając ze strony wyrażasz zgodę na używanie cookies, zgodnie z aktualnymi ustawieniami przeglądarki. Wiecej informacji o cookies i sposobach ich usuniecia mozna znalezc w naszej polityce prywatnosci.

Akceptuje cookies z tej strony.