Technologia 3D – czy w tym kierunku podąża rozwój telewizji dozorowej?

Andrzej Popielski

 

Skorzystaliśmy z zaproszenia katowickiej firmy Noma 2, żeby obejrzeć system CCTV z aplikacją nowej generacji, bodaj pierwszą w Polsce wykorzystującą trójwymiarową wizualizację 3D. System działa od końca sierpnia ub.r. w katowickim Spodku, hali widowiskowo-sportowej mogącej pomieścić ponad 11 tys. widzów. Jest ciekawy i pewnie nie pozostanie tylko ciekawostką, bo ma kilka cech niebanalnych, np. istotnych z punktu widzenia trwającej obecnie dyskusji nad monitoringiem imprez masowych. Ten system spełnia jego prawne wymogi. Ale gdy jest w tej dyskusji mowa o większej lub mniejszej liczbie kamer, ścianach monitorów obserwowanych przez wielu operatorów (często zresztą z powodu kosztów okrawa się liczebność obsługi ponad rozsądną miarę), to w centrum monitoringu wielkiego Spodka obsługującego przecież imprezy masowe widziałem... tylko dwa monitory i jednego operatora. To jest jakby inna filozofia działania telewizyjnego systemu dozoru. Jego siłą i istotą nie są takie czy inne kamery analogowe lub megapikselowe – choć to oczywiście oczy systemu – ale oprogramowanie zarządzające.

Obserwowałem sprawność telewizyjnego śledzenia w systemie zainstalowanym – także dla celów demonstracji – w biurowcu. Obraz na monitorze podążał po schodach za kimś. Wyglądało to zupełnie inaczej niż przy tradycyjnych systemach – podobnie do gier komputerowych w tzw. rzeczywistości wirtualnej. Przechodzenie od kamery do kamery i skręty pól widzenia odbywały się prawie tak naturalnie, jakby to człowiek wodził wzrokiem (obracał głową). Obraz spływał z piętra na piętro, przemieszczał się pomiędzy widokami kamer, przenikał bariery. Widziałem przestrzeń klatki schodowej, prawie bez miejsc niewidocznych.

Nasz tekst nie jest reklamowy – mówimy w nim wyłącznie o technicznej stronie systemu Praetorian zastosowanego w katowickim Spodku. To rozwiązanie informatyczne produkuje amerykański koncern L3 Communication, w Polsce rozprowadza je Noma 2. Geneza systemu wywodzi się z potrzeb armii amerykańskiej. Pierwszy raz zastosowano tę technologię podczas niedawnej wojny na Bałkanach. Amerykanie mieli tam problemy z orientacją w nieznanym i trudnym terenie. Wykorzystali więc samoloty bezzałogowe wyposażone w kamery. Obraz z nich był transmitowany w czasie rzeczywistym do centrum dowodzenia. Nakładano go na wykonany na cyfrowej mapie model przestrzenny terenu (3D). Tak otrzymywano wizualną informację z danej chwili w odzwierciedleniu wyglądu rzeczywistego środowiska. To rozwiązanie zostało stosunkowo niedawno „zwolnione” z wojska. Praetorian w Spodku ma być pierwszym zastosowaniem cywilnym w Europie. System może być wykorzystywany poza celami dozorowymi w najróżniejszych obiektach i terenach, także m.in. w zastosowaniach niekonwencjonalnych (np. w sporcie czy do szkolenia komandosów – do analizy zachowań zawodników i żołnierzy).

 

Hala główna z widokiem na strop techniczny

Kamery w Spodku

Spodek kojarzy się z Katowicami, a Katowice ze Spodkiem. Obiekt ma niestarzejącą się, nietuzinkową architekturę. Zarządzany przez MOSiR, jest własnością miasta. W tej uniwersalnej hali działającej od 1971 r. odbywały się m.in. koncerty gwiazd muzyki i wielkie turnieje sportowe. Nieodnawiany Spodek wyeksploatował się mocno. Zaplanowane na wrzesień 2009 r. Mistrzostwa Europy w koszykówce mężczyzn przyspieszyły remont. W tym jego etapie – bo to nie koniec – wydano prawie 70 mln zł. Zwiększono pojemność sali o 1700 miejsc (do ponad 11 tysięcy). Wykonano oświetlenie przystosowane do wymogów telewizji cyfrowej. Pod kopułą hali zamontowano podnoszony i opuszczany na dowolną wysokość wielki diodowy ekran w kształcie walca. Założono infrastrukturę bezprzewodowego Internetu. Było to ponad 20 zadań. W jednym zadaniu wykonanym przez konsorcjum firm: Carboautomatyki i Kabe, przy udziale Noma 2 wyposażono kompleks Spodka w dźwiękowy system ostrzegawczy i system sygnalizacji pożarowej; także nowatorski system monitoringu wizyjnego wraz z otoczeniem transmisyjnym.

Zdań kilka o samej infrastrukturze systemu w Spodku. Jak powiedział mi Marian Kurzal, wiceprezes Zarządu Noma 2 – budowano go bardzo szybko, sceptycy byli zaskoczeni tym tempem – kamery, mikrofony i okablowanie (ok. 1 km światłowodów, 16 km kabli zasilających i sterowniczych) instalowano 6 tygodni. Opracowanie modelu 3D trwało dwa miesiące, tworzyło go dwóch inżynierów. Prace wdrożeniowe i pełne uruchomienie systemu Praetorian zajęły 5 osobom 4 tygodnie.

W obiektach Spodka zainstalowano na razie ponad 80 kamer, z tego kilkanaście obrotowych (Pelco Spectra i Esprit) i ok. 70 stacjonarnych. Poza jedną kamerą megapikselową (1280–1024 pix, 25 kl./s) wszystkie inne są analogowe. W hali głównej jest w tej chwili 7 kamer obrotowych PTZ (4 na ścianach bocznych i 3 na stropie technicznym – jest to wielki pierścień pod sufitem). Dziesięć kamer stałych na stropie technicznym tworzy tzw. tło – widok na całość hali, na wszystkie sektory i główną scenę – boisko. Kamery PTZ są używane do zbliżeń (tzw. lupa). Są także doświetlacze podczerwieni, poprawiające widoczność podczas imprez, gdy zgaszone jest górne oświetlenie. Centralne stanowisko monitoringu znajduje się w hali głównej Spodka na wysokości górnego obejścia (nad widzami duża budka, tzw. jaskółka). Jest tam stanowisko robocze CCTV oraz stanowisko robocze BMS z wizualizacją alarmów zbiorczych z systemów bezpieczeństwa: SAP, DSO i CCTV. W zależności od rodzaju i wielkości imprezy operatorowi monitoringu wizyjnego z MOSiR mogą towarzyszyć policjanci albo strażnicy miejscy.

 

Centrum monitoringu

Ponadto w pomieszczeniu ochrony fizycznej Spodka zainstalowano stanowisko do podglądu obrazu z kamer i system wizualizacji alarmów z sieci central sygnalizacji pożarowej. Dodatkowe stanowisko do podglądu obrazu z kamer w widoku trójwymiarowym ma także policja w komisariacie w Spodku. Wtrąćmy ciekawostkę – podczas Eurobasketu przekierowano transmisję sieci komputerowej poprzez łącza radiowe do policyjnego wozu technicznego stojącego na katowickim rondzie. Tam policjanci oglądali obraz trójwymiarowy. Zwykle przy takich studiach przypadku pytamy o trudności i wyzwania instalacyjne, Marian Sikorski, dyrektor techniczny firmy Noma 2, powiedział mi np., że konstrukcja dachu w Spodku jest linowa, niesztywna, trzymana na słupach. Nie wolno jej naruszać, poprowadzenie nawet kawałka instalacji wymaga uzgodnień. Podobnie jest z całym kołnierzem otaczającym antresolę. Tam też jest beton wzamacniany linami stalowymi – każdy otwór musiał być konsultowany, a w pewnych przestrzeniach nie wolno było robić w ogóle, musiały być obejścia. Spodek jako obiekt stary nie posiada już pełnej dokumentacji budowlanej. Zdarzało się trafiać na nieewidencjonowane pomieszczenia albo kanały kablowe. Spodek nie był łatwym zadaniem instalacyjnym, ale też doświadczone ekipy traktowały go jak zadanie rutynowe. Dojście skądkolwiek do czujki, kamery, głośnika było tylko pewnym problemem technicznym – do pokonania.

 

Stanowisko operatorskie w centrum monitoringu. Na monitorach:
lewym – okno aplikacji Praetorian HAWK. Mapa synoptyczna
z lokalizacją kamer 2D, lista alarmów, konwencjonalne
podglądy obrazów z kamer
prawym – ekran aplikacji Video Flashlight (3D)

Skuteczność 3D

W centrum monitoringu wizyjnego Spodka nie zobaczymy tak charakterystycznego widoku ekranów (monitorów) w podziałach na 4–16 kamer. Są zresztą tylko dwa monitory. Na jednym (40-calowym) obraz z kamer jest wyświetlany w środowisku przestrzennym – nałożony na cyfrowy model 3D. Moduł wyspecjalizowany skleja wiele obrazów z kamer w obraz trójwymiarowy oglądany na jednym ekranie (Video Flashlight).

To pozwala na lepszą ocenę zagrożeń i skupienie się na istocie sprawy. Użytkownik może natychmiast odtworzyć nagrania widziane z różnej perspektywy, co ma duże znaczenie w dostarczaniu materiału do celów procesowych. Operator wykonuje wirtualny obchód (patrol) chronionych obszarów. Porusza się na zewnątrz lub do wewnątrz, zza rogów, z dachu na poziom ziemi... Gdy kamera zobaczy np. tył głowy osoby – a w jej rejonie jest większa liczba kamer – można spojrzeć na postać z boku, a nawet ją odwrócić i zobaczyć twarz!

 

Widok z kamery wkomponowany w model 3D Spodka.
Antresola, obraz z pojedynczej kamery pośrodku
i częściowe widoki z 4 kamer w głębi
Antresola, widok z kamery podczas imprezy sportowej

Obraz złożony z zainstalowanych koło siebie kamer z obiektywami o normalnych ogniskowych daje widok szerokokątny albo panoramiczny. Można się płynnie przemieszczać, nie tracąc usytuowania kątów. Gdyby zastosować do tego kamery PTZ, pewne fragmenty przestrzeni nie byłyby widoczne. Gdy używamy jednak kamery PTZ w modelu trójwymiarowym, jej obracanie powoduje obracanie całego modelu 3D.

Drugi ekran w centrum monitoringu zawiera treści modułu obsługi (Hawk). Są na nim wyświetlane informacje o alarmach pochodzących zarówno z systemu CCTV, jak i z czujników zewnętrznych systemów zintegrowanych. Jest tu możliwość wyświetlania widoków obiektu w płaskim modelu (2D) według funkcjonalnego podziału, np. na piętra, sektory, a w innych zastosowaniach np. terminale, budynki... Stąd także można bezpośrednio zarządzać systemem 3D. W Spodku są antresole – Bartosz Buk z firmy Noma 2 demonstruje działanie stanowiska operatorskiego w centrum monitoringu. – To jest ciąg dokładnie takich samych klatek schodowych, co orientacji nie ułatwia. Jednak w tym systemie przemieszczanie się pomiędzy obrazami z kamer sprawia, że człowiek ma pomysł, świadomość, gdzie jest i jak te kamery względem siebie się sytuują. Przez model można przechodzić właściwie w trybie dowolnym, choćby przez ściany. Ale to czasem mogłoby utrudnić operatorowi pracę, a nie ułatwić. Zdefiniowana ścieżka przemieszczania się może być wygodniejsza. Nie trzeba zresztą obarczać użytkownika wiedzą o numerach kamer w danym miejscu. Nauka jest krótka, a obsługa prawie intuicyjna. Jeśli np. coś dzieje się na III piętrze, to operator szybko tam zajrzy za pomocą klawiatury lub myszki. Chce wejść do góry lub w dół, naciska kursor w górę lub w dół. Może bardzo szybko się przemieszczać po całym obiekcie bez konieczności przełączania pomiędzy kamerami, wpisywania przez klawiaturę, zatwierdzania decyzji itd. W module obsługi zawarto też funkcjonalności z telewizji konwencjonalnej: listę kamer w systemie, wyświetlanie obrazów 2D w miniaturkach i w powiększeniu (użytkownik nie musi za każdym razem blokować modelu przestrzennego). Jest także możliwość prostego zarządzania materiałami archiwalnymi.

Rejestracja i archiwizacja

Ze względu na korzystanie z modelu 3D rejestracja podczas imprez odbywa się w trybie ciągłym ze wszystkich kamer. Można ją realizować z parametrami umożliwiającymi spełnienie przepisów o organizacji imprez masowych, czyli 25 kl./s z każdej kamery (przyp. red. – to wymogi obowiązującego rozporządzenia, w projekcie jego nowelizacji proponowane jest zmniejszenie częstotliwości). Dochodzi do tego rejestracja dźwięku także z parametrami zgodnymi z przepisami. Operator ma tzw. ścieżkę ruchu, na której w jednym pliku może zapisać obrazy, które potem można udostępnić np. policji. W detekcji automatycznej pożyteczną funkcjonalnością jest możliwość zdefiniowania czasu pre- i postalarmu, który będzie dodatkowo dołożony do nagrania zdarzenia. W Spodku do archiwizacji obrazu i dźwięku zastosowano cztery serwery z macierzami dyskowymi o sumarycznej pojemności 40 TB. Platforma sprzętowa podsystemu archiwizacji bazuje na produktach firmy Cisco zarządzanych przez system operacyjny Linuks.

System – usłyszałem od projektanta Janusza Kamuseli z firmy Noma 2 – nie wymaga tzw. topowych rozwiązań, serwery są ze standardowej półki. Jedynie komputer wyświetlający model 3D musi być wyposażony w dobrą kartę grafiki (...).

(...) „Pamięciożerność” archiwizacji nie różni się od konwencjonalnego systemu archiwizowania, w którym, jeśli chcemy nagrywać np. obraz ze 100 kamer przez 30 dni, to wymaga to wielu TB. Tak samo dużej pamięci wymaga omawiany system. Zapisuje obraz np. ze 100 kamer, który jest następnie za pomocą oprogramowania składany, zlepiany w obraz na modelu 3D i prezentowany. Przechowywany jest natomiast jako 100 oddzielnych strumieni ze 100 kamer, a potrzebna pojemność pamięci oczywiście zależy od rodzaju kompresji (np. w MPEG-4 jedna kamera przy 25 kl./s generuje przesył danych w granicach 2,5 Mb/s).

Interesująca jest metoda dostępu do materiałów archiwalnych – mówi Grzegorz Tkocz, kierownik Pracowni Projektowej w Noma 2. – W typowych systemach musimy cofać się w materiałach archiwalnych pojedynczo lub grupami kilku kamer. W systemie Praetorian właściwie wystarczy znać tylko czas, a cofanie następuje całym trójwymiarowym środowiskiem. Przemieszczamy się do odpowiedniej szczeliny czasowej i w tym momencie wszystkie strumienie z kamer – a w Spodku jest ich ponad 80 – są zawracane do właściwego miejsca. Można zobaczyć sytuację o tej godzinie w całym modelu (obiekcie), zrobić stopklatkę w punkcie „zapalnym” i przemieścić się płynnie do obrazu innych kamer, które rejestrowały teren, żeby przeanalizować sytuację kompleksowo. Bywa bowiem tak, że incydenty (zbicie szyby, bójka...) są reżyserowane jako zdarzenia odwracające uwagę, a właściwa akcja dzieje się gdzie indziej.

Synchronizacja audio i wideo

W obiekcie zamontowano 32 mikrofony, z tego 20 w hali głównej. Nie wszystkie są przypisane do poszczególnych kamer, jest ich przecież więcej. Materiał archiwalny z mikrofonów nagrywany jest równolegle z materiałem wideo, a ponieważ obydwa rodzaje nagrań mają oznakowania czasowe, użytkownik przy oglądaniu obrazu z kamery może wybrać, które sygnały dźwiękowe chce odsłuchać. Nie ma zresztą takiej możliwości, zwłaszcza przy kamerach PTZ oraz innych w hali głównej, żeby np. dokładnie zsynchronizować dźwięk z konkretnego mikrofonu z obrazem kamery obserwujących pojedynczego człowieka w wielotysięcznym tłumie. Trzeba by w wysublimowany sposób zastosować mikrofon kierunkowy, ale przy poziomie tła, jaki występuje podczas imprezy, użyteczność uzyskanego efektu byłaby co najmniej dyskusyjna.

Wewnątrz Spodka każda osoba znajduje się polu widzenia dwóch kamer obrotowych. Przy wejściach umieszczonych jest 16 kamer – 4 kamery na każde z 4 wejść – i widoczność z nich wynosi 120% osoby znajdującej się w kadrze. System w Spodku spełnia wymogi prawne dla imprez masowych, nawet – jak mówi Grzegorz Tkocz – z naddatkiem. Ten nadmiar to łatwość nadążania „na żywo” i w materiałach archiwalnych za obserwowanymi osobami na modelu 3D, gdyby wynikła konieczność prześledzenia przemieszczania się osoby po obiekcie, także w głównym ciągu komunikacyjnym obiektu, gdzie odbywa się tzw. ruch techniczny i gdzie podczas imprezy wchodzą zawodnicy lub wykonawcy.

 

Wejście do obiektu, widok z 4 kamer naniesiony na model 3D Obserwacja wejścia podczas imprezy – zbliżenie na jedną z kamer

Detekcje i integracja

W tradycyjnych telewizyjnych systemach dozorowych podgląd sytuacji odbywa się na kilku lub wielu monitorach. Zauważenie zagrożeń zależy od spostrzegawczości operatorów bądź zastosowanych narzędzi detekcji. Ostatnio obserwujemy zjawisko znacznego przyrostu liczby kamer i czujników w stosowanych systemach. Dają one coraz więcej danych, ale niekoniecznie tych potrzebnych. Często jest to szum informacyjny, utrudniający wydzielenie istoty problemu. Dlatego tak rośnie znaczenie „inteligentnej” analizy. W systemie jest moduł (Vision Alert) odpowiedzialny za analizę treści obrazu (strumieni wizji) z maks. 16 kamer. W Spodku, w którym kamer jest ponad 80, zastosowano tylko 2 takie moduły. Ale – jak usłyszałem – nigdy nie ma potrzeby analizy wszystkich strumieni, wystarczy 20–30%.

System oczywiście wykrywa ruch. Jest możliwość zdefiniowania jego kierunku, zwrotu, wielkości obiektu, objęcia wszystkiego alarmami czasowymi (np. po 22.00 można wyjść z budynku, ale wejść nie można). Jest w stanie rozpoznawać zdarzenia typu włóczęgostwo (kręcenie się bez celu), zdarzenia typu pozostawiony – skradziony obiekt (np. mamy jakąś gablotę, którą chcemy chronić, chcemy zauważyć zmianę miejsca położenia bądź zniknięcie eksponatu). Gdzie indziej można to kryterium wykorzystywać (modne tematy) np. do chronienia bankomatów przed nakładaniem dodatkowych czytników lub ochrony zabytków przed „graficiarzami”. System potrafi, czego wiele innych nie potrafi, obsługiwać wiele alarmów na jednej kamerze, np. wykrywa ruch, zniknięcie przedmiotu, zostawienie czegoś – jednocześnie.

Obszar strefy chronionej operator zaznacza, rysując jakiś wielokąt na obrazie pokazywanym przez kamerę. Po zdefiniowaniu wszystkich kategorii detekcji i różnych kryteriów określonych przez użytkownika możliwe jest – po analizie potrzeb i ocenie stopnia ryzyka – np. wprowadzenie ochrony nienadzorowanej. System ma otwartą architekturę. Nie ma większych problemów, żeby zintegrować z nim prawie wszystkie systemy (o ile producent udostępni protokoły). Tak jak np. w Spodku można sprząc kamery z systemem sygnalizacji pożarowej. Zanim dotrze w te miejsca człowiek, obraz pomoże w pierwszej weryfikacji sytuacji. Do spływających alarmów można podłączyć scenariusz proceduralny, pracownik dostanie gotową podpowiedź postępowania. Ponadto wszystkie działania użytkownika z centrum monitoringu są rejestrowane w bazie danych.

 

Panorama katowickiego Spodka

O projektowaniu

Często bywa tak, że projektant nie umie sobie wyobrazić, co będzie widziała kamera przesunięta np. o metr w tę lub inną stronę. System ma narzędzie ułatwiające projektowanie. Jeśli jest zarys modelu 3D wykonany w postaci cyfrowej, to można pokazać trójwymiarowy obraz tak jak go widzą kamery w zaproponowanym ustawieniu. Może tak być, że projektant zaprojektował w danym miejscu sześć kamer, a potrzeba siedem albo wystarczą cztery.

Jak wygląda sprawa stworzenia modelu 3D? Obiekt Spodka był modelem trudnym do zwizualizowania, to przecież eliptyczny kształt i wielka złożona konstrukcja. A tak ogólnie – mówiąc o wszelkich innych obiektach – modelowanie jest zajęciem dość pracochłonnym, ale tylko jednorazowo. Wykorzystuje się do tego dokumentację techniczną, zdjęcia, fotografie lotnicze lub satelitarne obiektów, które mają być obserwowane. Jak wyjaśnił Janusz Kamusela, obecnie prawie każdy nowy obiekt posiada dokumentację w postaci elektronicznej. Nierzadko zawiera ona już jakiś model (lub fragment) 3D, bo na etapie realizowania inwestycji wykonano wizualizację lub prezentację. Takie materiały można wykorzystać. W zależności od tego, co użytkownika interesuje, nie wszystko trzeba przedstawiać w detalach, czasem mniej istotne otoczenie wystarczy zamarkować. W starych budynkach, w których brak jest dokumentacji technicznej, można wykonać odzwierciedlenie nawet z płaskich rzutów, potem „wyciągnąć komputerowo” bryłę do góry. Na przykład biurowiec firmy Noma 2 obfotografowano m.in. aparatem z poziomicą z innego budynku, zdjęcie naciągnięto na bryłę modelu itd.

 

Model 3D Spodka z naniesionymi obrazami z kamer

Uwagi końcowe

Jak duży może być taki system telewizyjny? Usłyszałem, że liczba kamer jest ograniczona tylko zdrowym rozsądkiem, przy założeniu dbania o właściwą przepływność w sieci. System, podobnie jak inne zaawansowane rozwiązania CCTV, tani nie jest, ale potem są niższe koszty eksploatacji i oszczędności wynikające ze zmniejszonej liczby personelu.

Jasne też, że nawet tzw. inteligentna analiza nie zawsze jest panaceum. Są sytuacje, których zdefiniować alarmowo się nie da, a możliwości jednego operatora, nawet z takim sprawnym narzędziem, też nie należy przeceniać, jeśli nie ma on wsparcia sygnałami o wydarzeniach podczas współpracy z różnymi służbami. Jednak – takie odniosłem wrażenie – ten system to duży krok naprzód dla zwiększenia skuteczności działania.

Czy w tym kierunku podąża rozwój telewizji dozorowej?

Foto: Andrzej Popielski i Noma 2

 
POLECAMY!

Bezpłatnie

Polish (Poland)

Ta strona używa plików cookies. Korzystając ze strony wyrażasz zgodę na używanie cookies, zgodnie z aktualnymi ustawieniami przeglądarki. Wiecej informacji o cookies i sposobach ich usuniecia mozna znalezc w naszej polityce prywatnosci.

Akceptuje cookies z tej strony.