Sistemi di Video Sorveglianza Intelligente
Negli anni recenti, sempre più attenzione viene rivolta ai problemi della sicurezza e del controllo su persone o cose negli ambiti più svariati: controllo della sicurezza in stazioni o aeroporti, controllo del traffico su strade di rilevante importanza, gestione dei trasporti di persone e merci per assicurare un elevato livello di affidabilità e sicurezza, etc. Le problematiche di sicurezza e controllo, in ambienti di lavoro o sociali in generale, sono state affrontate fino all’ultima decade, con tecnologia basata su sensori meccanici, ottici, o elettronici. I vantaggi dell’introduzione delle tecnologie basate sull’analisi video (quindi sulla elaborazione di immagini) ha completamente stravolto il modo di pensare di coloro che si occupano di sicurezza e controllo. Oggi infatti, il raggiungimento degli obiettivi sulla sicurezza e il controllo viene ottenuto, ormai quasi esclusivamente, attraverso il supporto di telecamere che rendono semplice e immediata l’osservazione, e l’eventuale registrazione, degli eventi che possono accadere in un determinato luogo sotto osservazione. In anni meno recenti questo controllo delle telecamere veniva fatto da opportuni operatori umani che avevano
il tedioso compito di osservare i monitor che proiettavano la scena da controllare e segnalare eventi rilevanti. Con l’aumentare delle installazioni di telecamere nei più svariati luoghi (stazioni, aeroporti, piazze, strade, etc.) è sempre più necessario progettare sistemi automatici in grado di supportare gli operatori nei compiti di controllo. Un generico sistema di questo tipo ha come obiettivo, avendo come input la scena osservata, quello di rilevare degli opportuni eventi, segnalarli, ed eventualmente registrarli.
Sono molte le applicazioni che fanno uso di sistemi di video sorveglianza.
Un primo possibile utilizzo è in stazione e aeroporti al fine del controllo delle persone in tali luoghi. Normalmente vengono poste delle telecamere sulle banchine delle stazioni o nelle aree di imbarco degli aeroporti per poter riconoscere eventuali comportamenti scorretti, o anomali delle persone presenti. In questo caso il sistema è composta da una o più telecamere che inviano le immagini di cosa succede sui luoghi osservati. Vi è poi un elaboratore che processa le immagini e segnala eventuali comportamenti scorretti (persone che entrano in aree interdette, etc.) o anomali (persone che lasciano bagagli incustoditi, aggressioni tra persone, etc.).
Un altro possibile utilizzo di un tale sistema di analisi video è per il monitoraggio del traffico attraverso telecamere poste su autostrade, strade di rilevante importanza, incroci, etc. In questo caso il sistema elabora le immagini proveniente dalla telecamera e fornisce informazioni sul traffico: flusso veicolare, tipologia di veicoli presenti in una determinata fascia oraria, etc.


Il sistema elabora la sequenza di frame che vengono forniti dalla telecamera posta su una determinata scena. L’elaborazione avviene in real-time ovvero su ogni frame del video il sistema esamina la scena e rileva gli eventi rilevanti per la applicazione.
Il sistema si compone di diverse fasi. Il suo funzionamento generale può essere descritto come segue. Date in input le immagini (frames) del video che si sta esaminando, attraverso opportune elaborazioni di image processing vengono riconosciuti le parti dell’immagine che sono in movimento rispetto alla scena fissa che è normalmente costituita dalle strutture architettoniche presenti sulla scena (object detection). Successivamente vengono calcolate le traiettorie di questi oggetti per tutto il tempo in cui questi ultimi sono presenti sulla scena (object tracking).
Attraverso lo studio delle traiettorie, e quindi lo studio dell’interazione tra gli oggetti presenti in un dato momento, è possibile giungere a modellare tutti i possibili eventi che si verificano nel video in esame (behavioral analysis).
Il gruppo si occupa principalmente delle fasi di object detection e object tracking. Le principali problematiche, molto sentite nella comunita scientifica, su cui opera il gruppo sono le seguenti:- detection in ambienti aperti (problematiche relative alle ombre, ai cambiamenti di luminosità, etc.)
- tracking in presenza di occlusioni
- tracking in scene affollateL’object detection in scene outdoor risulta un problema ancora aperto a causa delle difficoltà derivanti dalle condizioni di illuminazioni variabili (light of day, shadows) e dalla presenza di scene dinamiche e articolate (waving trees, camouflage).
Fig 2 – Problematiche dell’object detection
Per applicazioni di video sorveglianza intelligente l’approccio più utilizzato va sotto il nome di background subtraction e consiste nell’individuare l’insieme di pixel appartenenti agli oggetti confrontando i frame del video con un frame di riferimento (background) che rappresenta la scena priva di oggetti. In letteratura sono stati presentati differenti approcci i cui elementi distintivi erano o il tipo di rappresentazione del background (semplice o statistica) o la politica di aggiornamento dello stesso.
Fig 3 – Tecnica del Background Subtraction
Al fine di ottenere un sistema affidabile, ma allo stesso momento computazionalmente leggero, è stato utilizzato un algoritmo con rappresentazione del background semplice ma aiutato da una serie di algoritmi (basati su considerazioni euristiche) tali da correggere eventuali errori della detection.
E’ stato, inoltre, sviluppato un algoritmo innovativo per l’aggiornamento del frame di riferimento al fine di ridurre al minimo le problematiche dovute anche a repentini cambi di illuminazione.Passando alla fase di object tracking, uno dei problemi più sentiti nella letteratura scientifica è quello del calcolo delle traiettorie degli oggetti in movimenti in presenza di occlusioni. Due oggetti sono occlusi quando la proiezione dei due oggetti sul piano immagine risulta sovrapposta. In tali casi il problema è separare l’unica regione in movimento riconosciuta nella fase di detection nei suoi oggetti componenti (fig. 5).
Fig 4 – Il problema dell’occlusione
Il nostro approccio al problema è stato quello di rappresentare opportunamente gli oggetti quando essi si presentano singolarmente (modelli di apparenza, rappresentazione multirisoluzione, rappresentazione per livelli, etc.). Nel momento in cui vi è un occlusione è possibile separare l’unica regione in movimento nei suoi oggetti componenti attraverso il confronto delle parti della regione con le rappresentazioni dei singoli oggetti.In molti contesti legati alla video sorveglianza e al monitoraggio del traffico le scene risultano affollate per cui le condizioni di occlusioni tra oggetti di interesse risultano frequenti e complesse (fig. 2).
Fig 5 – Esempio di scena affollata
In questi casi gli algoritmi per la risoluzione delle occlusioni possono non risultare efficaci in quanto questi sono studiati per risolvere occlusioni isolate tra pochi oggetti. Il nostro approccio consiste nel cercare di riconoscere particolari features appartenenti alla scena o agli oggetti di interesse in modo tale che questi risultino più semplici da identificare e seguire rispetto agli oggetti di interesse stessi.
In letteratura esistono due approcci differenti per ciò che riguarda la scelta delle features queste possono essere:a) punti facili da seguire (per esempio ad elevato gradiente spaziale)b) regioni a colore uniforme
Fig 6 – Esempi di features
A partire dalle traiettorie delle features, con opportuni modelli matematici, si può ricostruire il comportamento (traiettorie) dei singoli oggetti presenti nella scena.Il gruppo di ricerca ha sviluppato un sistema intelligente di analisi video per applicazioni di video sorveglianza e di monitoraggio del traffico. Vengono, nei seguenti link, alcune demo con la descrizione delle stesse:- demo sulla fase di object detection – demo sulla fase di object tracking – demo sul sistema di monitoraggio del traffico Pubblicazioni esistenti sul filone di ricerca descrittoInternational Journals1) D. Conte, P. Foggia, J.M. Jolion, M. Vento, “A Graph-based, Multi-resolution Algorithm for Tracking Objects in Presence of Occlusions”, accepted to Pattern Recognition Journal – Special Issue on Graph Based Representation in Pattern Recognition, Jun. 2005. In press.2) D. Conte, P. Foggia, J.M. Jolion, M. Vento, “Occlusions Solving by a Graph-based, Multi-resolution Tracking Algorithm”, submitted to Computer Vision and Image Understanding Journal – Special Issue on Spatial Coherence in Visual Motion Analysis, Feb. 2005.3) D. Conte, P. Foggia, C. Guidobaldi, A. Limongiello, M. Vento, “Tracking Moving Objects in Low Frame Rate Videos by Ensembling Different Cost Functions”, submitted to International Journal of Pattern Analysis and Applications, Oct. 2004.International Conferences1) D. Conte, P. Foggia, J.M. Jolion, M. Vento, “Un algorithme multirésolution pour la gestion des occlusions basé sur les pyramides de graphes”, accepted to Dixième Edition de la conférence sur COmpression et REprésentation des Signaux Audiovisuel (CORESA 2005), 7-8 Novembre, Rennes, 2005.Chapters in internationals books1) D. Conte, P. Foggia, M. Petretta, F. Tufano, M. Vento, “Evaluation and Improvements of a Real-Time Background Subtraction Method”, Kamel, M.; Campilho A.; (Eds.): International Conference on Image Analysis and Recognition, Lecture Notes in Computer Science, Vol. 3656, Springer, Berlin, pp. 1234-1241, 2005.
2) D. Conte, P. Foggia, M. Petretta, F. Tufano, M. Vento, “Meeting the application requirements of intelligent video surveillance systems in moving object detection”, Singh, S.; Singh, M.; Apte, C.; Perner, P. (Eds.): International Conference on Advances in Pattern Recognition, Lecture Notes in Computer Science, Vol. 3687, Springer, Berlin, pp. 653-662, 2005.
3) D. Conte, P. Foggia, J. M. Jolion, M. Vento, “A Graph-based, Multi-resolution Algorithm for Tracking Objects in Presence of Occlusions”, L. Brun and M.Vento (Eds.): Proceedings of the 5th Workshop on Graph-based Representation in Pattern Recognition (GbRPR2005), Lecture Notes in Computer Science, vol. 3434, Springer-Verlag, Berlin, pp. 193-202, 2005.