Sistema de detección temprana de eventos delictivos en entidades comerciales con visión artificial y deep learning

No Thumbnail Available

Date

2025-02

Journal Title

Journal ISSN

Volume Title

Publisher

Universidad Técnica de Ambato. Facultad de Ingeniería en Sistemas, Electrónica e Industrial. Carrera de Telecomunicaciones

Abstract

Presently, video surveillance systems in commercial entities depend considerably on human monitoring, which results in increased costs for these entities. Consequently, a system for early detection of criminal events using computer vision and deep learning has been proposed. This system employs two complementary processing methods: the first utilizes YOLOv8 for suspicious object detection, and the second employs an SVM algorithm that classifies key points extracted with MediaPipe for threat posture detection. The system operates on an Nvidia Jetson Nano module, which processes videos in real time and displays them in an information management system developed with Flask. It also stores detections in a SQLite database, which continuously feeds into a newly automatically tagged dataset for future model updates, and is capable of displaying historical records of detections. The system's efficacy was evaluated across three key aspects: detection of suspicious objects, with an f1-score of 87.5%; detection of threatening postures, with 74%; and early detection, with 78%.The study's findings underscore the significance of processing complementary parts, facilitating the establishment of a more comprehensive contextual understanding of the scene. The quality and breadth of the training dataset are foundational for the success or failure of computer vision and machine learning models, particularly in the context of object detection, where a diverse array of images of varying sizes, shapes, and perspectives of the object to be detected is essential for the model to generalize correctly. In the case of body postures, support vector machine (SVM) models demonstrate efficacy, though they are constrained in their ability to establish spatio-temporal contexts.

Description

En la actualidad, los sistemas de videovigilancia de una entidad comercial dependen en gran medida de la monitorización humana, lo que eleva los gastos asumidos por la entidad para este fin. Por ello, se ha propuesto un sistema de detección temprana de eventos delictivos con visión artificial y Deep learning, que realiza dos formas de procesamiento complementarias. La primera parte utiliza YOLOv8 para detección objetos sospechosos y la segunda un algoritmo SVM que clasifica los puntos clave extraídos con MediaPipe para la detección posturas amenazantes. El sistema se ejecuta en un módulo Nvidia Jetson Nano, que procesa vídeos en tiempo real y los muestra en un sistema gestor de información desarrollado con Flask. También guarda las detecciones en una base de datos SQLite, las cuales alimentan de forma continua a un conjunto de datos nuevo etiquetado automáticamente para futuras actualizaciones del modelo, además es capaz de mostrar registros históricos de las detecciones. El sistema se evaluó en tres aspectos: detección de objetos sospechosos, con un f1-score del 87,5%; detección de posturas amenazantes, con un 74%; y detección temprana, con un 78%. Finalmente, se evidencia la importancia del procesamiento de partes complementarias, permitiendo establecer un mejor contexto de la escena. Por otro lado, la calidad y extensión del conjunto de datos de entrenamiento son cruciales para el éxito o fracaso de los modelos de visión artificial y machine learning en general, especialmente en la tarea de detección de objetos, donde se necesitan la mayor cantidad posible de imágenes de diferentes tamaños, formas y perspectivas del objeto a detectar para que el modelo generalice correctamente. En el caso de las posturas corporales, los modelos SVM funcionan bien, aunque tienen la limitación de establecer contextos espacio-temporales.

Keywords

SISTEMAS DE VIDEOVIGILANCIA, EVENTOS DELICTIVOS, VISIÓN ARTIFICIAL, DETECCIÓN DE POSTURAS, DETECCIÓN DE OBJETOS

Citation

Endorsement

Review

Supplemented By

Referenced By