Detección de somnolencia en secuencias de video utilizando redes neuronales convolucionales
Resumen
Día a día, nos enfrentamos a problemas de somnolencia, que son reflejados principalmente en accidentes de tránsito causados por conductores somnolientos. La somnolencia en un conductor ocurre cuando disminuyen progresivamente el nivel de concentración durante el manejo, y pierden capacidad de respuesta ante condiciones que exigen reacciones inmediatas, por lo que podría influir en la producción de accidentes de tránsito. La somnolencia puede ser clasificada en 3 enfoques: comportamiento, vehicular y fisiológico. Este último es intrusivo, ya que se utiliza encefalogramas (EEG) y electrocardiogramas (ECG). Mientras tanto el de comportamiento y vehicular, no son intrusivos, porque dependen de análisis de video o sensores. Este trabajo de investigación propone el desarrollo de un sistema de detección de somnolencia en los conductores que permita alertar sobre su estado mientras esté conduciendo mediante el uso de técnicas de deep learning. Se utilizará dos bases de datos, una privada, generada en ambientes reales (SISO_VID) y una pública generada en ambientes simulados (NTHU). Esta tesis busca realizar una comparación entre las redes convolucionales: InceptionV3, VGG16 y ResNet50; para ver cuál es la que mejor que se adapta a las bases de datos propuestas, asimismo, tendremos 2 estados como resultados: Somnoliento y No Somnoliento. Además, en la presente tesis se utilizará las siguientes métricas de rendimiento: matriz de confusión, accuracy y puntuación f1; estas métricas nos ayudará a evaluar la eficacia de las 3 redes neuronales convolucionales ya mencionadas. Finalmente, de acuerdo a los resultados generalizados en la mayoría de los escenarios, la red neuronal convolucional InceptionV3 detecta mejor la somnolencia que VGG16 y ResNet50.
Palabras claves: Somnolencia, conductores, transporte interprovincial, detección de somnolencia, visión artificial, redes neuronales.