DeepScan4Failure: Detección de comportamiento anómalo en impresoras HP utilizando técnicas de Deep Learning

Descripción del proyecto y objetivo a conseguir

La detección de anomalías es el problema de identificar observaciones “raras” que son cualitativamente diferentes a la mayoría de los datos disponibles. Algunos ejemplos comunes de este tipo de observaciones singulares son los fraudes bancarios, las intrusiones en redes de computadores, los defectos en fabricación a gran escala, etc. Uno de los desafíos para desarrollar métodos efectivos para detectar anomalías es la baja disponibilidad de datos etiquetados, lo que requiere conocimiento detallado de expertos en el dominio en concreto y anotaciones manuales que tienen un alto coste. Las técnicas de Deep Learning deben de ser, en principio, capaces de extraer patrones anómalos a partir de una cantidad grande de datos no etiquetados.

Se propone el desarrollo de un modelo de machine learning para detectar comportamiento anómalo en las impresoras HP a partir de la inspección de archivos de log, que contienen información copiosa sobre una variedad de sensores y otras comprobaciones internas realizadas por software. Una detección rápida de este tipo de comportamiento anómalo puede permitir llevar a cabo arreglos o mantenimientos antes de que la impresora se estropee completamente, o habilitar periodos de mantenimiento de la máquina más cortos.

Para este Trabajo Fin de Grado, HP SCDS proporcionará un dataset sintético, generado para simular el comportamiento estándar de impresoras reales, así como también el comportamiento anómalo causado por los problemas más comunes. La solución propuesta debe aprovechar técnicas de Deep Learning como los autoencoders (variacionales, VAEs). El dataset sintético estará completamente etiquetado, habilitando la validación rigurosa del rendimiento del modelo propuesto. No obstante, la aproximación a desarrollar debe de ser completamente no supervisada para ser utilizada sobre datos reales. Una posible extensión del TFG podría ser el aprendizaje semi-supervisado para sacar partido a la disponibilidad de datos parcialmente etiquetados.

Funciones a realizar

Investigar las tecnologías que se usarán.
Desarrollar el análisis, diseño, implementación, pruebas y puesta en funcionamiento de la aplicación.

Tecnologías a utilizar

Python
PyTorch
TensorFlow

Palabras clave

Deep Learning, Anomaly Detection, Unsupervised Learning

Tutores

Walter Vinci, Ricardo Robles Fernández, Rubén López Fernández (HP SCDS)
Raquel Blanco Aguirre (Universidad de Oviedo)

Volver al listado