Identificar un mal funcionamiento en la red electrica de la nacion puede ser como tratar de encontrar una aguja en un enorme pajar. Cientos de millas de sensores interrelacionados repartidos por los EE. UU. capturan datos sobre corriente eléctrica, voltaje y otra información crítica en tiempo real, a menudo tomando múltiples registros por segundo.
Los investigadores del MIT-IBM Watson AI Lab han ideado un método computacionalmente eficiente que puede identificar automáticamente anomalías en esos flujos de datos en tiempo real. Demostraron que su método de inteligencia artificial, que aprende a modelar la interconexión de la red eléctrica, es mucho mejor para detectar estos fallos que otras técnicas populares.
Debido a que el modelo de aprendizaje automático que desarrolla no requiere datos anotados sobre anomalías de la red eléctrica para el entrenamiento, sería más fácil de aplicar en situaciones del mundo real donde los conjuntos de datos etiquetados de alta calidad a menudo son difíciles de conseguir. El modelo también es flexible y se puede aplicar a otras situaciones en las que una gran cantidad de sensores interconectados recopilan y reportan datos, como los sistemas de monitoreo de tráfico. Podría, por ejemplo, identificar cuellos de botella en el tráfico o revelar cómo se acumulan los atascos.
“En el caso de una red eléctrica, las personas han tratado de capturar los datos usando estadísticas y luego definen reglas de detección con conocimiento del dominio para decir que, por ejemplo, si el voltaje aumenta en un cierto porcentaje, entonces se debe alertar al Operador de la red. Dichos sistemas basados en reglas, incluso potenciados por el análisis de datos estadísticos, requieren mucho trabajo y experiencia. Demostramos que podemos automatizar este proceso y también aprender patrones de los datos utilizando técnicas avanzadas de aprendizaje automático”, dice el autor principal Jie Chen, miembro del personal de investigación y gerente del MIT-IBM Watson AI Lab.
El coautor es Enyan Dai, pasante del MIT-IBM Watson AI Lab y estudiante de posgrado en la Universidad Estatal de Pensilvania. Esta investigación será presentada en la Conferencia Internacional sobre Representaciones de Aprendizaje.
Probabilidades de sondeo
Los investigadores comenzaron a definir una anomalía como un evento que tiene una baja probabilidad de ocurrir, como un pico arrepentido de voltaje. Tratan los datos de la red eléctrica como una distribución de probabilidad, por lo que si pueden estimar las densidades de probabilidad, pueden identificar los valores de baja densidad en el conjunto de datos. Esos puntos de datos que tienen menos probabilidad de ocurrir corresponden a anomalías.
Estimar esas probabilidades no es una tarea fácil, especialmente porque cada muestra captura múltiples series de tiempo, y cada serie de tiempo es un conjunto de puntos de datos multidimensionales registrados a lo largo del tiempo. Además, los sensores que capturan todos esos datos están condicionados entre sí, lo que significa que están conectados en una determinada configuración y, a veces, un sensor puede afectar a otros.
Para aprender la distribución de probabilidad condicional compleja de los datos, los investigadores utilizaron un tipo especial de modelo de aprendizaje profundo llamado flujo de normalización, que es particularmente efectivo para estimar la densidad de probabilidad de una muestra.
Aumentaron ese modelo de flujo de normalización utilizando un tipo de gráfico, conocido como red bayesiana, que puede aprender la compleja estructura de relación causal entre diferentes sensores. Esta estructura permite a los investigadores ver patrones en los datos y estimar las anomalías gráficas con mayor precisión, explica Chen.
“Los sensores interactúan entre sí, tienen relaciones causales y dependen unos de otros. Entonces, tenemos que ser capaz de inyectar esta información de dependencia en la forma en que calculamos las probabilidades”, dice.
Esta red bayesiana factoriza, o descompone, la probabilidad conjunta de los datos de varias series temporales en probabilidad condicionales menos complejas que son mucho más fáciles de parametrizar, aprender y evaluar. Esto permite a los investigadores estimar la probabilidad de observar ciertas lecturas del sensor e identificar aquellas lecturas que tienen una baja probabilidad de ocurrir, lo que significa que son anomalías.
Su método es especialmente poderoso porque esta estructura gráfica compleja no necesita definirse de antemano: el modelo puede aprender el gráfico por sí mismo, sin supervisión.
Una tecnica poderosa
Probaron este marco al ver qué tan bien pudo identificar anomalías en los datos de la red eléctrica, los datos de tráfico y los datos del sistema de agua. Los conjuntos de datos que usaron para las pruebas contenían anomalías que habían sido identificadas por humanos, por lo que los investigadores podrán comparar las anomalías que identificaron su modelo con fallas reales en cada sistema.
Su modelo superó todas las líneas de base al detectar un porcentaje mayor de anomalías en cada conjunto de datos.
“Para las líneas base, muchas de ellas no incorporan estructura gráfica. Eso corrobora perfectamente nuestra hipótesis. Descubrir las relaciones de dependencia entre los diferentes nodos en el gráfico definitivamente nos está ayudando”, dice Chen.
Su metodología también es flexible. Armados con un gran conjunto de datos sin etiquetar, pueden ajustar el modelo para hacer predicciones de anomalías efectivas en otras situaciones, como patrones de tráfico.
Una vez que se implementa el modelo, continúe aprendiendo de un flujo constante de nuevos datos de sensores, adaptándose a la posible desviación de la distribución de datos y manteniendo la precisión a lo largo del tiempo, dice Chen.
Aunque este proyecto en particular está cerca de su fin, espera aplicar las lecciones que aprendió a otras áreas de investigación de aprendizaje profundo, particularmente en gráficos.
Chen y sus colegas podrían usar este enfoque para desarrollar que mapeen otros modelos de relaciones condicionales complejas. También quieren explorar cómo pueden aprender de manera eficiente estos modelos cuando los gráficos se vuelven enormes, tal vez con millones o miles de millones de nodos interconectados. Y en lugar de encontrar anomalías, también podrían usar este enfoque para mejorar la precisión de los pronósticos basados en conjuntos de datos o optimizar otras técnicas de clasificación.
Este trabajo fue financiado por el MIT-IBM Watson AI Lab y el Departamento de Energía de EE. UU.
Fuente:
Uso de inteligencia artificial para encontrar anomalías ocultas en conjuntos de datos masivos . (2022, 25 febrero). Noticias del MIT | Instituto de Tecnología de Massachusetts. Recuperado el 1 de marzo de 2022, de https://news.mit.edu/2022/artificial-intelligence-anomalies-data-0225