implementación de un modelo de markov para la valoración
TRANSCRIPT
Implementación de un Modelo de Markov para la valoración
del riesgo en las operaciones de vuelo con mapas
autoorganizados
Implementation of a Markov Model for the risk assessment in
flight operations with self-organized maps
Ileana Suárez Blanco1 y Armando Jesús Plasencia Salgueiro2
Resumen
A pesar de que el año 2017 se considera que es el año más seguro de la historia de la aviación
civil, los desafíos que se presentan ante esta actividad en materia de seguridad operacional son
considerables debido en lo fundamental a dos factores, el incremento continuo del número de
vuelos y la automatización de todas las etapas del vuelo. Para minimizar estas situaciones, el
empleo de programas de seguridad como el Sistema para la valoración del riesgo en las
operaciones de vuelo o programa (FORAS) reviste gran importancia, lo que conlleva a que la
creación de modelos matemáticos más óptimos, prácticos en su empleo por los ingenieros y
comprensibles en sus resultados para los decisores revista gran importancia. Acorde con lo antes
expuesto, en el artículo se propone el empleo de los modelos de Markov para la determinación de
los estados óptimos, admisibles y anómalos dentro del cumplimiento de los estándares de vuelo
con el empleo de los mapas autoorganizados (SOM) para la reducción de la dimensionalidad de
los mismos, haciéndolos más prácticos por un menor costo operacional y más comprensibles a
los directivos de seguridad.
Palabras clave: FORAS; modelo de Markov; Seguridad Operacional de los vuelos; SOM
Abstract
Although 2017 is considered to be the safest year in the history of civil aviation, the challenges
presented to this activity in terms of safety are considerable due basically to two factors: the
1 Instituto de Cibernética, Matemática y Física (ICIMAF), Cuba, [email protected] 2 Instituto de Cibernética, Matemática y Física (ICIMAF), Cuba, [email protected]
continuous growth of the number of flights and the automation of all flight stages. To minimize
these situations, the use of security programs such as the System for the assessment of risk in
flight operations or program (FORAS) is very important, which leads to the creation of more
optimal mathematical models, practical in their use by engineers and understandable in their
results for decision makers has great importance. In accordance with the foregoing, the article
proposes the use of Markov models for the determination of optimal, admissible and anomalous
states within the compliance of flight standards, with the use of self-organized maps (SOM) to
reduce the dimensionality of them, making them more practical for a lower operational cost and
more understandable to security managers.
Keywords: FORAS; Flight Operational Safety; Markov Model; SOM
Introducción
Un programa de Aseguramiento de la Calidad de Operaciones de Vuelo, o programa FOQA
(Flight OperationalQualityAssurance), consiste en el análisis de las tendencias de seguridad que
se pueden determinar gracias al procesamiento de los datos obtenidos de forma regular de los
recopiladores de parámetros del vuelo (FDR). Estas tendencias de seguridad pueden estar
relacionadas con la seguridad operacional de los vuelos o con la valoración de la fiabilidad de la
técnica de aviación.
El programa particular para la determinación de las tendencias de riesgos en las operaciones de
vuelo se conoce como Sistema para la valoración del riesgo en las operaciones de vuelo o
programa FORAS (Flight OperationsRiskAssessmentSystem – FORAS) (Hadjimichael,2005). El
objetivo del programa FORAS es el diseñar una metodología y un modelo en la compañía para la
identificación y la representación de los factores de riesgo, sus relaciones y la valoración
cuantitativa de tales riesgos. El sistema está destinado para servir como herramienta de soporte a
la toma de decisiones de los directivos de seguridad operacional para medir y reducir las áreas
riesgos asociadas a los accidentes e incidentes de aviación. Estas áreas se pueden clasificar de
acuerdo al tipo de avión, ruta, región, o vuelo específico. Esta valoración se realiza con ayuda de
un modelo matemático el cual sintetiza diferentes variables tales como tripulación, condiciones
meteorológicas, aeropuertos, tráfico, tipo de avión y políticas y procedimientos de gestión de la
seguridad. . El sistema es capaz entonces de identificar entonces aquellos elementos que
contribuyen más significativamente en un riesgo determinado y es capaz en algunos casos de
sugerir las posibles acciones a tomar para la prevención de incidentes o accidentes.
Las dos teorías de seguridad fundamentales que sustentan a FORAS son el Modelo del queso
suizo o Modelo de Reason y la pirámide de Heinrich (Nazeri, 2008).
Modelo de Reason:
Describe la causa de los accidentes como una serie de eventos que deben ocurrir en un orden
específico para que el accidente ocurra.
Esto se compara con los orificios de varias rebanadas alineadas de queso suizo (Figura 1). Los
orificios propician la ocurrencia de un fallo o accidente y las tajadas representan las capas del
sistema. Un orificio puede permitir que un problema pase a través de una capa, pero si en la
próxima capa los orificios se encuentran en diferentes lugares, el problema puede ser detenido.
Figura 1. Modelo del Queso Suizo o de Reason
Pirámide de Heinrich:
Es la representación gráfica que indica que tras un accidente fatal subyacen alertas previas.
Los niveles de la pirámide muestran que para eliminar los accidentes más graves se debe prevenir
los accidentes leves. La pirámide contiene los siguientes niveles (Figura 2):
1 representa los accidentes fatales, que pueden ser mortales o incapacidad permanente 10 son
accidentes graves con pérdida de tiempo, con o sin daño material 30 son aquellos accidentes
leves con daños materiales, con o sin lesión, 600 son aquellos casos de riesgo en donde no se
produjo lesión ni daño.
El último nivel está constituido por las condiciones inseguras, cuya cuantía no es fácil de
determinar, ya que no existe un parámetro general para la creación u ocurrencia de los mismos y
para que se genere un incidente o accidente puede haber uno o varios actos y condiciones
inseguras.
Figura 2. Pirámide de Heinrich
Formulación del problema
Como caso de estudio para este artículo, se valora el incremento de la distancia de aterrizaje, a
partir del umbral de la pista debido a la relación entre la velocidad a la entrada del aterrizaje (C49
– Velocidad instrumental máxima de contacto con la pista – Vopt. = 300 Km/h), las velocidades
con potencia en el revers (C43 – Velocidades bajas con potencia en el revers< 160 Km/h) y la
velocidad de desarme de los revers, (C46 - Vopt. = 100 – 80 Km/h) en el avión IL-62.
En la Figura 3 se muestran los factores relacionados que pueden llevar a un sobre recorrido
(overrun) de la pista. Como se expresó, en nuestro caso se seleccionó la velocidad, que incide en
la distancia de contacto con la pista y la energía y los revers que inciden en la desaceleración.
Figura 3. Factores que inciden en el sobre recorrido del avión sobre la pista expresados a través de su distribución de
probabilidades a partir de su modelo físico (Wang, 2014).
Metodología
El modelo matemático seleccionado en este artículo es el modelo de Markov. El modelo de
Markov es una técnica muy útil para el análisis cuantitativo de las operaciones de seguridad
(Wang, 2014). Sin embargo, la valoración de la confiabilidad no es una tarea sencilla en los
sistemas grandes que incluyen múltiples componentes, donde muchas variables son monitoreadas
y el número de estados de una cadena de Markov puede ser del orden del millón.
Se toma entonces la propuesta metodológica expuesta en (Sperandio, 2006), en donde las
variables monitoreadas pueden ser agrupadas para determinar los estados de un modelo de
Markov, reduciendo así la dimensionalidad de la misma, y la matriz de transición es calculada
basada en las variaciones de los agrupamientos de acuerdo con la secuencia de los datos. Las
variables son el flujo temporal de los datos adquiridos en los procesos que queremos modelar, en
donde cada vector representa una ventana del ancho de un segmento temporal, los cuales
contienen valores continuos o discretos como los que se expusieron en la introducción.
Agrupamiento
El método de agrupamiento propuesto por la metodología seleccionada es el de los mapas
autoorganizados, el cual reduce la dimensionalidad de los datos con el empleo de redes
neuronales de dos capas, la de entrada y la de salida. Los SOM tienen la característica de
identificación de clases o grupos inadvertidos previa comprensión del flujo de datos
multivariado.
Las razones de la selección de los SOM para el agrupamiento son su capacidad de transformar los
valores continuos como la velocidad, en estados discretos lo cual hace más fácil la modelación de
la cadena de Markov y la posibilidad que brindan los mapas obtenidos en el estudio de los datos
recopilados, a partir de que estos muestran las correlaciones y las contribuciones de cada variable
a la estructura de los agrupamientos. Ello es útil para ajustar la clasificación y para entender cada
estado del modelo de Markov, especialmente en los modos anómalos.
Esta herramienta se aplica para la modelación de las variables que intervienen en las operaciones
de vuelo a partir de los datos históricos recopilados para posteriormente supervisar su estado y
seguridad. Los estados son definidos por las variables agrupadas y pueden ser denominadas como
Clase 1 (valores normales de operación), Clase 2 (valores dentro del rango permisible de
operación) y Clase 3 (valores anómalos de operación).
Modelo de Markov
Modelo probabilístico que puede contar con eventos de procesos simultáneamente activos en un
sistema durante un tiempo continuo, en una cadena homogénea de Markov.
Las Cadenas de Markov son procesos estocásticos en los cuales el resultado en cada etapa sólo
depende del resultado de la etapa anterior y no de cualquiera de los resultados previos. Estas
cadenas reciben su nombre del matemático ruso AndreyMarkov (1856-1922). Recuerdan el
último evento y eso condiciona las posibilidades de los eventos futuros.
El análisis de Markov permite encontrar la probabilidad de que un sistema se encuentre en un
estado en particular en un momento dado. Con esta información se puede predecir el
comportamiento del sistema a través del tiempo.
• Los cambios de estado del sistema son transiciones
• Las probabilidades asociadas con varios cambios de estado son probabilidades de
transición.
El proceso se caracteriza por un espacio de estados, una matriz de transición que describe las
probabilidades de transiciones particulares y un estado inicial (o distribución inicial) en todo el
espacio de estados.
El método de Markov puede ser aplicado a los comportamientos aleatorios de los sistemas que
varían de forma discreta o continua con respecto al tiempo y al espacio, caracterizado por que los
estados futuros son independientes de todos los estados pasados, a excepción del estado directo
anterior.
El modelo probabilístico plantea la posibilidad de que cada estado está presente en el transcurso
del tiempo y en la distribución del tiempo de espera en el estado que estuvo presente. La suma de
estas probabilidades tiene que ser la unidad, y el sistema puede permanecer en el estado que está
siendo considerado o moverse a otro. Un diagrama en árbol puede ilustrar el comportamiento de
ese sistema.
En la medida que se incrementa el tiempo, los valores de las probabilidades de los estados
tienden a ser constantes o a tener un valor límite. Estos valores se conocen como limitantes de
estados o independientes temporalmente del estado de las probabilidades, y es uno de los
resultados más significativo en el análisis de seguridad.
Resultados y discusión
El diagrama en bloques de un sistema paralelo con tres componentes se muestra en la Figura 4.
Figura 4. Sistema paralelo de 3 componentes (Sperandio, 2006)
La Figura 5 ilustra un modelo de Markov detallado del sistema representado en la Figura 3 con
todos los estados posibles y las transiciones, excluyendo más de un componente anómalo al
mismo tiempo. La raya encima del componente significa que este es anómalo y λA, μA son las
razones de estado anómalo y en parámetros respectivamente.
Figura 5. Modelo de Markov detallado para un sistema de 3 componentes en paralelo.(Sperandio, 2006)
La matriz de transición (P) representa la probabilidad de realizar una transición de un estado a
otro en un intervalo de tiempo para un caso discreto, o una razón de transición para un proceso
continuo. En el primer caso, la suma de los coeficientes de las filas de la matriz son la unidad, y
la suma del resto es cero.
Para describir el sistema descrito en la Figura 5, la matriz de transición debe tener un tamaño de
8x8, donde el elemento pij es la probabilidad de estar en un estado i e ir a un estado j, o la razón
de transición de un estado i a j, que puede ser anómalo u óptimo. Un sistema práctico puede tener
muchos más estados, generando grandes matrices de difícil solución. Esta explosión de los
espacios de estado puede ser limitada por el truncamiento del modelo de Markov, representando
los valores anómalos concurrentes o la combinación de componentes que constituye el estado del
sistema como un estado único, como la reducción a uno.
El modelo truncado se muestra en la Figura 6, donde los estados con un componente abajo
(down) son concentrados en un único nuevo estado. Las razones de anómalo y óptimo de los
nuevos estados son la suma de los estados precedentes, aceptando que el resultado de λA=λB=λC
es de 3λ del primer al segundo estado y así sucesivamente.
Figura 6. Modelo de Markov truncado (Sperandio, 2006)
Ahora es más fácil conformar la matriz transicional P, la cual será de 4x4 como en (1)
(1)
Para evaluar las probabilidades de estado limitantes de los casos continuos es necesario
solucionar las ecuaciones diferenciales lineales de la forma (2)
(2)
Pero existe una simplificación que conduce a este proceso continuo a ser derivado a una forma
discreta, donde los elementos diagonales de P se suman con 1. Entonces la ecuación matricial
puede solucionarse de la forma:
(3)
Sin embargo, el sistema tiene ecuaciones lineales dependientes, y necesita una más para ser
resuelto. La ecuación adicional es (4) y debe de reemplazar al uno de las líneas de (3)
(4)
De esta forma, las probabilidades limitantes o de reducción se dan en (5)
(5)
En (5), deberá tenerse cuidado de evitar los problemas de redondeo cuando existen diferencias
entre los estados de transición de varios órdenes de magnitud. Entonces, después de hacer una
corrida las probabilidades son calculadas y se obtienen las medidas de fiabilidad del tipo de
indisponibilidad, Frecuencia de detección de anomalías y el tiempo medio hasta el fallo (MTTF).
La idea en el empleo de los SOM es la de crear grupos de las variables monitoreadas del sistema
que se quiere modelar. Por lo tanto, estos grupos van a representar el espacio de estado del
proceso, cada uno de un estado particular. Como cada vector tiene una etiqueta, la cual para la
modelación de un proceso de Markov será una etiqueta secuencial en el tiempo, entonces es
posible seguir la secuencia en los grupos. Estos cambios de los grupos en la secuencia de los
datos serán el resultado de las probabilidades de transición entre los estados, y consecuentemente,
formará la matriz estocástica transicional de probabilidades P. Por consiguiente, se puede realizar
una valoración de la seguridad.
El monitoreo de las variables debe de respetar un ancho de ventana constante del segmento
temporal, el cual en nuestro caso es de días. Este monitoreo formara un flujo en el tiempo de los
datos históricos que será la entrada de entrenamiento de la red SOM. Las diferencias temporales
entre los datos muestreados deberán ser estrictamente uniformes debido a que si no se cumple, la
razón de transición entre los grupos no tendrá un valor y el modelo no podrá ser considerado
como un proceso de Markov.
Tomemos la distribución de los datos que se da en la tabla 1.
Tabla 1. Datos obtenidos del monitoreo de 3 variables.
Obtenemos una distribución de los datos en un mapa de 3x3 que se da en la Figura 7, en donde
también se puede observar el compartimiento de las variables en los componentes de los mapas.
Figura 7. Mapa de 3x3 y sus mapas componentes organizados por los datos de la tabla I.(Sperandio, 2006)
Cada mapa etiquetado X, Y, Z representa a sus respectivas variables, el negro representa una gran
contribución de esta variable por una neurona, mientras que el blanco indica una poca cantidad de
esta.
Los mapas componentes de la Figura 7 muestran que la variable X predomina en la parte superior
del mapa, donde se sitúan las muestras 3, 6, 2, 4; la variable Y es más fuerte abajo y la Z en el
lado derecho. Los gradientes de las sombras grises de blanco a negro en cada componente del
mapa indica un mapa bien organizado.
Tomando la Figura 4, fueron definidos tres grupos denominados A, B y C (Clase 1, Clase 2 y
Clase 3). La transición entre los grupos se representa en un diagrama de estado. Esto se
representa en la Figura 8. El diagrama de estado sigue la secuencia de las etiquetas (tag) de la
Tabla I y esta cambia de grupo a grupo, entonces es posible calcular las probabilidades de
transición por la fórmula:
(1)
Figura 8. Grupos A, B y C (Clase 1, Clase 2 y Clase 3) y sus transiciones (Sperandio, 2006)
Una vez que los estados (grupos) son definidos y las probabilidades de transición son calculadas
se puede modelar un diagrama de espacios de estado como se representa en la Figura 9.
Figura 9. Diagrama de espacio de estado para el ejemplo de la tabla I.(Sperandio, 2006)
La limitación de las probabilidades de estado para el sistema representado por la figura 8 se da en
(2):
(2)
La suma de las probabilidades resultantes tiene que ser 1, y la solución de cualquier ecuación por
el método de razón de flujo por:
(8)
Con estas probabilidades y asumiendo que el estado C (Clase 3) es un estado anómalo, la
disponibilidad y la indisponibilidad de este sistema son 0.6923 y 0.3077 respectivamente. Sin
embargo, para hallar el MTTF es necesario hacer que el estado de anomalía absorba uno,
excluyéndolo de la matriz Q, que se resuelve con (9) y adiciona sus columnas resultando en una
media temporal para la absorción (MTTA), o en un índice para el tiempo medio hasta el primer
valor anómalo, lo cual constituye una importante y útil información.
(9)
Para el ejemplo dado, el MTTA fue de 2.5 intervalos de tiempo para la iniciación del sistema en
el estado A y 2 veces intervalos de tiempo si él se inicia en el estado B.
Un Sistema para la valoración del riesgo en las operaciones de vuelo o programa FORAS debe
ser capaz de detectar las desviaciones presentes de los estados operacionales y ayudar a los
directivos de seguridad proponer las medidas que minimicen los riesgos y propongas las barreras
protectoras propuestas en el modelo de Reason. Estas desviaciones o situaciones de contingencia
pueden corresponderse con estados específicos pero el costo computacional de su representación
solo con un modelo de Markov se hace muy alto. Aunque la metodología propuesta
anteriormente no incluye determinados valores que se eliminan en el proceso de reducción es
válida desde el punto de vista práctico.
La metodología que se propone aplicar para la detección de las desviaciones de los estándares
operacionales de vuelo a partir de la detección de los valores anómalos de los FDR permite a los
decisores tomar las medidas más producentes tanto en el propio proceso de vuelo como en los
entrenamientos y recurrentes para minimizar los riesgos que la aparición de estas medidas
producen.
En la implementación de la metodología se utilizó un dataset con 290 registros y 46 variables de
los vuelos realizados durante un año por la flota de IL-62 (Rodríguez, 2005). El diagrama mapa
auto organizado se da en la Figura 7.
Conclusiones
A pesar de que el año 2017 se considera que es el año más seguro de la historia de la aviación
civil, los desafíos que se presentan ante esta actividad en materia de seguridad operacional son
considerables debido en lo fundamental a dos factores, el incremento continuo del número de
vuelos y la automatización de todas las etapas del vuelo.
Para minimizar estas situaciones, el empleo de programas de seguridad como el Sistema para la
valoración del riesgo en las operaciones de vuelo o programa (FORAS) reviste gran importancia,
lo que conlleva a que la creación de modelos matemáticos más óptimos, prácticos en su empleo
por los ingenieros y comprensibles en sus resultados para los decisores revista gran importancia.
Acorde con lo antes expuesto, en el artículo se propone el empleo de los modelos de Markov para
la determinación de los estados óptimos, admisibles y anómalos dentro del cumplimiento de los
estándares de vuelo con el empleo de los mapas auto organizados (SOM) para la reducción de la
dimensionalidad de los mismos, haciéndolos más prácticos por un menor costo operacional y más
comprensibles a los directivos de seguridad.
Se propone continuar con la implementación del software de este modelo y el aumento de la
optimización del mismo.
Bibliografía
Hadjimichael M.(2005). Flight Operations Risk Assessment System (FORAS). Naval
Research Laboratory.
Nazeri Z. (2008). Analyzing Relationships between Aircraft Accidents and Incidents. A data
mining approach. International Conference on Research in Air Transportation (ICRAT
2008) www.icrat.org. Center for Air Transportation Systems Research (CATSR)/GMU
02/08
Rodríguez M. (2005). “Aplicación de las Técnicas de Minería de Datos para el análisis de la
información de los datos de vuelo”. Tesis para optar por el grado de master en Gestión de
Información en las Organizaciones. La Habana, Cuba.
Sperandio M. (2006). Constructing Markov Models for Reliability Assessment with Self-
Organizing Maps. 9th International Conference on Probabilistic Methods Applied to
Power Systems. KTH, Stockholm, Sweden – June 11-15, 2006
Wang, C. (2014). Quantification of Incident Probabilities Using Physical and Statistical
Approaches.