* frecuencia de falla: Esta métrica mide con qué frecuencia una red experimenta fallas. Se puede expresar de varias maneras:
* Tiempo medio entre fallas (MTBF): El tiempo promedio entre fallas sucesivas. Un MTBF más alto indica una mayor confiabilidad. Por lo general, se expresa en horas o días.
* Fallas por año/mes/semana: Una medida más simple y directa de cuántas fallas ocurren dentro de un plazo dado.
* Tasa de falla: A menudo expresados como fallas por cada 1000 horas de operación o una métrica similar.
* Tiempo de recuperación de red: Esta métrica mide el tiempo que le toma a la red volver a un estado completamente operativo después de una falla. Esto incluye el tiempo que lleva identificar la falla, implementar una solución (por ejemplo, redirigir el tráfico, reiniciar un dispositivo) y verificar que la red funcione correctamente. Por lo general, se mide en minutos o horas. A veces se descompone en subcomponentes:
* Tiempo medio para detectar (MTTD): El tiempo que lleva descubrir que ha ocurrido una falla.
* Tiempo medio para reparar (MTTR): El tiempo que lleva solucionar el problema después de que se haya detectado.
* Tiempo medio para restaurar (MTTR): Similar a MTTR, pero a menudo se centra en la restauración del servicio a los usuarios finales.
En resumen, la frecuencia de falla le indica * con qué frecuencia ocurren los problemas *, mientras que el tiempo de recuperación de la red le indica que * cuánto tiempo * lleva solucionarlos. Ambos son esenciales para una comprensión completa de la confiabilidad de la red. A menudo se rastrean y analizan juntos para identificar áreas para mejorar el diseño de la red, el mantenimiento y la respuesta a los incidentes.