BLOG

¿Cómo evitar puntos únicos de falla mediante redundancia?

Introducción:

En su forma más básica, redundancia significa disponer de un Sistema B en caso de que el Sistema A deje de funcionar. Ejemplos típicos de redundancia podemos señalarlo en: El caucho de repuesto que guardas en la maleta del carro (en caso de que uno te pueda dar problemas). O las velitas que guardas en alguna gaveta para brindar iluminación luego de un apagón (Hoy en día muchos usaran la linterna de su Smart Phone por ser más prácticos y no verse tan primitivos… pero sabes que igualmente guardas velas en alguna gaveta junto con fósforos como Plan C). Y hablando del Smart Phone los Doble SIM también están pensados para que tengas… ¿ya sabes qué? Exacto!!! Redundancia.

Y puedo continuar citando muchos ejemplos en la vida diaria en los que nos aseguramos de tener recursos adicionales en caso de que podamos necesitarlo. De esto se trata la redundancia. Ahora, si deseamos mantener nuestra infraestructura de telecomunicaciones en funcionamiento continuo, vamos a necesitar contar con al menos dos de varias cosas.


Filosofía de la redundancia:

La filosofía detrás de la redundancia es simple. Y es que todas las cosas del universo tienen la tendencia natural de romperse o fallarnos justo cuando más las necesitamos. Llámalo la segunda ley de la termodinámica, o entropía, o la popularmente conocida ley de Murphy: es la misma idea. La redundancia es una respuesta a la Ley de Murphy, y su principal beneficio es proporcionarnos tranquilidad, porque aún en condiciones de falla, interrupción o desastre las cosas pueden seguir operando.

Redundancia es cuando se tiene más de lo que realmente se necesita en ese momento. Wikipedia lo define así: Redundancia de materiales, consistente en disponer de varios equipos, o de varios procesos, o de varios repuestos, o de todo otro elemento participante en una solución electrónica, mecánica, o industrial.

En sistemas redundantes, se repiten aquellos datos (información) o hardware de carácter crítico que se quiere asegurar ante los posibles fallos que puedan surgir por su uso continuado.

El único lugar donde la redundancia es inútil es en el lenguaje, cuando decimos cosas como: vamos a subir hacia arriba… o vamos a bajar hacia abajo, también cuando decimos cosas como: hay que formar parejas de 2, también noticias como: se encontró un cadáver sin vidaha fallecido gente viva, son ejemplos de redundancia en el lenguaje que no son apropiados ni recomendables… pero en ingeniería sí que lo es.


Redundancia en la Ingeniería:

En ingeniería, la redundancia se refiere la duplicación de componentes o de funciones críticas en un sistema, con la intención de aumentar la confiabilidad del mismo, generalmente en forma de respaldo, lo cual le brinda a ese sistema la característica de ser: "a prueba de fallas".

Existe una fascinante historia que nos ilustrar sobre la necesidad incluir la redundancia en el diseño o arquitectura de nuestras plataformas o infraestructuras. Dicha historia está inspirada en un hecho real, conocido como el vuelo 9 de British Airways sobre el Océano Índico. Resulta que después de que los cuatro motores se apagaran debido a los efectos de la ceniza volcánica, las cosas se veían muy sombrías, literalmente el capitán les anuncio: "Señoras y señores, les habla el Capitán. Tenemos un pequeño problema. Los cuatro motores se han parado. Estamos haciendo lo imposible para tenerlos bajo control. Confío en que no se angustien demasiado.". Los pasajeros comenzaron a escribir cartas y a rezar angustiados mientras la tripulación trataba de mantener el ánimo y evitar el pánico.

Un avión de pasajeros puede volar con un solo motor. La razón para tener cuatro motores consiste en la redundancia, lo cual en el peor de los casos normalmente funciona. Pero en esta historia, tres motores de respaldo no fueron suficientes. Esto nos muestra que las fuerzas de la entropía y la Ley de Murphy pueden llegar a ser muy fuertes a pesar de nuestros mejores esfuerzos. Afortunadamente, el aparato fue capaz de planear lo suficiente para escapar de la nube de ceniza, luego todos los motores pudieron ser reiniciados y encendidos permitiendo el aterrizaje de emergencia sin heridos ni víctimas en un aeropuerto cercano.


¿Todo esto que quiere decir?

Que resulta importante considerar que ciertas situaciones indeseables ocurren y debemos estar preparados. En circunstancias normales, un único respaldo puede ser suficiente. Pero en algunos casos las complejidades de la redundancia y el potencial de falla pueden requerir que tenga más de un recurso adicional, eso va a depender de cuán crítico sea en componente o el sistema.


Recomendación: Evite los puntos únicos de falla (SPOF).

Cualquier dispositivo puede fallar en cualquier momento. El mantenimiento preventivo y el monitoreo proactivo pueden ayudar a mitigar un desastre potencial, pero depender de una sola unidad para un servicio crítico es arriesgado. Un único punto de falla (SPOF) es un componente que derribará todo el sistema cuando falle. Y es lo peor del mundo para una infraestructura de telecomunicaciones o de TI.

No hace falta decir que, con el tiempo, cualesquiera de los elementos de su plataforma fallarán. Los discos duros se corromperán, las bases de datos perderán su integridad y las conexiones dejarán de ser fiables. El problema es que simplemente no sabemos cuándo sucederá. Lo ideal es que para construir un sistema confiable debe elimitar estos puntos criticos. Los sistemas altamente confiables están diseñados sin SPOF. Esto significa que la falla de un componente, sistema o sitio no detiene el sistema ni las funciones operativas.


Niveles de redundancia

La redundancia es un concepto que se puede aplicar a muchos niveles en muchas tecnologías. Todo depende del alcance del sistema. Una base de datos simple en una oficina pequeña debe ser respaldada o replicada, preferiblemente fuera del sitio. Un servidor de datos se debe replicar en más de un servidor y realizar copias de seguridad con regularidad. Una pequeña empresa con una sola conexión a Internet se verá afectada si se interrumpe la conexion con su proveedor. Un UPS puede alargar su productividad en caso de una interrupción del sistema eléctrico principal.


Conclusión:

Ahora recuerde, la redundancia es una opción deseable en su sistema, es una inversión adicional que le proporciona tranquilidad, gracias a ella puede responder de forma proactiva ante una situación indeseable de falla o interrupción sin comprometer la continuidad de sus operaciones. Esto esta asociado con otro concepto deseable en Telecomunicaciones llamado DISPONIBILIDAD. Para ofrecer mayores tasas de disponibilidad debemos contar con sistemas redundantes.

Y ahora que ya sabes que es la redundancia ¿Dónde crees que necesitas aplicarla?

 

Fecha Publicación: 24/04/2021