Please Go to Settings and Configure Slideshow

15 Marzo 2016

Articulo

 

5 Opciones de Recuperación de Desastres: Balanceando los Pros y Contras, Objetivos y Costos

 

 

Craig Hurley

VP de Gestión de Producto Cosentry


Craig Hurley es responsable de todo el ciclo de vida del centro de datos de la empresa, hosting, cloud y la cartera de servicios gestionados. Antes de unirse a Cosentry, se desempeñó como director de gestión de producto de NTT Communications, un proveedor de servicios de infraestructura de TI global. Antes de unirse a Cosentry, se desempeñó como director de gestión de producto de NTT Communications, un proveedor de servicios de infraestructura de TI global. Durante su carrera de 10 años en NTT, Hurley administró todo el portafolio de servicios del centro de datos de EE.UU., más recientemente, ha desarrollado el portafolio de productos de recuperación en la nube como servicio de NTT. Hurley tiene más de 15 años de gestión de producto y experiencia en TI incluyendo posiciones en Verio, Ameritech, y AT& T. Siendo un veterano del Ejército de EE.UU., Hurley recibió su licenciatura en ciencias políticas de la Universidad de Indiana y su maestría de la Universidad DePaul.

Los desastres son inevitables. Desde la tormenta del siglo hasta la retroexcavadora cortando la línea de alta tensión en una construcción local, los desastres vienen en distintas formas. Sin embargo, hasta el más rutinario de los “desastres” puede tener un efecto devastador en su negocio si no le permite interactuar con sus clientes o destruye información. Aquí están los pros y contras de las estrategias de recuperación de desastres más comunes para ayudarle a decidir cuál es el más adecuado a las necesidades de su empresa.

 

Dos medidas clave

Al evaluar sus opciones, hay dos medidas que debe conocer: RPO y RTO

 

RPO (Objetivo de punto de recuperación) se refiere a la cantidad de tiempo, por ejemplo, 30 minutos, 4 horas, etc., en la que es tolerable la pérdida de información en caso de un desastre. El RPO determina en gran medida la frecuencia de la replicación de información necesaria.

Algunas empresas podrían sobrevivir perdiendo el valor de algunas horas de información. Otras podrían sufrir daños irreparables si solo pierden un par de minutos de información. Un corto RPO, como 15 minutos, indica que una pequeña perdida de información es aceptable, un RPO más largo, como 4 horas, indica plazos menos críticos para conservar la información.

 

RTO (Objetivo de tiempo de recuperación)se refiere a la brecha de tiempo entre un evento de desastre y el retorno de las operaciones. RTO determina en gran medida la clase de equipo y tamaño de conexión con el proveedor que es necesario para cumplir con sus objetivos de recuperación.

Empresas altamente estacionales, especialmente en las industrias de alto volumen como los negocios de retail, pueden decidir que incluso una hora de tiempo de inactividad es más de lo que pueden permitirse. Otras empresas pueden ser capaces de mantenerse sin acceso al sistema, al menos por una tarde, o tal vez más.

 

No todas las aplicaciones tienen los mismos requisitos

 

No solo las empresas tienen diferentes RPO y RTO objetivos, las aplicaciones dentro de una empresa también tendrán diferentes requisitos. Por ejemplo, las aplicaciones de cara al cliente suelen exigir un RPO más corto y un bajo RTO debido a que la perdida de información y tiempo de inactividad puede tener un grave impacto en la empresa. Las aplicaciones administrativas pueden ser capaces de soportar más tiempo de inactividad o un mayor nivel de perdida de información.

Establecer un RTO demasiado largo o un RPO demasiado alto puede poner a la organización en un nivel inaceptable de riesgo. Por el contrario, establecer un RPO y RTO a niveles que son demasiado agresivos conlleva a un exceso de inversión y a un capital inmovilizado que podría ser gastado de forma más productiva.

 

Opción No. 1 Replica sincrónica

También conocida como activa/activa, copias en tiempo real (“en vivo”) de su información son creadas y guardadas fuera de las instalaciones. En caso de un desastre o falla del sistema, las aplicaciones clave corren en el sitio de respaldo, manteniendo el tiempo de inactividad y pérdida de información al mínimo absoluto.

Su sitio de recuperación de desastres debe estar geográficamente alejado de su centro de datos principal. Muchas empresas del Worl Trade Center de Nueva York descubrieron el problema de la localización de su datacenter alterno en el edificio de al lado el 9/11. 

PROS

  • Poco o ningún tiempo de inactividad. El tiempo de recuperación es típicamente una función del tiempo de inicio / fin y cualquier cambio de DNS/routing requeridas. (Mejor RTO)
  • Puede configurarse el switch al datacenter alterno en forma automática. No hay pérdida de tiempo en cambios manuales.
  • Poco o nada de perdida de información. La información está siempre actualizada en la medida de que el sitio de respaldo está siempre activo. (Mejor RPO)
  • Soluciones usualmente de apalancamiento en puestos de control y en diario, permitiendo al cliente la falla a un punto específico de tiempo.
  • Las soluciones a menudo aprovechan puntos de control y registro diario, permitiendo al cliente la conmutación por error en un punto específico en el tiempo.
  • Permite la recuperación de la producción.

CONTRAS

  • Requiere hardware y software extra. (Costo más alto)
  • Requiere una conexión fiable (redundante) de red entre ubicaciones.
  • Incrementa la complejidad. Necesita manejar ambos sitios y la conexión entre ellos.
  • Impone un requerimiento de baja latencia. Usualmente es menos de 10 ms, lo cual limita las opciones para la separación geográfica.

 

Opción No. 2 Replicación Asincrónica

La replicación asincrónica, también conocida como la replicación activa/pasiva, o Warm Site, se refiere a una estrategia de recuperación de desastres, en la que se crean copias de los datos casi en tiempo real y se almacenan fuera de las instalaciones, ya sea en el datacenter de un proveedor de servicios o en una segunda ubicación de la empresa. Ambas estrategias de replicación sincrónicas y asincrónicas requieren una arquitectura robusta que incluye una conexión fiable entre los sitios primarios y secundarios. El RPO deseado y la cantidad de datos que se modifican afectarán a los requisitos de conectividad.

PROS

  • La información se replica continuamente. Sin embargo, a diferencia de la replicación sincrónica, la actividad en el sitio primario no tiene que esperar a que la copia se complete en el sitio de recuperación de desastres para continuar.
  • La utilización de instantáneas permite replicar los datos de forma programada en el intervalo de tiempo que se especifique.
  • No se necesita restaurar información. Después de un desastre, la data de réplica se vuelve activa (RPO/RTO en segundo lugar solo en la opción sincrónica)
  • Puede ser configurado para la conmutación por error automática.
  • Permite la recuperación de la producción.

CONTRAS

  • El hardware de alto a mediano costo.
  • Potencial pérdida de información. La información está actualizada solo hasta el último punto de replicación.

 

Opción No. 3. Cloud Backup/ Recuperación total del sistema

Con este enfoque, se hace una copia de respaldo de su información a través de internet o de un circuito dedicado a un lugar seguro. Las características pueden variar significativamente.

PROS

  • Fácil de implementar.
  • De mediano a bajo costo. Este enfoque proporciona un RTO relativamente corto y un RPO bajo minimizando su inversión en sistemas redundantes.
  • Altamente flexible. Las soluciones de respaldo pueden ser adaptadas a los planes de recuperación.
  • Puede ser capaz de restaurar los sistemas físicos a máquinas virtuales.
  • La restauración desde cero puede combinarse con las copias de respaldo para acortar el tiempo de recuperación.
  • Las copias de respaldo se pueden automatizar. Con la monitorización, no hay necesidad de preocuparse de si sus datos estarán allí en el caso de un desastre.

CONTRAS

  • Las características son variables. Es importante asegurarse de que es compatible con las aplicaciones específicas que use.
  • Tiempo medio para restablecer la producción. Este enfoque es más lento que la replicación sincrónica y asincrónica, sin embargo, puede ser considerablemente más rápida que la restauración en la nube tradicional o cinta local.
  • Las restauraciones son procesos manuales.

 

Opción No. 4. Copia de seguridad de archivos

La desventaja más significativa de los backups de archivos son el tiempo que toma restaurar la copia de seguridad y el límite de opciones de recuperación de todo el sistema.

PROS

  • Bajo costo. Usted sólo paga por lo que usa.
  • Buena opción para un volumen bajo de información o de datos relativamente estadísticos.
  • Interfaz web. Generalmente fácil de usar, incluso para el usuario no técnico.
  • Usa conexión de internet existente para la copia de seguridad.
  • Normalmente, los datos de la copia de seguridad se almacenan en diferentes ubicaciones geográficas. No hay necesidad de preguntarse si sus datos están una "hot zone".
  • Puede automatizarse para que el usuario no necesite “recordar realizar una copia de seguridad de los datos”. Esto se presta para un mejor RPO que copia de seguridad de cinta/disco local.

CONTRAS

  • La velocidad del proceso de copia de seguridad es variable, dependiendo de la velocidad de la conexión y la carga de usuarios en el momento dado.
  • Tiempos más lentos de restauración. Cuando aplican restricciones del aprovechamiento de Internet para el transporte de datos, ancho de banda y latencia
  • La recuperación total del sistema, si es posible, toma bastante tiempo.
  • Los usuarios puede que no sean notificados de los errores o fallas en la copia de seguridad e ignorar que no se están completando exitosamente.
  • La restauración es un proceso manual.
  • La mayoría de los servicios solo son copias de seguridad de información. Para recuperar, la empresa podrá necesitar recargar y configurar aplicaciones primero, añadiendo tiempo y complejidad al proceso de operación de restauración.
  • La mayoría de los servicios sólo realizan copias de seguridad de datos. Para recuperar, la empresa puede necesitar volver instalar y configurar aplicaciones primero, añadiendo tiempo y complejidad al proceso de las operaciones de restauración
  • No es una buena opción para organizaciones con grandes volúmenes de información o que necesiten un RPO/RTO agresivo.

 

Opción No. 5. Backup Local (Cinta/Disco)

Todo comenzó con una cinta de respaldo. Sin embargo, como han surgido nuevas tecnologías, el viejo recurso ha sido algo sustituido por opciones mucho más fiables.

Y decimos “algo” sustituido debido a que una encuesta realizada por CIOinsight.com reveló que el 48 por ciento de las pequeñas y medianas empresas siguen utilizando cinta como una solución de copia de seguridad primaria. Aunque hay diferencias significativas entre la cinta y las metodologías de respaldo de disco, las estamos listando juntos porque ambas se llevan a cabo a nivel local, por lo general sin la participación de terceros.

PROS

  • Cinta: De bajo a mediano costo.
  • Cinta: Rentable para almacenamiento a largo plazo/archivado.
  • Cinta: Adecuado para ser movido fuera del sitio
  • Disco: De medio-bajo a mediano costo.
  • Disco: Puede ser rentable a largo plazo/archivado cuando se utilizan tecnologías de deduplicación.
  • Disco: Capacidades de protección de datos que pueden ayudar a eliminar la perdida de datos.

CONTRAS

  • Cinta: Alta probabilidad de falla en los medios
  • Cinta: Introduce riesgos de seguridad durante el manejo de las cintas.
  • Cinta: la recuperación de copia de seguridad de un lugar fuera del sitio o proveedor puede retrasar las restauraciones.
  • Disco: Susceptibles a problemas del sitio local (incendios, inundaciones, perdida de potencia)
  • Disco: Las capacidades fuera de sitio, típicamente requieren hardware secundario en un sitio remoto o un disco para grabar la capacidad de exportación.
  • Para ambos medios, las restauraciones son un proceso manual; la recuperación total del sistema toma una cantidad significativa de tiempo.
  • El número de restauraciones simultáneas es limitado.
  • Los costos de personal adicional pueden ser necesarios para gestionar las copias de respaldo.

 

Nos gusta pensar que un desastre nunca va a acontecer en nuestro negocio. Sin embargo, en 2014 un estudio de proveedores, empresas con más de 250 empleados perdieron $1.7 billones de dólares por la pérdida de datos y tiempo de inactividad en un período de 12 meses solamente. Está claro que los líderes empresariales tienen que hacer más que esperar lo mejor. Tener la estrategia de recuperación de desastres correcta para su organización le ayudará a minimizar el impacto y volver al trabajo tan pronto como sea posible.