Please Go to Settings and Configure Slideshow

20 Julio 2015

Articulo

 

Tolerancia a fallos en centros de datos virtualizados

 

 

James Dyckowski

Director de Ventas de Soluciones de Ingeniería


James es Director de Ventas en Dyckowski-James con más de ocho años de experiencia en tecnología de almacenamiento, RAID, virtualización (VMware, Microsoft Hyper-V, Citrix y RHVS), aplicaciones SAN, NAS, Linux y DB (MS SQL, Exchange y Oracle), backup y recuperación de desastres (DR).

Aprovechando la resiliencia de las soluciones de FT (Tolerancia a fallos) y HA (Alta Disponibilidad)

La mayoría de las empresas enfrentan retos ante la gestión efectiva de datos. Para ello, una de las soluciones de tecnología dominantes de hoy sigue siendo la virtualización, en parte porque encaja bien con la consolidación, una tendencia actual en los centros de datos. Como un número creciente de servidores se convierten en virtualizados, los usuarios necesitan menos máquinas físicas, lo que permite a los administradores de TI consolidar el número de servidores dispares.

Cuando miramos los impresionantes y bien documentados beneficios de la virtualización, se hace evidente por qué esta solución sigue siendo tan popular. Ya sea que estemos hablando de servidores de almacenamiento o servidores de aplicaciones, las ventajas de la virtualización incluyen:


• Gestión centralizada

• El uso óptimo de los recursos

• Menor costo total de propiedad

• Centro de datos más amigable con el medioambiente

• Disminución del consumo de energía

• Reducción del espacio para datacenter

• Menos ruido

Aunque está claro que la virtualización y la consolidación de servidores seguirá aumentando, las empresas aún deben ejercitarse en el cuidado apropiado de la implementación para mantenerse alejado de los posibles peligros en el uso de estas poderosas herramientas. Por ejemplo, considere la amenaza que representa para los servidores consolidados colocar todos sus huevos en una sola canasta. Si un solo servidor se cae, los otros componentes del datacenter están también sujetos a un potencial colapso.

Por ello que el concepto de "tolerancia a fallos" (FT) se convierte en algo tan importante – este ofrece una solución para esta amenaza. En este sentido, algunas empresas como, por ejemplo, VMware, han introducido tecnología FT en sus últimas líneas de productos. Examinemos dos nuevas tecnologías complementarias FT que han entrado al mercado y comparemos algunas de sus similitudes y rasgos distintivos.

 

Tolerancia a fallos en las Máquinas Virtuales?

Para los administradores de TI, hay dos preocupaciones principales respecto del datacenter de cualquier empresa: integridad de datos y la continuidad del servicio. Si cualquiera de estas áreas se convierte en un sistema comprometido o se interrumpe, esto puede conducir a graves consecuencias, incluida la pérdida de la disponibilidad del servicio y/o la pérdida de datos que está más allá de la recuperación.

En centros de datos en los que se implementan infraestructuras virtuales con más de un servidor virtual alojado en un solo servidor físico, evitar estos desafíos puede ser aún más difícil. Piense en lo que pasa cuando el único servidor físico cae — pone rápidamente a todos los servidores de aplicaciones virtuales conectados fuera de servicio. Esto llevó al desarrollo de una solución FT inicial diseñada para eliminar este problema potencial con las máquinas virtuales (VM).

La solución FT funciona de la siguiente manera: en centros de datos que alojan varios servidores virtuales, cada vez que FT se habilita para uno de los servidores, se crea automáticamente una copia de ese servidor virtual específico; entonces se ejecuta automáticamente en otro servidor físico a través de un programador automático, que permite a la aplicación elegir el sistema más adecuado disponible para acoger esta VM secundaria. Alternativamente, el administrador puede seleccionar otro servidor de una lista de sistemas disponibles. La siguiente figura muestra el marco general de esta solución FT.

 

Independientemente del sistema operativo (OS) que está ejecutando el servidor de aplicaciones, esta solución FT puede habilitarlo. Dado que la solución es independiente del sistema operativo e independiente de las aplicaciones, el administrador no tendrá inconvenientes con el cambio de OS o aplicación para apoyar esta FT. Ese es el lado positivo. En el lado negativo, para la implementación exitosa de esta solución, los administradores deben seguir varios requerimientos específicos relativos a los componentes de hardware (incluyendo la CPU), así como seguir los requerimientos rígidos para las máquinas virtuales primarias y secundarias, para ejecutar los códigos del sistema operativo y de las aplicaciones que son idénticos y sincronizados.

Sin embargo, un fabricante de esta solución utiliza una tecnología innovadora para asegurar que las dos máquinas virtuales ejecuten el mismo código. Mediante un enlace de red de alta velocidad, la VM primaria ofrece paquetes como teclado, mouse y entradas de red de la VM secundaria. La siguiente figura muestra la secuencia de datos de la VM primaria a la VM secundaria.

 

En esta solución, si el servidor principal falla y la VM primaria no está disponible, entonces la VM secundaria asume la función de la primaria. Para garantizar el traspaso (failover) transparente, esta solución se basa en un mecanismo de redes virtuales. Este mecanismo asegura que la VM secundaria se hace cargo de la identidad de red completa de la VM primaria. Lo que es más, la infraestructura de esta solución puede elegir automáticamente otro servidor físico adecuado para acoger una nueva VM secundaria, asegurando el futuro FT.

 

Tolerancia a fallos en servidores de almacenamiento virtualizados

Si su centro de datos implementa una infraestructura de servidor virtualizado, entonces se requiere al menos un servidor de almacenamiento virtual compartido como sede de los almacenes de datos para el sistema de memoria virtual (VMS). No hace falta decir, que es crucial para este servidor compartido ser tanto lo suficientemente robusto como tolerante a fallas.

Esto nos lleva a la segunda solución FT, que cuenta con un componente de alta disponibilidad (HA) capaz de cumplir estas exigencias. La arquitectura de esta solución de HA, tales como StorTrends, ejecuta en entornos virtualizados de la misma manera que puede implementarse en servidores de aplicaciones, con un servidor separado manejando necesidades de almacenamiento secundario.

La solución es muy sencilla para los administradores, quienes sólo necesitan seleccionar un servidor secundario y habilitarlo para que este activo/pasivo o activo/activo durante la configuración; el software de gestión de almacenamiento en red se encarga del resto.

A diferencia de la primera solución FT- en la que el éxito descansa en el almacenamiento compartido - la solución HA se basa en el almacenamiento espejo. La belleza de este enfoque es que no requiere de recursos compartidos entre los dos nodos, permitiendo que cada servidor ofrezca una completa FT.

La arquitectura HA también ofrece un eficiente el balanceo de carga. Los volúmenes que residen en los servidores de la solución pueden comprender hasta 6 alias por controlador, con un controlador asumiendo el papel de un servidor primario para un alias, y el segundo controlador para el otro alias.

En términos de requerimientos, el dueño de los alias es responsable de la duplicación de toda la data escrita a sus pares. Sin embargo, a pesar del tiempo involucrado, este requerimiento ofrece a las empresas dos beneficios importantes: primero, los dos servidores de almacenamiento comparten la computación y de E / S de cargas, es decir, cada uno juega un papel activo de un alias. En segundo lugar, promueve un uso más eficiente del ancho de banda de enlace en los enlaces full-duplex, con escrituras críticos reflejan los pares en dos direcciones diferentes en el enlace de red.

 

En cuanto a términos de necesidades, usuario del alias es responsable de los datos a sus compañeros. Sin embargo, a pesar del tiempo involucrado, este requisito ofrece a las empresas dos beneficios importantes: primero, los dos servidores de almacenamiento comparten el cálculo y la carga I/O (input/output), es decir, cada uno juega un papel activo de un alias. En segundo lugar, promueve un uso más eficiente del enlace de ancho de banda contra los enlaces full-duplex, con escrituras críticos duplicadas a los pares en dos direcciones diferentes en el enlace de red.

 

Comparando las Capacidades

Ahora que usted tiene una comprensión básica de estas dos tecnologías de tolerancia a fallas, veamos algunos peligros potenciales que podrían afectar negativamente el funcionamiento y disponibilidad de los datos de la empresa en un instante, comparando cómo las soluciones de FT y HA manejan estas amenazas:

 

• Fallas de Software. Los servidores físicos y virtuales deben hacer frente a la amenaza constante de una falla del software. Los servidores pueden estar temporalmente perdidos cuando el sistema operativo (OS) de una máquina virtual se bloquea debido a errores en el kernel. Las interrupciones de servicio también se pueden producir debido a un virus, o cuando las aplicaciones que se ejecutan en el servicio de VM finalizan de manera no ususal. Cuando estos eventos ocurren, la primera solución FT descrita anteriormente está en una situación de clara desventaja, ya que tanto la VM primaria como la secundaria ejecutan un código de software idéntico al mismo tiempo. Por lo tanto sufrirán consecuencias idénticas durante un accidente en cualquiera de las VM, que conduce a la interrupción del servicio. Contraste esto con la solución de alta disponibilidad, donde los dos nodos no ejecutan un código idéntico. Esta arquitectura permite al nodo secundario asumir el papel del primario, incluso cuando el servidor primario se cae debido a una falla de software y el clúster de almacenamiento de software continúa sin interrupción.

 

 

 

• Actualizaciones de software. Cada servidor debe mantenerse al día con las últimas actualizaciones de software para garantizar la seguridad y un rendimiento óptimo. Con este proceso, la primera solución de FT se enfrenta a una situación de desventaja, ya que requiere un código de software idéntico al ejecutarse en las dos máquinas virtuales. Esto significa que para actualizar el software, el administrador debe sacar de funcionamiento ambas máquinas virtuales para completar las actualizaciones, lo que hace que todo el clúster de almacenamiento no esté disponible durante este tiempo. Con la solución de HA, por otro lado, cada nodo puede ser actualizado de forma independientemente, manteniendo el otro nodo disponible en todo el proceso.

 

• Hardware se bloquea. Con la solución de FT, si la VM primaria se cae debido a una falla de hardware o de corte del suministro eléctrico, la VM secundaria está disponible para asumir el papel principal. Esto significa que incluso en el caso de una falla de hardware, la disponibilidad del servicio no se verá afectada. Esto también es cierto con la solución de HA - si el nodo principal no está disponible cuando se bloquea de hardware, el nodo secundario se hace cargo de la función de la primaria, dejando el clúster de almacenamiento en pleno funcionamiento.

 

 

 

Conclusión

Como la virtualización sigue haciendo incursiones en el data center, el tema de la tolerancia a fallos sigue aumentando en importancia. Una amplia gama de compañías están compitiendo para convertirse en líderes en el campo de la virtualización de servidores, pero dos tipos de soluciones se destacan en virtud de sus ofertas de múltiples funciones: la solución FT y la solución de HA.

La última versión de la solución de FT se ha convertido en el líder en el tratamiento de las cuestiones de la robustez y la fiabilidad de las granjas o agrupaciones centralizadas de servidores virtuales. Esta solución permite a las empresas implementar la virtualización de servidores de una manera “OS-neutral” e independiente de la plataforma. Si bien esta solución FT es poderosa, sin embargo, todavía está en su infancia y tiene ciertas limitaciones, como soportar un solo procesador de máquinas virtuales. Un fabricante de esta solución también recomienda como una buena práctica, que los administradores deben implementar otras redundancias sobre distintos niveles de subcomponentes, como la red de trabajo en equipo de irregularidades relacionadas con la red, incluso cuando se despliega FT.

El servidor de almacenamiento compartido es un componente clave de cualquier data center virtualizado. La disponibilidad y tolerancia de fallos de este servidor de almacenamiento subyacente también es crítica, lo que hace que la solución de HA sea muy convincente también. Al igual que con la solución de FT, un fabricante recomienda implementar otras redundancias sobre distintos niveles de subcomponentes, tales como RAID para fallos de disco y trabajo en equipo de la red. Para mayor robustez y tolerancia a fallos, las empresas deberían considerar el despliegue tanto de la solución de FT y la solución de HA en un centro de datos, por lo que se benefician conjuntamente de las muchas características de gran alcance que este par de productos que ofrece.