Debe introducir al menos 3 caracteres en el buscador.
Inicio / Wikis / Tutoriales / Cluster Heterogéneo De Computadoras - Introducción a los cluster de computadoras

Cluster Heterogéneo De Computadoras - Introducción a los cluster de computadoras

 ****- (5 opiniones)
GNU Free Documentation License Tutorial de Emilio José Plaza Nieto - 23 de Febrero de 2006
Temas Relacionados: PC
1. Introducción a los cluster de computadoras
Un cluster es un grupo de equipos independientes que ejecutan una serie de aplicaciones de forma conjunta y aparecen ante clientes y aplicaciones como un solo sistema. Los clusters permiten aumentar la escalabilidad, disponibilidad y fiabilidad de múltiples niveles de red.

La escalabilidad es la capacidad de un equipo para hacer frente a volúmenes de trabajo cada vez mayores sin, por ello, dejar de prestar un nivel de rendimiento aceptable. Existen dos tipos de escalabilidad:

  • Escalabilidad del hardware (también denominada «escalamiento vertical»). Se basa en la utilización de un gran equipo cuya capacidad se aumenta a medida que lo exige la carga de trabajo existente.
  • Escalabilidad del software (también denominada «escalamiento horizontal»). Se basa, en cambio, en la utilización de un cluster compuesto de varios equipos de mediana potencia que funcionan en tándem de forma muy parecida a como lo hacen las unidades de un RAID (Redundant Array of Inexpensive Disks o Array redundante de discos de bajo coste). Se utilizan el término RAC (Redundant Array of Computers o Array redundante de equipos) para referirse a los clusters de escalamiento horizontal. Del mismo modo que se añaden discos a un array RAID para aumentar su rendimiento, se pueden añadir nodos a un cluster para aumentar también su rendimiento.

La disponibilidad y la fiabilidad son dos conceptos que, si bien se encuentran íntimamente relacionados, difieren ligeramente. La disponibilidad es la calidad de estar presente, listo para su uso, a mano, accesible; mientras que la fiabilidad es la probabilidad de un funcionamiento correcto.

Pero hasta el más fiable de los equipos acaba fallando. Los fabricantes de hardware intentan anticiparse a los fallos aplicando la redundancia en áreas clave como son las unidades de disco, las fuentes de alimentación, las controladoras de red y los ventiladores, pero dicha redundancia no protege a los usuarios de los fallos de las aplicaciones. De poco servirá, por lo tanto, que un servidor sea fiable si el software de base de datos que se ejecuta en dicho servidor falla, ya que el resultado no será otro que la ausencia de disponibilidad. Ésa es la razón de que un solo equipo no pueda ofrecer los niveles de escalabilidad, disponibilidad y fiabilidad necesarios que sí ofrece un cluster.

Vemos cómo los clusters imitan a los arrays RAID al aumentar el nivel de disponibilidad y fiabilidad. En las configuraciones de discos tolerantes a fallos, como RAID 1 o RAID 5, todos los discos funcionan conjuntamente formando un array redundante de modo que cuando uno de ellos falla, sólo hay que reemplazarlo por otro; el resto del array sigue funcionando sin problemas, sin necesidad de que se efectúen tareas de configuración y, lo que es más importante, sin que se produzcan tiempos muertos. En efecto, el sistema RAID reconstruye automáticamente la unidad nueva para que funcione conjuntamente con las restantes. De igual modo, cuando falla un equipo que forma parte de un cluster, sólo hay que sustituirlo por otro. Algunos programas de cluster incluso configuran e integran el servidor de forma automática en el cluster, y todo ello sin que el cluster deje de estar disponible ni un solo instante.

En definitiva, un cluster es un conjunto de computadoras interconectadas con dispositivos de alta velocidad que actúan en conjunto usando el poder cómputo de varios CPU en combinación para resolver ciertos problemas dados.

Se usa un cluster con varios computadores para crear un supercomputador.

Hoy día los supercomputadores son equipos excesivamente costosos que están fuera del alcance de empresas o instituciones pequeñas. Un cluster, siendo una combinación de equipos microcomputadores (IBM PC Compatibles), puede ser instalado inclusive por particulares y puede ofrecer rendimiento muy cercano a un SuperComputador en cuanto a poder de cómputo.

En pocas palabras imagínate unos 20 PCs Pentium II ó III de 500 Mhz que actúan en conjunto como si fuese un sólo CPU de 10.000 Mhz!!! (Si bien no es tan fácil como eso, sirve para ilustrar algo aproximado a lo que se obtendrá).

El surgimientos de plataformas computacionales de comunicación y procesamiento estándares de bajo costo, les ha brindado la oportunidad a los programadores académicos de crear herramientas computacionales del dominio público o de costo razonable. Estas realidades permiten la implantación de códigos paralelizados sobre este tipo de plataformas obteniendo un rendimiento competitivo en relación a equipos paralelos especializados cuyos costos de operación y mantenimiento son elevados.

Una de las herramientas de más auge en la actualidad son los llamados cluster Beowulf, los cuales presentan diversas capacidades para el cómputo paralelo con un relativo alto rendimiento.

Conceptos generales


Cluster Beowulf no es un paquete software especial, ni una nueva topología de red, ni un núcleo modificado. Beowulf es una tecnología para agrupar computadores basados en el sistema operativo Linux para formar un supercomputador virtual paralelo. En 1994 bajo el patrocinio del proyecto ESS del Centro de la Excelencia en Ciencias de los Datos y de la Información del Espacio (CESDIS), Thomas Sterling y Don Becker crearon el primer cluster Beowulf con fines de investigación.

Beowulf posee una arquitectura basada en multicomputadores el cual puede ser utilizado para la computación paralela. Este sistema consiste de un nodo maestro y uno o más nodos esclavos conectados a través de una red Ethernet u otra topología de red. Esta construido con componentes hardware comunes en el mercado, similar a cualquier PC capaz de ejecutar Linux, adaptadores de Ethernet y switches estándares. Como no contiene elementos especiales, es totalmente reproducible. Una de las diferencias principales entre Beowulf y un cluster de estaciones de trabajo (COW, Cluster Of Workstations) es el hecho de que Beowulf se comporta más como una sola máquina que como muchas estaciones de trabajo conectadas. En la mayoría de los casos los nodos esclavos no tienen monitores o teclados y son accedidos solamente vía remota o por terminal serie. El nodo maestro controla el cluster entero y presta servicios de sistemas de archivos a los nodos esclavos. Es también la consola del cluster y la conexión hacia el exterior. Las máquinas grandes de Beowulf pueden tener más de un nodo maestro, y otros nodos dedicados a diversas tareas específicas, como por ejemplo, consolas o estaciones de supervisión. En la mayoría de los casos los nodos esclavos de un sistema Beowulf son estaciones simples. Los nodos son configurados y controlados por el nodo maestro, y hacen solamente lo que éste le indique. En una configuración de esclavos sin disco duro, estos incluso no saben su dirección IP hasta que el maestro les dice cuál es.

Figura: Arquitectura genérica de un cluster Beowulf|| ||

La topología de red recomendada es un Bus, debido a la facilidad para proporcionar escalabilidad a la hora de agregar nuevos nodos al cluster. Protocolos como Ethernet, Fast Ethernet, GigaEthernet, 10/100 Mbps Switched Ethernet, etc, son tecnologías apropiadas para ser utilizadas en Beowulf.

Beowulf utiliza como sistema operativo cualquier distribución Linux. Además usa bibliotecas de paso de mensajes como PVM y MPI. Sin lugar a duda los cluster presenta una alternativa importante para varios problemas particulares, no solo por su economía, sino también porque pueden ser diseñados y ajustados para aplicaciones específicas.

Clasificación


Para establecer las diferencias entre los distintos tipos de sistemas Beowulf se presenta la siguiente clasificación.

  • Clase I. Son sistemas compuestos por máquinas cuyos componentes cumplen con la prueba de certificación ``Computer Shopper lo que significa que sus elementos son de uso común, y pueden ser adquiridos muy fácilmente en cualquier tienda distribuidora. De esta manera, estos clusters no están diseñados para ningún uso ni requerimientos en particular.
  • Clase II. Son sistemas compuestos por máquinas cuyos componentes no pasan la prueba de certificación ``Computer Shopper lo que significa que sus componentes no son de uso común y por tanto no pueden encontrarse con la misma facilidad que los componentes de sistemas de la clase anterior. De tal manera, pueden estar diseñados para algún uso o requerimiento en particular. Las máquinas ubicadas en esta categoría pueden presentar un nivel de prestaciones superior a las de la clase I.
Autor y licencia de 'Cluster Heterogéneo De Computadoras - Introducción a los cluster de computadoras'
Emilio José Plaza Nieto Extraído de: http://es.tldp.org/Manuales-LuCAS/doc-cluster-computadoras/doc-cluster-computadoras-html/node1.html GNU Free Documentation License
Licencia GNU Free Documentation License: http://www.es.gnu.org/licencias/fdles.html
Este contenido ha sido recopilado por el equipo de Wikilearning. Todo el contenido recopilado se ha obtenido respetando y comunicando en nuestro site la licencia de cada fuente.
Wikilearning tiene permiso expreso por escrito de los autores para publicar los contenidos que ha extraído de otras webs, incluyendo su uso comercial.

Wikis relacionados con 'Cluster Heterogéneo De Computadoras - Introducción a los cluster de computadoras'

Muchas personas imagina que los llamados virus informáticos son unos organismos que flotan en el... Más »
Canon, el fabricante japonés de cámaras fotográficas, fotocopiadoras, impresoras, máquinas de fax, calculadoras y computadoras,... Más »
Los sistemas cluster hace años que fueron diseñados, la computación paralela y distribuida no es... Más »
Se discute cómo mejorar el performance aumentando el número de servidores Web. Esto involucra distribuir... Más »
Se discute cómo mejorar el performance aumentando el número de servidores Web. Esto involucra distribuir... Más »
¿Estás seguro de que deseas eliminar este capítulo?