Saltar al contenido

super

Top 10 del HPC 500, Junio 2017

El HPC es una de las múltiples disciplinas que me interesan, no en vano es uno de los entornos más exigentes a la hora de su diseño. También y con un enfoque menos tecnológico,  es un indicador interesante del nivel de inversión de un país en I+D.

Periódicamente analizaré los cambios más significativos e interesantes en esta lista:

 

ank System Cores Rmax (TFlop/s) Rpeak (TFlop/s) Power (kW)
1 Sunway TaihuLight – Sunway MPP, Sunway SW26010 260C 1.45GHz, Sunway , NRCPC
National Supercomputing Center in Wuxi
China
10,649,600 93,014.6 125,435.9 15,371
2 Tianhe-2 (MilkyWay-2) – TH-IVB-FEP Cluster, Intel Xeon E5-2692 12C 2.200GHz, TH Express-2, Intel Xeon Phi 31S1P , NUDT
National Super Computer Center in Guangzhou
China
3,120,000 33,862.7 54,902.4 17,808
3 Piz Daint – Cray XC50, Xeon E5-2690v3 12C 2.6GHz, Aries interconnect , NVIDIA Tesla P100 , Cray Inc.
Swiss National Supercomputing Centre (CSCS)
Switzerland
361,760 19,590.0 25,326.3 2,272
4 Titan – Cray XK7, Opteron 6274 16C 2.200GHz, Cray Gemini interconnect, NVIDIA K20x , Cray Inc.
DOE/SC/Oak Ridge National Laboratory
United States
560,640 17,590.0 27,112.5 8,209
5 Sequoia – BlueGene/Q, Power BQC 16C 1.60 GHz, Custom , IBM
DOE/NNSA/LLNL
United States
1,572,864 17,173.2 20,132.7 7,890
6 Cori – Cray XC40, Intel Xeon Phi 7250 68C 1.4GHz, Aries interconnect , Cray Inc.
DOE/SC/LBNL/NERSC
United States
622,336 14,014.7 27,880.7 3,939
7 Oakforest-PACS – PRIMERGY CX1640 M1, Intel Xeon Phi 7250 68C 1.4GHz, Intel Omni-Path , Fujitsu
Joint Center for Advanced High Performance Computing
Japan
556,104 13,554.6 24,913.5 2,719
8 K computer, SPARC64 VIIIfx 2.0GHz, Tofu interconnect , Fujitsu
RIKEN Advanced Institute for Computational Science (AICS)
Japan
705,024 10,510.0 11,280.4 12,660
9 Mira – BlueGene/Q, Power BQC 16C 1.60GHz, Custom , IBM
DOE/SC/Argonne National Laboratory
United States
786,432 8,586.6 10,066.3 3,945
10 Trinity – Cray XC40, Xeon E5-2698v3 16C 2.3GHz, Aries interconnect , Cray Inc.
DOE/NNSA/LANL/SNL
United States
301,056 8,100.9 11,078.9 4,233

 

Muy interesante me parece la circunstancia de que el Nº 1 no este basado en Xeon y que sea Chino, ya que esto puede suponer una tendencia para futuras instalaciones del gigante asiático, habrá que estar atentos a este nuevo procesador y a posibles variantes como Phytium.

Estados Unidos ha quedado relegado al 4º puesto, lo que no es nada habitual,  veremos cuanto tardan en sorprendernos con un nuevo gigante.

Se consolidan las instalaciones basadas en Xeon Phi, y  NVIDIA TESLA

 

 

El primer súper computador con ARM ya esta aquí

A mediados de Julio de 2017, recibíamos la nota de prensa de BULL, anunciando su nueva serie de súper computadores, denominada Sequana  y la presentación del X1310, el primer modelo basado en ARM v8.

es interesante ver como aparecen opciones alternativas al XEON de Intel en el teatro del HPC, que por otro lado últimamente esta bastante animado, con anuncios como el de ARM, Phytium, Sunway, etc.

Jumbo Frames, ¿qué son y donde usarlas?

Diseñando con uno de nuestros clientes su nueva arquitectura de servidores/virtualización y almacenamiento, le han surgido una serie de dudas sobre el uso de Jumbo frames. En realidad es un tema, que aunque sencillo, no es muy conocido y es habitual ejemplos de uso (o no) inadecuado.

Un poco de teoría:

La mayoría de nuestras redes a nivel de CPD se construyen sobre los protocolos ethernet para L2 e IP para L3.

modelo OSI

 

el tamaño de trama por defecto para ethernet es de 1500bytes (fijaos que digo trama y no paquete. En ethernet lo que se transmiten son tramas de datos y en IP paquetes que a su vez se alojaran en las tramas ethernet). Este valor, que es modificable, es lo que convierte una trama ethernet normal en un Jumbo Frame cuando ampliamos su tamaño.

 

Es importante remarcar que las Jumbo Frames, están fuera del estándar 802.3 que define ethernet. El tamaño máximo es de 9.000Bytes

 

¿Debo usar Jumbo Frames en mi red?

Pues depende… activar el uso de Jumbo Frames reduce la carga de gestión de las tramas y paquetes (si paquetes ip también, luego veremos la razón) y puede mejorar el rendimiento a la hora de transferir grandes volúmenes de información, (por eso las SAN son escenarios donde usar Jumbo Frames), por contra aumentan la latencia de la red (especialmente en redes lentas).

En general se puede decir que el uso de Jumbo Frames mejora la eficiencia de nuestra red.

Eficiencia_Jumbo_Frames

<Fuente Wikipedia>

Lo que no debes hacer bajo ningún concepto es mezclar dispositivos con Jumbo Frames activos y otros desactivos, eso es una fuente potencial de problemas.

 

¿Entonces por qué no las usa todo el mundo?

Fundamentalmente porque no toda la electrónica de red (sobre todo la antigua) la soporta. El aumento de tamaño de trama reduce el nº de tramas a transmitir, pero al ser estas de mayor tamaño también se incrementa el esfuerzo necesario para calcular los CRC y esto puede tener un impacto importante en el rendimiento de nuestra red. También es necesario ampliar la cantidad de memoria asiganada a los buffers de los dispositivos de red.

Como comentaba unas lineas más arriba, no debemos mezclar dispositivos con y sin Jumbo Frame activo, esto limita su uso a redes donde nos podemos permitir que todos los dispositivos lo tengan activo. Un ejemplo de este tipo de redes serían las redes de almacenamiento SAN (iSCSI). Para otro tipo de redes el estándar sigue siendo 1500, después de todo no es casualidad que todos los S.O. vengan configurados con una MTU de 1500 (El que la MTU de S.O. y el tamaño de trama coincidan, aumentan la eficiencia del uso de la red).

 

¿Hay alguien pensando en tamaños distintos a las Jumbo Frames?

La respuesta es sí. Ya podemos encontrar al menos:

  • Baby Jumbo Frames: son más pequeñas que las Jumbo (en realidad solo un poco más grandes que las ethernet) y se usan en entornos de carrier encapsuladas en protocolos como MPLS.
  • Super Jumbo Frames: esto como imagináis va de grande, porque grande es mejor. 64.000Bytes

 

¿Tiene aplicación a la virtualización?

Por supuesto, ya os comentaba antes que las redes SAN basadas en iSCSI son un escenario claro para el uso de Jumbo Frames.

¿VMware soporta Jumbo Frames?

Si, os enseñare a configurarlo en un próximo artículo.

 

Sunway TaihuLight, el nuevo número 1 del Top 500

Recientemente se ha publicado la lista TOP500 del mes de Junio de 2016 y en ella aparece el nuevo Supercomputador del Gigante asiático, que viene a s sustituir al también chino Tianhe-2 (MilkyWay-2).

Esta nueva “bestia” de la computación HPC se llama Sunway TaihuLight y he aquí uno de los principales puntos de interés, NO esta basado en procesadores Xeon de Intel como los Tianhe-X.

sunway-taihulight

 

Si recordáis, hace un tiempo (Abril de 2015 más o menos) EEUU , en un intento de frenar la evolución en HPC de su competidor, prohibió a Intel y AMD vender sus procesadores de última generación. La respuesta de China a esta situación fue adquirir una licencia de desarrollo de procesadores Power a IBM, por lo que parecía que la evolución de sus nuevos sistemas iría en este sentido. La sorpresa ha sido mayúscula cuando el nuevo sistema esta basado no en un derivado de Power, sino en un derivado de la arquitectura DEC Alpha (si habéis leido bien).

No se sabe mucho de este nuevo procesador, solo que que opera a una frecuencia modesta como corresponde a un chip multicore (1.45 GHz), que es muy eficiente energéticamente (lo que lo hace además aparecer en el Green500)  y que son fabricados por la National High Performance Integrated Circuit Design Center de Shanghai.

Algunos datos más de la bestia:

  • 40.960 nodos
  • 32GB de RAM por nodo para sumar 1.3 PB en total
  • 15.3 megawatts corriendo Linpack
  • 93 petaflop/s corriendo Linpack
  • Sunway Raise OS (basado en Linux)

TOP500-June16

<Lista Top500 de Junio de 2016>

La Red Española de SuperComputación crece, con nuevos socios

La Red española de Super Computación (RES), coordina el acceso a los recursos de supercomputación de los organismos miembros, entre los que se encontraban Picasso en Málaga, Magerit en la UPM, o el que consituye el nodo principal de la red (MareNostrum).

 

logo_Resc

Con la presente ampliación se incorporan a la RES, los siguientes superconputadores:

  • Finis Terrae II, del Centro de Supercomputación de Galicia (CESGA)
  • Pirineus, del Consorcio de Servicios Universitarios de Cataluña (CSUC)
  • Lusitania, de la Fundación Computación y Tecnologías Avanzadas de Extremadura
  • Caléndula, del Centro de Supercomputación de Castilla y León
  • Cibeles, de la Universidad Autónoma de Madrid

además de los ya existentes:

  • MareNostrum 3, MinoTauro y Altix del BSC-CNS
  • Magerit 2, del Centro de Supercomputación y Visualización de Madrid de la Universidad Politécnica de Madrid
  • LaPalma 2, del Instituto de Astrofísica de Canarias
  • Altamira 2, de la Universidad de Cantabria
  • Picasso 2, de la Universidad de Málaga
  • Tirant 2, de la Universidad de Valencia
  • CaesarAugusta 2, del Instituto de Biocomputación y Física de Sistemas Complejos de la Universidad de Zaragoza
  • Atlante, del Instituto Tecnológico de Canarias.

España por desgracia, no dispone de grandes recursos de SuperCompuntación, por lo que todo lo que sea organizar y optimizar el uso y acceso a dichos recursos, seran iniciativas de gran importancia.

Milkyway 2, sigue en el número 1 del TOP500 HPC

Ya hace más de un año (junio de 2013), que el súper computador Milkyway 2 (también conocido como Tianhe 2) estableció el record de 3.86 petaflop/s y continua por cuarta vez consecutiva como líder de la lista.

 

Top500_noviembre<Puedes consultar la lista completa aquí>

En un mundo como el del HPC ser campeón por cuarta vez consecutiva tiene su merito, más aún cuando aspirantes como Blue Waters anuncia rendimientos pico de 13 petaflop/s.

Es indiscutible que China esta haciendo importantes inversiones en  innovación, por lo que no sería de extrañar que siguiesen liderando esa lista, bien con una actualización de Milkyway, bien con una nueva instalación.

tianhe-2-dongarra<Puedes ver el original de la imagen aquí>

 

En España seguimos haciendo tímidos esfuerzos, pero incluso con MareNostrum o Teide, estamos lejos de la elite mundial en HPC.

Red Española de Supercomputación, un oasís en el desierto

El HPC es una de las grandes asignaturas pendientes de España, ya no digamos en el sector privado (que también), sino a nivel académico, lo cual es ciertamente preocupante.

A pesar de todo, si que existen pequeños oasis en medio del desierto del HPC académico español, esos oasis conforman la Red Española de Supercomputación y son un total de 8.

Todos ellos coordinados desde el BSC.

<Imagen MareNostrum extraída de la Wikipedia>

Los nodos principales son el MareNostrum (63,83 TFlops) y el Magerit (72030 GFlops), el resto son nodos más o menos modestos que a menudo se actualizan con el HW que a su vez liberan los nodos principales en sus actualizaciones.

<Imagen Magerit extraída de la Wikipedia>

En un mercado global, donde por estructura de costes y preparación debemos competir en calidad y valor añadido en los productos, fomentar este tipo de instalaciones cuya principal dedicación es el  I+D, constituye una apuesta clara por nuestro futuro.

¿Qué opináis?

Fuentes:

wikipedia

BSC

Intel Xeon Phi, la apuesta de Intel para el HPC de bajo coste:

No hace mucho tiempo NVDIA puso patas arribas el mundo del HPC, al presentar su tecnología CUDA que haciendo uso de tarjetas gráficas de la marca permitía convertir equipos modestos en nodos de supercomputación bastante respetables, el movimiento de NVIDIA también fue seguido por otros fabricantes, entre ellos AMD con sus RADEON y como no Intel con el proyecto Xeon PHI, aunque Intel realizo una aproximación diferente:

Las Xeon PHI son tarjetas en formato PCI express con tres peculiaridades:

  • Vienen equipadas con procesadores altamente especializados en el calculo matemático , que sirven de apoyo a la CPU principal.
  • Los procesadores desarrollados en 22 nanometros cuentan con alrededor de 8GB de memoria DDR5 y son altamente paralelos, por lo que una única tarjeta daría rendimientos cercanos al Teraflop.
  • Cuentan con su propio sistema operativo , basado en Linux. Se trata por tanto de un sistema dentro de otro sistema.

Esta tecnología sera el corazón del nuevo super ordenador del Laboratorio Nacional de Energía Renovable, desarrollado por HP y que promete espectaculares cifras de rendimiento con un PUE de únicamente 1,06.