52

La lista de los Top 500 supercomputadores es incorrecta

Publicado el: 30/11/2010
Supercomputador IBM Blue Gene
Hace unos días hablé sobre un supercomputador chino, el Tianhe-1A que se proclamaba el más rápido del mundo al colocarse en lo más alto de la lista del Top 500. En esa noticia explicaba que aunque fuera el supercomputador que pudiera ejecutar más petaflops en el mundo, no significaba que fuera el más rápido. Ahora, un proveedor de computación de alto rendimiento, en la conferencia de supercomputación del 2010 (SC10), celebrada en Nueva Orleans, me da la razón al afirmar que utilizando 100.000 smartphones con Android se puede batir ese récord. Y es que mucha gente ya se está dando cuenta de que el Top 500 no usa la mejor manera de medir el rendimiento.

El problema radica en que la forma de evaluar el rendimiento sólo mide la cantidad de petaflops (operaciones en coma flotante por segundo). Para ello utilizan un software llamado Linpack, que devuelve los petaflops midiendo el tiempo que tarda el supercomputador en ejecutar muchas operaciones algebraicas (a los programas que miden el rendimiento de una máquina, como Linpack, se les llama benchmarks). El problema es que los supercomputadores no sólo hacen operaciones algebraicas. También son importantes, la velocidad con la que puede llevar y traer datos a memoria, instrucciones para el control del flujo del programa, etc.

El que un supercomputador pueda ejecutar muchas operaciones en coma flotante por segundo está muy bien para medir como será el rendimiento en aplicaciones que hacen muchos cálculos de este tipo, como en simulaciones físicas 3D, pero este no es el único tipo de aplicación al que se destinan los supercomputadores. Puesto que los supercomputadores no se utilizan para un único proyecto científico y luego se desechan, si no que suelen trabajar con distintos tipos de aplicaciones, sería conveniente que no se fabricaran pensando en un sólo tipo de aplicación.

Ahora se han dado cuenta de esta situación y ha surgido una nueva iniciativa llamada Graph 500, donde la palabra "Graph" se refiere a una herramienta matemática llamada grafo, que es una representación gráfica de elementos de un conjunto. La intención es cambiar la forma de evaluar el rendimiento, utilizando otros benchmarks distintos enfocados a aplicaciones con un uso intensivo de datos como, por ejemplo, en aplicaciones de medicina, biología, minería de datos, redes sociales, etc. De esta manera, los ingenieros hardware sabrán mejor como enfocar sus diseños a la hora de intentar conseguir el máximo rendimiento en este tipo de aplicaciones. Los benchmarks elegidos ejecutan algoritmos que trabajan con grafos. Estos son: búsqueda concurrente, búsqueda del camino más corto y calcular el máximo conjunto independiente.

Por lo tanto ahora tenemos por un lado, el Top 500, que mide la potencia de cálculo de la máquina y, por otro, el Graph 500 que mide la capacidad para trabajar con grandes volúmenes de datos. De esta forma los que vayan a alquilar un supercomputador podrán elegir mejor, según sus necesidades, consultando estas listas. Aunque la forma ideal de medir el rendimiento siempre es viendo cuánto tarda la aplicación que necesitamos ejecutar en esa máquina, pero eso no es siempre posible en supercomputación.

Pensamientos (0): Comentar
Categorías: ,

Comparte:

Copia y pega en tu página:

Comparte
Escribe tus pensamientos computables

Respondiendo a los siguientes comentarios:

Para comprobar que eres un humano responde correctamente:

Esta pregunta no me gusta, ¡cambialá!

Ninguno de estos datos será almacenado.

(Escribe el correo electrónico)

Campo obligatorio.

(Escribe el correo eléctronico o los correos electrónicos separados por comas)

Campo obligatorio.

Para comprobar que eres un humano responde correctamente:

Esta pregunta no me gusta, ¡cambialá!