Conceptos Avanzados SOD

Operaciones de coma flotante por
segundo
Este artculo o seccin necesita referencias que aparezcan en una publicacin acreditada, como revistas especializadas,
monografas, prensa diaria o pginas de Internet fidedignas. Este aviso fue puesto el 18 de noviembre de 2011. Puedes
aadirlas o avisar al autor principal del artculo en su pgina de discusin pegando:
(( subst : Aviso referencias | Operaciones de coma flotante por segundo))
el rendimiento del equipo

Nombre
flops
megaflops/megaofps
106
109
1012
1015
1018
1021
1024
gigaflops/gigaofps
teraflops/teraofps
petaflops/petaofps
exaflops/exaofps
zettaflops/zettaofps
yottaflops/yottaofps
En informtica, las operaciones de coma flotante por segundo son una medida
del rendimiento de una computadora, especialmente en clculos cientficos que requieren
un gran uso de operaciones de coma flotante. Es ms conocido su acrnimo, FLOPS, por
el ingls floating point operations persecond. FLOPS, al ser un acrnimo, no debe
nombrarse en singular como FLOP, ya que la S final alude a second (o segundo) y no al
plural.
Las computadoras exhiben un amplio rango de rendimientos en coma flotante, por lo que
a menudo se usan unidades mayores que el FLOPS. Los prefijos estndar del SI pueden
ser usados para este propsito, dando como resultado megaFLOPS (MFLOPS,
10 FLOPS), gigaFLOPS (GFLOPS, 10 FLOPS), teraFLOPS (TFLOPS, 10 FLOPS),
6
12
petaFLOPS (PFLOPS, 10 FLOPS), exaFLOPS (EFLOPS, 10 FLOPS).

15
18
Rango de rendimiento
Una computadora de escritorio, que usa por ejemplo un procesador Pentium 4o Athlon 64,
tpicamente opera a ms de 3 GHz, provee de un desempeo computacional del rango de
unos cuantos GFLOPS. An algunas consolas de videojuegos del final de los aos
noventa y principios del 2000, tales comoGamecube y Dreamcast, tuvieron un rendimiento
mayor a un GFLOPS.
La primera supercomputadora, Cray-1 fue puesta en marcha en el Laboratorio Nacional

de Los lamos en 1976. La Cray-1 era capaz de operar a 80 MFLOPS. En poco ms de
treinta aos desde entonces, la velocidad computacional de las supercomputadoras es
ms de un milln de veces mayor.
La supercomputadora ms rpida del planeta a noviembre de 2014 es "Tianhe-2", una
computadora desarrollada por la Universidad Nacional de Tecnologa de Defensa de
China (NUDT) y ubicada en el Centro Nacional de Supercomputacin en Guangzho,
Repblica Popular China, tiene un rendimiento de 33,86 petaFLOPS
(33.860.000.000.000.000 clculos de coma flotante por segundo) superando en casi el
doble al supercomputador Cray Titan, del Oak Ridge National Laboratory de Estados
Unidos, que desde noviembre de 2012 mantena la corona.
La computacin distribuida usa internet para conectar computadoras personales y lograr
un efecto similar; ha permitido a SETI@Home, el mayor de dichos proyectos, computar a
una velocidad de ms de 100 TFLOPS.Einstein@Home ha ganado terreno y actualmente
ha logrado una velocidad sostenida de 886,6 TFLOPS convirtindola en una de las
supercomputadoras ms poderosas del mundo. Otros proyectos similares
son DistrRTgen yclimateprediction.net.
FLOPS como medida de rendimiento

Para que se pueda usar el FLOPS como medida de rendimiento de coma flotante una
referencia estndar debe ser establecida para todas las computadoras de inters. Uno de
ellos es el estndar LINPACK.
Los FLOPS por s solos no son un muy til estndar para computadoras modernas.
Existen muchos otros factores de rendimiento tales como I/O (Entrada/Salida),
comunicacin inter procesador, coherencia del cache y jerarqua de memoria. Esto
significa que las computadoras en general son slo capaces de una fraccin del pico
terico en FLOPS, obtenido adicionando el pico terico en FLOPS de cada uno de los
componentes del sistema. An cuando se trabaje en problemas grandes y altamente
paralelos, su rendimiento ser irregular, debido en gran medida a efectos residuales de
la ley de Amdahl. Por tanto, los estndares efectivos medirn rendimiento tanto de FLOPS
actuales tiempo real como de FLOPS sostenidos.
Para aplicaciones ordinarias (no cientficas) las operaciones sobre enteros (medidos
en MIPS) son mucho ms comunes. De lo anterior se deduce que medir el rendimiento en
FLOPS no predice con precisin la rapidez con la que un procesador realizar cualquier
tarea. Sin embargo, para muchas aplicaciones cientficas, como el anlisis de datos, el
rendimiento en FLOPS es una medida efectiva.
FLOPS, GPU y consolas de videojuegos,

entre otros
Frecuentemente se publican cifras astronmicas en FLOPS para tarjetas de video y
consolas de videojuegos. En comparacin, un computador de propsito general tendr un
rendimiento de unos cuantos GFLOPS si se considera nicamente su CPU.
Sin embargo, estas cifras deben ser tratadas con precaucin, ya que no son comparables
uno a uno con FLOPS de un computador totalmente programable de propsito general.
Estas cifras se basan en el rendimiento total del sistema (CPU + GPU).
La mayor parte del rendimiento en FLOPS de una consola de videojuegos proviene de su
GPU, que es un procesador de vectores altamente ductilizado o segmentado (pipelined
en ingls) optimizado para operaciones grficas, con muy limitada programabilidad. Esto
es posible porque las grficas en 3D son un ejemplo clsico de un problema altamente
paralelizable. Esto significa que el problema puede ser fcilmente dividido entre diferentes
unidades de ejecucin y ductos, permitiendo una alta ganancia en velocidad que ser
obtenida de escalar el nmero de compuertas lgicas en vez de nicamente la
velocidad de reloj.
Esta capacidad de cmputo en un computador permite por ejemplo:
Simulaciones de fenmenos naturales altamente precisas (huracanes, terremotos,

maremotos, impacto de asteroides)
Desdoblamiento de cadenas de ADN
Plegamiento de protenas
Simulacin de explosiones nucleares
Kan Balam
Para el gobernante maya, vase K'inich Kan Balam II.
Kan Balam
Ubicacin
Universidad Nacional Autnoma de

Mxico
Mxico
Instalacin
2007
Caractersticas
Arquitectura
AMD64 (AMD Opteron)
N procesado 1368
res
Rendimiento
7113 GFlops
Memoria
3016 GiB
Sistema
Linux
operativo
TOP500
Kan Balam (tambin conocido como KanBalam) es un clster de computadoras HewlettPackard, con capacidad (pico) de 7.113 teraflops, siendo la nmero uno en Amrica
Latina hasta noviembre de 2008 cuando la supera Aitzaloa.
Esta computadora est ubicada en la ciudad de Mxico, en el campus principal de
la Universidad Nacional Autnoma de Mxico en el edificio de la Direccin General de
Cmputo y de Tecnologas de Informacin y Comunicacin (DGTIC), estando en
funcionamiento desde el 16 de enero de 2007. Su coste supera los 3 millones de dlares.
Entre los objetivos de este equipo se encuentra un proyecto de enfrentar la fuga de
cerebros que sufre el pas, intentando repatriar a aquellos investigadores que se
encuentren trabajando en el extranjero, por falta de infraestructura. Las principales ramas
beneficiadas con esta computadora son la Astrofsica, la fsica de partculas, la qumica
cuntica, la geologa y, principalmente, la ingeniera ssmica. Tambin ser usada para
realizar estudios del clima y contaminacin y estar a disposicin de instituciones pblicas
y privadas.
Configuracin
KanBalam cuenta con 1368 procesadores AMD Opteron de 2.6 GHz y 3016 GiB de
memoria RAM, distribuidos en 337 nodos de clculo, cada uno con 8 GiB RAM y dos
procesadores duales y en 5 nodos especializados, con 64 GiB RAM.
Utiliza GNU/Linux como sistema operativo.
Dispone de un sistema de almacenamiento de 768 discos duros de 200 GB cada uno que
proporcionan un total de 150 TB de almacenamiento.
Los nodos de procesamiento se comunican con el sistema de almacenamiento en una red
de alta velocidad. Conecta 576 puertos con 2 switches infiniband, alcanzando la
impresionante velocidad de 10 GB/s.
Principales usos
Las supercomputadoras se utilizan para abordar problemas muy complejos o que no
pueden realizarse en el mundo fsico bien, ya sea porque son peligrosos, involucran cosas
increblemente pequeas o increblemente grandes. A continuacin damos algunos
ejemplos:
Mediante el uso de supercomputadoras, los investigadores modelan el clima

pasado y el clima actual y predicen el clima futuro .
Los astrnomos y los cientficos del espacio utilizan las supercomputadoras para
estudiar el Sol y el clima espacial.
Los cientficos usan supercomputadoras para simular de qu manera un tsunami

podra afectar una determinada costa o ciudad.
Las supercomputadoras se utilizan para simular explosiones de supernovas en el

espacio.
Las supercomputadoras se utilizan para probar la aerodinmica de los ms

recientes aviones militares.
Las supercomputadoras se estn utilizando para modelar cmo se doblan las

protenas y cmo ese plegamiento puede afectar a la gente que sufre la enfermedad
de Alzheimer, la fibrosis qustica y muchos tipos de cncer.
Las supercomputadoras se utilizan para modelar explosiones nucleares, limitando

la necesidad de verdaderas pruebas nucleares.
PA-RISC
PA-RISC es el nombre por el que se conoce una arquitectura de microprocesadores
desarrollada por sistemas Hewlett-Packard y VLSI Technology Operation. Esta
arquitectura se basa en el modelo RISC y en PA (Precision Architecture). Tambin se
suelen referir a ella como la arquitectura HP/PA, Hewlett Packard Precision Architecture.
PA se desarrolla en Palo Alto, donde se encuentra la central de HP.
A finales de los 80, HP comenz a construir dos series de computadores, ambas basadas
en CISC. Una de ellas es la serie HP 9000 de estaciones de trabajo Unix, basadas en el
microprocesador Motorola 68000. La otra serie era la serie HP 3000 de
minicomputadoras, basadas en un diseo de CPU de HP de 16 bits.
Los primeros PA-RISC fueron dispositivos de 32 bits. Se usaron por primera vez en las
ltimas series de HP 3000, la 930 y la 950, comnmente conocidos como
sistemas Spectrum (nombre que le pusieron en los laboratorios de HP). Estas mquinas
corran sobre MPE/iX. La serie HP 9000 se actualiz tambin a la arquitectura PARISC recin creada, pero en esta serie se trabajaba sobre HP-UX.
Otros sistemas operativos que se pueden usar sobre arquitecturas PA-RISC sonMach
kernel, Linux, OpenBSD, NetBSD y FreeBSD entre otros.
Una caracterstica interesante de PA-RISC es que la mayora de sus microprocesadores
no tiene cach L2. En su lugar se implementaba una cachL1 mayor, formada por chips
separados conectados al microprocesador a travs de un bus (actualmente est integrada
en el propio chip). Slo el modeloPA-7300LC tiene cach L2. Otra innovacin de esta
arquitectura fue la adicin de un repertorio de instruccin multimedia (SIMD) conocido
como MAX e introducido por primera vez en el 7100LC.
El diseo fue actualizado en 1996 en la versin 2.0 de la arquitectura. La nueva versin
era una arquitectura de 64 bits, implementada en la serie PA-8000 de HP. Contaba con 10
unidades funcionales y un nuevo sistema de segmentacin de cauce. Otro cambio que se
introdujo fue la separacin de la cach de instrucciones en dos, dependiendo del tiempo
de ejecucin de las instrucciones que iban a ir almacenadas en ellas. El PA-8200 fue
lanzado por HP en 1997 y contaba con algunas mejoras sobre el PA-8000, como una
mejora prediccin en los saltos y cachs ms grandes, ms rpidas y con unos algoritmos
de prediccin ms eficientes.
El PA-8500 fue el primero en el cual se aadi la cache al encapsulado del
microprocesador. Contaba con 1.5 MB de cach L1, lo que le permiti conseguir una gran
mejora en el rendimiento. Se actualiz el bus Runway con una implementacin basada
en DDR, consiguiendo 2GB/s de ancho de banda entre microprocesador y memoria. La
tabla de saltos aument el doble hasta alcanzar 2048 entradas y el buffer desde 120 a
160 entradas.
El 8600 es bsicamente igual al 8500 pero con una poltica semi-LRU para la cach.
El 8700 cuenta con una velocidad superior a la del 8600 y con una cach L1 de 2.25 MB.
Tambin se aadi capacidad de precaptacin de datos.
PA-8800, Mako, cuenta con dos microprocesadores independientes en el mismo
encapsulado (dual-core). Cada chip cuenta con SMP de 2 vas, as como 1.5 MB de cach
L1, pero HP ha decidido aadir 32 MB de cache L2 en chips separados. El bus Runway
ha sido reemplazado por el bus Itanium2, capaz de mantener tasas de 6.4 Gb/s y
mantener un expepcional ancho de banda.
Despus del PA-8900, HP esperar retirar la arquitectura PA-RISC para sustituirla con la
arquitectura Itanium. El ncleo que se introdujo con el PA-8000 no ha cambiado de forma
significativa hasta hoy; cada generacin posterior solo ha aumentado la velocidad de reloj
y la capacidad de la cach. Se ha mantenido el nmero de 2 ncleos en el mismo
encapsulado.
El hercio, hertzio o hertz (smbolo Hz), es la unidad de frecuencia del Sistema

Internacional de Unidades.
Nombrado en honor al fsico alemn Heinrich Rudolf Hertz (1857-1894), que
descubri la propagacin de las ondas electromagnticas. El nombre fue
establecido por la Comisin Electrotcnica Internacional (IEC por sus siglas en
ingls) en 1930. Este fue adoptado en 1960 por la CGPM (Confrence Gnrale
des Poids et Mesures: Conferencia General de Pesos y Medidas), reemplazando
el nombre anterior de cps (ciclos por segundo), as como sus mltiplos
relacionados:
[1]
[2]
kc/s (kilociclos por segundo),

Mc/s (megaciclos por segundo) y
Gc/s (gigaciclo por segundo).
El trmino "ciclo por segundo" fue completamente reemplazado por hercio en

ladcada de 1970.
Un hercio representa un ciclo por cada segundo, entendiendo ciclo como la
repeticin de un suceso. Por ejemplo, el hercio se aplica en fsica a la medicin de
la cantidad de veces por un segundo que se repite una onda (ya
sea sonora oelectromagntica) o puede aplicarse tambin, entre otros usos, a las
olas de mar que llegan a la playa por segundo o a las vibraciones de un slido. La
magnitud que mide el hercio se denomina frecuencia y es, en este sentido, la
inversa del perodo. Un hercio es la frecuencia de una oscilacin que sufre
unapartcula en un perodo de un segundo.
La siguiente tabla muestra las 10 primeras posiciones del la 43a. Lista TOP500, al 2
Pos Rmax
Nombre
. Rpeak
(Pflops)
Computadora
tipo de procesador,
interconexin
Vendedor
Sitio
Pas, ao
33,86
3
Tianhe-2
54,90
2
NUDT
Xeon E52692 + Xeon Phi31S1P,
TH Express-2
NUDT
National Supercomputing
Center in Guangzhou
China, 2013
17,59
0
Titan
27,113
Cray XK7
Opteron 6274 + Tesla K20X, Cray
Gemini Interconnect
Cray Inc.
Oak Ridge National Labo

Estados Unidos, 201
17,17
3
Sequoia
20,13
3
Blue Gene/Q
PowerPC A2, propia
IBM
Lawrence Livermore Nat

Laboratory
Estados Unidos, 201
10,51
K
0
computer
11,280
RIKEN
SPARC64 VIIIfx, Tofu
Fujitsu
RIKEN
Japn, 2011
La siguiente tabla muestra las 10 primeras posiciones del la 43a. Lista TOP500, al 2
Pos Rmax
Nombre
. Rpeak
(Pflops)
8,586
10,06 Mira
6
Computadora
tipo de procesador,
interconexin
Blue Gene/Q
PowerPC A2, propia
Vendedor
IBM
Sitio
Pas, ao
Argonne National Labora

Estados Unidos, 201

Conceptos Avanzados SOD

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Conceptos Avanzados SOD

Uploaded by

Copyright:

Available Formats

Operaciones de coma flotante por

el rendimiento del equipo

petaFLOPS (PFLOPS, 10 FLOPS), exaFLOPS (EFLOPS, 10 FLOPS).

La primera supercomputadora, Cray-1 fue puesta en marcha en el Laboratorio Nacional

FLOPS como medida de rendimiento

FLOPS, GPU y consolas de videojuegos,

Simulaciones de fenmenos naturales altamente precisas (huracanes, terremotos,

Desdoblamiento de cadenas de ADN

Simulacin de explosiones nucleares

Universidad Nacional Autnoma de

AMD64 (AMD Opteron)

Mediante el uso de supercomputadoras, los investigadores modelan el clima

Los cientficos usan supercomputadoras para simular de qu manera un tsunami

Las supercomputadoras se utilizan para simular explosiones de supernovas en el

Las supercomputadoras se utilizan para probar la aerodinmica de los ms

Las supercomputadoras se estn utilizando para modelar cmo se doblan las

Las supercomputadoras se utilizan para modelar explosiones nucleares, limitando

El hercio, hertzio o hertz (smbolo Hz), es la unidad de frecuencia del Sistema

kc/s (kilociclos por segundo),

El trmino "ciclo por segundo" fue completamente reemplazado por hercio en

Oak Ridge National Labo

Lawrence Livermore Nat

Argonne National Labora

You might also like