Professional Documents
Culture Documents
Relacionesobtenidasentrelostiempossecuencialesparalostrestiposdemquinasquecomponen
RIN
TamaoProblema
(matriz)
PROBLEMA 1. ( xx ptos).
Filas
700
1000
1500
2000
Un conjunto de programas para evaluar el desempeo de los computadores denominado ABC contiene 85.025
operacionesenpuntoflotanteyposeelassiguientescaractersticasdeperformance:
Noincluyelasoperacionesen
puntoflotanterealizadasencada
llamadaalassiguientes
funciones
Funcin
N
de
invocaciones
(veces)
arcotangente 680
680
seno
2020
coseno
razcuadrada 990
990
exponencial
990
logaritmo
TOTAL
6.350
Descomposicindelasoperacionesbsicas
paraunaiteracin(sinincluiroperacionesen
puntoflotantepararealizarlasfunciones
anteriores).
Funcin
Suma
Resta
Multiplicacin
Divisin
Conversin
(entero a punto
flotante)
TOTAL
N de operaciones
bsicas por iteracin
(veces)
44.820
4.200
27.350
13.610
5.020
Ndeoperacionesenpuntoflotantenecesariaspara
realizarlasfuncionesarcotangente,seno,coseno,
razcuadrada,exponencialylogaritmo
Funcin
95.000
N de operaciones
bsicas
por
iteracin(veces)
Suma
86.170
Resta
8.650
76.930
Multiplicacin
22.490
Divisin
Conversin (entero a punto 6.310
flotante)
4.950
Comparacin
TOTAL
205.500
ElconjuntodeprogramasseejecutenunprocesadorXYZquecorrea2.500MHz,eincluyeuncoprocesadorde
puntoflotante(suponerqueelcoprocesadornoincluyearcotangente,seno,coseno,razcuadrada,exponencialy
logaritmocomoinstrucciones).
Elcompiladorutilizadopermitequeelpuntoflotantesecalculeconelcoprocesadoroutilizandorutinassoftware
dependiendodelosparmetrosdelcompilador.Unaiteracindelconjuntodeprogramasnecesita1.08segundos
utilizandoelcoprocesador,y13.6utilizandoelsoftware.SuponerquealmedirelCPIutilizandoelcoprocesadorse
obtuvounamedidade10,mientrasqueutilizandoelsoftwarelamedidafuede6.
a)CuleslaestimacinenMIPS(nativos)paraambasejecuciones?
b)Culeselnmerototaldeinstruccionesejecutadasenambasejecuciones?
c) En promedio, cuntas instrucciones enteras se necesitan para realizar cada operacin de punto flotante en
software?
PROBLEMA 2. ( xx ptos).
L/R
4.89
5.03
4.85
3.94
I/R
1.63
3.01
2.99
3.70
L/I
3.00
3.01
1.62
1.06
Nota:Tamaosdeproblemas:lentas/rpidas(L/R),intermedias/
rpidas(I/R)ylentas/intermedias(L/I).
Sepide:
DeterminelaPotenciadecmputo(PotenciaComputacional)decadaunodelosgruposdeprocesadores.
Nota:Lapotenciacomputacionaltotaldeunsistemaheterogneo,compuestoporpprocesadores(CPt(p)),
puededefinirsecomolasumadelapotenciacomputacionaldetodoslospprocesadorespi,i:1..p,
que componen el sistema. Este parmetro refleja la cantidad de trabajo que puede realizar el
sistemaenunaunidaddetiempo,alejecutarunalgoritmoespecfico.
PROBLEMA 3. ( xx ptos).
Considerequecuentaconunaplataformacomputacionalheterogneacompuestapor8procesadoresp0...p7, dondep0
tienelamayorpotenciadecmputo,p1...p4tienenun75%delamismayp5...p7un50%delapotenciadep0:
a. Determinelapotenciadecmputorelativa(pcr)decadaunodelosprocesadores(p0ap8).
b. Determinelapotenciadecmputototal(pct).
c. Sealeculeslapotenciadecmputototalalcanzable(Sopt)delaarquitecturaparalelacompuestaporlos8
procesadores,sabiendoqueelSpeedlogradoes4,0.
d. Determinelaeficienciadelsistemaparalelo.
e. UnadelosprincipalesmotivosquedecrementanelrendimientodeunSistemaParaleloeselocioproducidoen
los procesadores. Esto ocurre principalmente cuando el trabajo a realizar no est distribuido equitativamente
(en cuanto a tiempo de ejecucin y no en cuanto a cantidad de trabajo) entre los diferentes elementos de
procesamientoqueformanlaarquitecturaparalela.Unamtricaimportanteparaanalizarelcomportamientoen
esteaspectodeunsistemaparaleloeseldesbalancedecarga(D)entrelosprocesadoresqueintervienen.Este
valorsecalculacomoladiferenciadeltiempodecmputodedicadoaresolvereseproblemaporlosdiferentes
elementosdeprocesamiento(Ti).
Considerando una distribucin homognea de trabajo a los procesadores componentes de la plataforma
computacional(seledaigualvolumendetrabajoalos8procesadores),determineelDesbalancedeCarga(D)
delaplataforma{D=((MaxTi)MinTi)/(promedioTi),dondeTcorrespondealtiempodecmputodelprocesoi.
f. Culeselniveldebalancedelsistemaparalelo?
PROBLEMA 4. ( x ptos).
Considere una plataforma heterognea (HN) compuesta por un conjunto de procesadores disponibles en un
sistema(sistemaP,conP=14)yformadoporlossiguientesgruposdemquinas(clusters):
ElprimergrupoestcompuestoporunamquinadememoriacompartidaconcuatroprocesadoresIntel
(R)XeonTMde1.40GHzcon3Gbdememoria.Losprocesadoresqueformanestamquinaseidentifican
comomquinasrpidas(R).
El segundo grupo de mquinas lo forman cuatro PCs AMD DuronTM de 800 MHz con 256 MB de
memoria.Estasmquinasseidentificanmquinasintermedias(I).
Elltimogrupo,lasmquinaslentas(L),estformadoporseisPCsAMDK6TMde501MHzcon256MB
dememoria.
Todas las mquinas de estos tres grupos trabajan con el sistema operativo Debian Linux y estn conectadas
medianteunswitchFastEtherneta100Mbit/senunesquemadebusformandolareddeinterconexinRIN.En
esta plataforma se considera la heterogeneidad debida a diferencias en las velocidades de cmputo de los
procesadoresyalasdiferenciasenlasvelocidadesdecomunicacin(asumaquelaheterogeneidaddebidaalas
diferenciasenlascapacidadesdememorianoseconsideraencuenta).
Antecedentes:
OMV
Columnas
700
1000
1500
2000
ElobservatoriodelcerroLasTurquesasseconstruyhace12mesesysecaracterizaportomarunagrancantidad
deimgenesalespacioparadetectarelementosenmovimientos.
Esteseencuentraaunaalturade2.264metrosdealturaypertenecealospasesdeSurinamyEtiopa.
La estrategia de observacin consiste en captar 'tiras' del firmamento al menos tres veces con un tiempo de
retardoqueoscilaentre10y20minutosdeunatiraalasiguiente.
Las imgenes se adquieren primero sin filtro alguno y con tiempos de exposicin que van de los 0 a los 180
segundos.
Trasunaprimerafasedepreprocesodelasimgenes(queseencargadelaeliminacindemalospixeles,camposplanos
ydesviacin)elprocesorealdeanlisisdeimgenessedesarrollaparadetectarobjetosenmovimiento.
Un primer paso del anlisis de imagen es la determinacin de coordenadas y la identificacin de los objetos
observados. A continuacin se desarrolla una segunda fase, con vistas a detectar objetos en movimiento. Este
proceso es automtico pero requiere confirmacin humana, dado que la deteccin automtica, a menudo,
encuentraobjetosfalsosenmovimiento(objetosqueenrealidaddeberanserpixeles'hot',porejemplo).
Otra operacin til que se hace a veces es el 'parpadeo visual', consistente en hacer fluctuar a las imgenes
quietas como en una tira de pelcula. De esta forma, las estrellas del fondo permanecen quietas y se pueden
OMV
visualizarotrosobjetosenmovimiento.Graciasaestaoperacinesposibleincrementarhastaun20%elnmero
deobjetosmvilesencontradosenuncampodevisin.
Actualmenteelprocesodeanlisisserealizaenformasecuencialysedemora200minutosaproximadamente.
Como el tiempo de todo el proceso es muy alto, se est evaluando cambiar los computadores por
multiprocesadoresomulticomputadoresloscualesdeberandisminuireltiempodeejecucin.
Seharecibidoofertasdecuatroalternativaspararealizarlaconexindelosprocesadores:
Alternativaspararealizarlainterconexindelosprocesadores
16procesadoresconectadosporunareddeMallaBidimensional.
15procesadoresconectadosporunaredenformaderbolBinario.
16procesadoresconectadosporunaredHipercubo.
16procesadoresconectadosporunaredShuffleExchange.
Tiempodeejecucin
(minutos)
100
110
90
130
Dado las caractersticas del trabajo que se realiza con las imgenes, con apoyo de software altamente
especializado,senecesitagranrapidezenelprocesamiento,dadoquemientrasmsavanzalatecnologa,mayor
eslafacilidaddeencontrarnuevosastrosymsancuandoestnenmovimiento.
LosdirectivosdelObservatoriodeseansaberculdelas4alternativaselegiryleencarganlatareadeasesorarlos
(Analiceelproblemaytcnicamentedeterminelaalternativamsatractiva).
PROBLEMA 5. ( xx ptos).
Considerelasiguientetabladeindicadoresdedesempeo
paracadaunodelosalgoritmo(Ai,i=1,4)
1 Qu algoritmo es mejor (A1, A2, A3 A4)?.
Fundamente.
2EselTiempodeejecucinunamtricasignificativa?.
Fundamente.
3Hayalgnalgoritmoptimoencosto?.Demuestre.
PROBLEMA 6. ( xx ptos).
Considereunalgoritmodeordenamientoqueposeeuntiempodeejecucinserialde:
Ts(n)=O(nlgn).
Siunalgoritmodeordenamientodetipoparaleloutilizan/2procesadoresyposeeuntiempode
ejecucinsobrepprocesadoresdeTp(n)=O(n).
Determinesielalgoritmoparalelodeordenamientoesmseficiente?(Fundamentesurespuesta).
OMV