Professional Documents
Culture Documents
3.1. Introducción
Hasta el momento se han revisado algunas métricas para la obtención del rendimiento
(segundos, ciclos, instrucciones). También el concepto de abstracción y en particular se
hizo énfasis en la abstracción que vincula al hardware con el software de más bajo nivel, a
esta abstracción se le denomina: Arquitectura del repertorio de instrucciones o
simplemente Arquitectura de Computadoras.
Esta sección inicia con la implementación del hardware, en particular en esta unidad se
revisa la aritmética de las computadoras, para obtener una Unidad Aritmético Lógica
enfocada al repertorio de instrucciones previamente estudiando. Además, se describe el
mecanismo para realizar multiplicaciones y divisiones con base en esta ALU.
Los humanos preferimos representar a los números en base 10, sin embargo para las
computadoras lo más adecuado es utilizar el sistema binario (base 2).
Si para una secuencia de dígitos en cualquier base numérica, se quiere obtener su valor en
base 10, debe multiplicarse cada dígito por la base elevada a la posición del dígito dentro
del número, de manera que su valor sería
d x basei
Sin embargo los números en MIPS utilizan 32 bits, por lo que el número 1011dos, quedaría
representado como:
31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 1
(32 bits de ancho)
1
Los números se representan colocando al dígito menos significativo a la derecha (posición
0) y al más significativo a la izquierda (posición 31).
Con 32 bits se pueden representar 232 números diferentes, desde el número 0 hasta el 232 – 1
(4, 294, 967, 295diez) :
Los patrones de bits contienen una representación de los números, en realidad el conjunto
de números es infinito; solo que es necesario tener una representación para poder operarlos
aritméticamente a través de sumas, restas, productos, etc. Puede ocurrir que el resultado de
una operación no alcance en los 32 bits dedicados a cada número, cuando eso ocurre, se
generará una señal de sobreflujo (overflow), y el sistema operativo o el programa
determinarán lo que deben hacer.
Una solución obvia consiste en dedicar uno de los bits para que determine el signo, dejando
31 bits para la magnitud. A esta representación se le conoce como magnitud y signo, tiene
diferentes inconvenientes. En principio, para la ubicación del signo existen dos
posibilidades, derecha o izquierda de la magnitud. Luego, el hardware requerirá de un paso
extra para la evaluación del signo y la determinación anticipada del signo del resultado.
Finalmente, se contaría con dos representaciones para el cero, lo cual se refleja en la
programación, por ejemplo, si un ciclo repetitivo terminará cuando una variable alcance el
valor de cero, será necesaria una doble comparación. Debido a estos inconvenientes, la idea
de representar a los números usando magnitud y signo no es utilizada.
Otra alternativa es el complemento de los números positivos para obtener el negativo que le
corresponde (complemento 1), esta representación tiene la ventaja de que la clasificación de
los números es bastante simple, un número positivo tendrá un cero en su bit mas
significativo y un número negativo tendrá un uno. Además, al sumar un número con su
correspondiente negativo, se tendrá una cadena de 1’s que corresponderá al 0 (0 negativo).
Pero se mantiene la desventaja de contar con dos representaciones para el cero.
La mitad de los números, del 0 al 2, 147, 483, 645diez (231 – 1), usa la representación
mostrada anteriormente (cuando no se había considerado el signo). El siguiente patrón
(1000. . .000dos) representa al número mas negativo (- 2, 147, 483, 648diez) y es seguido por
un conjunto decreciente de números negativos: - 2, 147, 483, 647diez (1000. . .0001 dos) hasta
el –1 (1111. . .1111 dos).
Esta representación no está balanceada por que el número - 2, 147, 483, 648diez no tiene un
número positivo correspondiente. Este hecho podría preocupar a los desarrolladores de
software, en contraparte con la representación de magnitud y signo que también
preocuparía a los desarrolladores de hardware.
El hecho de que el bit más significativo indique el signo del número, hace que este bit se
comporte como un auténtico bit de signo, de manera que si se quiere obtener el valor en
base 10 de cualquier número representado en complemento a 2, el bit de la posición 31 se
deberá multiplicar por –231 y los restantes 31 bits seguirán el mismo tratamiento que los
números sin signo (su valor lo obtendrán de acuerdo con su posición).
3
Respuesta:
Las comparaciones tratan con esta dicotomía, si un número tiene un 1 en su bit más
significativo y es tratado en complemento a 2, será un número negativo y por lo tanto será
menor que todos aquellos que tengan 0 en su bit más significativo. Pero si el mismo
número es interpretado como entero sin signo, será mayor que todos aquellos que tengan 0
en su bit más significativo. Esta situación debe resolverse a nivel de hardware.
¿Cuáles son los valores de los registros $t0 y $t1 después de las instrucciones?
slt $t0, $s0, $s1
sltu $t1, $s0, $s1
4
Respuesta:
Para la instrucciones slt los números se consideran en complemento 2, de manera que $s0
tiene un número negativo (-1), que es menor al número 1 contenido en $s1, por lo que $t0
tendrá 1.
Pero para la instrucciones sltu los números son tratados sin signo, entonces $s0 tiene al
número positivo 4, 294, 967, 295diez, que definitivamente es mayor que 1, entonces $t1
tendrá 0.
- x = x’ + 1
que nos indica que el negado de un número es igual al complemento del mismo mas 1.
Ejemplo: Negación.
Respuesta:
2diez = 0000 0000 0000 0000 0000 0000 0000 0010dos
En la otra dirección:
- 2diez = 1111 1111 1111 1111 1111 1111 1111 1110 dos
5
Otro aspecto a considerar es el tamaño de las constantes. El repertorio MIPS incluye
instrucciones que manejan constantes de 16 bits, cuando estas constantes son operadas en
una ALU de 32 bits, deben completarse con otros 16 bits. Si se trabajan números en
complemento a 2, su valor dependerá del bit más significativo de la constante (el bit 15).
Si este bit es 0 se completa con 0’s y la magnitud se conserva (los 0’s a la derecha no tienen
valor). Si se trata de un 1, para conservar la magnitud habrá que completar con 1’s.
Finalmente, aunque las computadoras trabajan en binario, resulta más fácil utilizar al
sistema octal o al hexadecimal para la representación y manipulación de los números, esto
porque la cantidad de símbolos existentes en estas bases corresponde a una cantidad exacta
de combinaciones de 3 y 4 bits respectivamente. Las bases octal y hexadecimal pueden
considerarse como una forma abreviada de representar a los números en binario, un dígito
en octal corresponde con 3 bits y un dígito en hexadecimal con 4. Y viceversa, por cada 3
bits puede obtenerse un dígito octal y por cada 4 uno hexadecimal.
3.3.Suma y resta
Las sumas en binario se realizan de la misma manera que en base 10, es decir, de derecha a
izquierda se va sumando dígito a dígito y si el resultado es mayor al dígito más grande (9 en
base 10 y 1 en base 2), se produce un acarreo que debe sumarse en el dígito siguiente.
Entonces, al sumar dos bits debe tomarse en cuenta un posible acarreo en la entrada o bien
la generación de un acarreo en la salida. En la tabla 3.1 se muestran todas las posibles
combinaciones que pueden ocurrir al sumar un dígito a con un dígito b, el resultado de la
suma se coloca en el dígito s, también se considera la presencia de un acarreo en la entrada
y la generación de un acarreo de salida.
a b cin s cout
0 0 0 0 0
0 0 1 1 0
0 1 0 1 0
0 1 1 0 1
1 0 0 1 0
1 0 1 0 1
1 1 0 0 1
1 1 1 1 1
Tabla 3.1 Comportamiento de la suma
Al sumar dos palabras de 32 bits, solo se va aplicando la tabla de derecha a izquierda, y los
acarreos generados se suman al siguiente bit más significativo:
6
La resta también podría realizarse de derecha a izquierda, bit a bit, considerando que
algunas veces será necesario “tomar prestado un 1 del dígito más significativo”, cuando el
minuendo es menor que el sustraendo. Sin embargo, a nivel de hardware esto es complejo,
lo más simple es obtener la versión negativa del número a restar, y después realizar una
suma.
Respuesta:
0000 0000 0000 0000 0000 0000 0010 0101dos = 37diez
+ 0000 0000 0000 0000 0000 0000 0010 1101dos = 45diez
= 0000 0000 0000 0000 0000 0000 0101 0010 dos = 82diez
El 1 que aparece más a la izquierda se ignora, por que el resultado debe quedar en 32 bits,
no es un sobreflujo o desbordamiento.
7
Debe contemplarse el hecho de ignorar el sobreflujo en algunos casos y reconocerlo en
otros. La solución para MIPS es contar con dos clases de instrucciones aritméticas para
reconocer estas dos posibilidades:
La suma (add), la suma inmediata (addi) y la resta (sub) producen una excepción si
ocurre un sobreflujo.
La suma sin signo (addu) , la suma inmediata sin signo (addiu) y la resta sin signo
(subu) no producen excepciones debidas a los sobreflujos.
Puesto que en el lenguaje C se ignoran los desbordamientos, los compiladores para MIPS
siempre generarán las versiones sin signo de las instrucciones aritméticas addu, addiu y
subu no importa el tipo de las variables. Los compiladores MIPS de Fortran, sin embargo,
seleccionan las instrucciones aritméticas apropiadas, dependiendo del tipo de operando.
Un sobreflujo en MIPS producirá una excepción, algunas veces también conocida como
interrupción. Una excepción o interrupción es esencialmente una llamada no proyectada a
un procedimiento. La dirección de la instrucción en la que ocurrió el sobreflujo es
almacenada en un registro, y se produce un salto a una dirección predefinida para invocar al
procedimiento encargado de manejar la excepción. La dirección en la que ocurrió la
excepción se salva de manera que sea posible continuar con la ejecución del programa
después de ejecutar algún código correctivo.
En MIPS se incluye a un registro llamado contador del programa para las excepciones
(EPC) el cual contendrá la dirección de la instrucción que ocasionó la excepción. También
se cuenta con la instrucción mover desde el control del sistema (mfc0) que sirve para copiar
el contenido del registro EPC en un registro de propósito general de manera que el software
tiene la opción de regresar a la instrucción infractora a través de un salto a registro.
Aunque las primeras computadoras se centralizaron sobre palabras completas, pronto llego
a ser claro que es útil operar sobre campos de bits dentro de una palabra o aún sobre los bits
individuales. Un ejemplo lo encontramos al manipular caracteres dentro de una palabra,
debido a que cada carácter utiliza ocho bits, se observa que se requiere de instrucciones por
medio de las cuales sea posible empaquetar y desempaquetar los bits dentro de las palabras.
Una clase de estas operaciones son los desplazamientos (shifts). Con ellos se mueven todos
los bits de una palabra a la izquierda o derecha, llenando los bits vacíos con 0s. Por
ejemplo, si el registro $s0 contiene
op rs rt rd shamt funct
0 0 16 8 8 0
Otras operaciones útiles son la AND y la OR, estas operaciones se aplican bit a bit.
La AND es comúnmente utilizada para aplicar una máscara a un registro, puesto que la
AND va a colocar un 1 en el bit resultante si los dos bits sobre los que se aplica tienen 1s.
La máscara se realiza colocando 1s en aquellas posiciones que se quiera dejar pasar, y 0s en
los bits que se van a eliminar (contendrán 0s).
Por ejemplo, si el registro $t0 contiene: 1010 0011 0011 1001 1100 1100 1110 1101dos
y si el registro $t1 contiene: 0000 0000 1111 1111 1111 1111 0000 0000dos
El registro $t1 está funcionando como una máscara que deja pasar los 16 bits intermedios y
oculta al resto.
El resultado en $t2 será: 0000 0000 0011 1001 1100 1100 0000 0000dos
En el caso de la OR, en el resultado se obtendrá un 1 si alguno de los bits sobre los que se
aplica tiene 1.
dejará en $t2: 1010 0011 1111 1111 1111 1111 1110 1101dos
9
En la tabla 3.3 se muestran las operaciones lógicas y su correspondiente instrucción MIPS.
Debido a que las constantes también son utilizadas en operaciones lógicas, se incluyen
versiones inmediatas para la AND y la OR.
El siguiente código C ubica tres campos dentro de una palabra etiquetada receiver: Un
campo de 1 bit denominado ready, un campo de un bit denominado enable, y un campo de
8 bits denominado receivedByte. Se copia receivedByte dentro de data, se ajusta ready a 0,
y se ajusta enable a 1.
int data;
struct {
unsigned int ready: 1;
unsigned int enable: 1;
unsigned int receivedByte: 8;
} receiver;
...
data = receiver.receivedByte;
receiver.ready = 0;
receiver.enable = 1;
¿Cuál es el correspondiente código MIPS? Suponga que data y receiver están ubicados en
$s0 y $s1.
Respuesta:
31 ..... 10 9 2 1 0
receivedByte enable ready
10
Copia el campo de 8 bits (receivedByte) a data y lo aísla:
slr $s0, $s1, 2 # Se desplaza y copia en data
andi $s0, $s0, 0x00ff # Se usa una máscara que elimina la información
# no deseada
Las instrucciones addi y ori trabajan con números con signos, de manera que para poder
operar en una ALU de 32 bits, las constantes se extienden a 32 bits extendiendo el bit de
signo.
Fig. 3.1 Los cuatro componentes en los que se fundamentará la construcción de la ALU
11
Debido a que MIPS trabaja con palabras de 32 bits, la ALU a construir deberá contar con
operandos de 32 bits. Para ello, primero se realizará el diseño de una ALU de 1 bit, para
después utilizar 32 bloques basados en esa ALU de 1 bit.
ALU de 1 Bit
Una unidad lógica con las operaciones AND y OR se muestra en la figura 3.2, para las
entradas a y b es posible seleccionar una operación lógica por medio de la entrada de
operación en el multiplexor, si operación es igual a 0, en la salida tendremos a AND b, pero
si operación es igual con 1, la salida tendrá a OR b.
En el sumador, tanto la salida sum como la salida CarryOut se producen por dos circuitos
combinacionales. Como ejemplo se revisará al circuito correspondiente a CarryOut. La
señal CarryOut es verdadera en 4 ocasiones, que tomaremos de la tabla 3.1, para mostrarlas
en la tabla 3.4:
a b CarryIn CarryOut
0 1 1 1
1 0 1 1
1 1 0 1
1 1 1 1
Tabla 3.4 Comportamiento de CarryOut
12
CarryOut = (bCarryIn) + (aCarryIn) + (ab) + (abCarryIn)
Esta expresión requiere de una compuerta OR de tres entradas y 3 compuertas AND de dos
entradas, su implementación es:
Fig. 3.5 ALU de 1 bit, capaz de realizar las operaciones AND, OR y ADD.
13
ALU de 32 Bits
El bloque mostrado en la figura 3.5 puede repetirse 32 veces para la construcción de una
ALU de 32 bits, la señal de acarreo generada en el bloque i va a corresponder al acarreo de
entrada en el bloque i + 1. Esta forma de conectar las señales de acarreo nos produce un
sumador poco eficiente conocido como Sumador de acarreo extendido (ripple carry
adder). Más adelante se muestra otra técnica en la que se buscará generar al acarreo de
manera más rápida. Todos los bloques comparten las señales de operación.
Fig. 3.6 ALU de 32 bits, capaz de realizar las operaciones AND, OR y ADD.
La resta equivale a la suma con el negado del segundo operando, así es como el hardware
realiza las restas. De manera que para realizar una resta se sumará el complemento a 2 del
segundo operando. Para eso es necesario un inversor con el que se obtenga el complemento
y un multiplexor para seleccionar entre el operando o su complemento. En la figura 3.7 se
muestra al inversor que se agrega para obtener el complemento de b. Pero además es
14
necesario sumar 1, esto simplemente se hace colocando 1 al acarreo de entrada del bit
menos significativo.
Fig. 3.7 ALU de 1 bit, con la entrada Binvert se selecciona entre b y su complemento.
Otra instrucción importante que se incorpora en MIPS es slt (set on less than), esta
instrucción requiere de tres argumentos (slt reg1, reg2, reg3) y coloca un 1 en reg1 si
resulta que reg2 es menor que reg3. Reg1 = 1 si reg2 < reg3, que es equivalente a reg2 -
reg3 < 0. Lo que indica que una buena opción para la comparación consiste en realizar la
resta reg2 – reg3 y luego evaluar el resultado; en el resultado no importa la magnitud, lo
que importa es saber si es o no menor que 0, lo cual queda directamente determinado por el
bit más significativo. Si el bit más significativo tiene 1, el resultado de la operación slt
deberá ser 1, y si es 0 el resultado deberá ser 0.
La instrucción slt es otra operación para la ALU, de manera que el multiplexor de la salida
deberá incrementarse con una entrada más. Estas ideas se muestran en la figura 3.8, en
donde el multiplexor se ha incrementado y la nueva entrada se incorpora desde fuera del
bloque de la ALU (la entrada etiquetada como less) (fig. 3.8 a). Sin embargo para el bit 31
(el más significativo) se genera una salida (etiquetada como set) que corresponde al bit de
signo del resultado (fig. 3.8 b). Esta salida se retroalimentará a la entrada less del bit 0,
mientras que para los otros bits (del 1 al 31), la entrada less estará conectada directamente a
tierra, para que mantenga un cero en forma permanente. En la figura 3.9 se muestra la
retroalimentación de set a la entrada less del bit menos significativo, así como los 0’s en las
demás entradas less.
Otra idea interesante que se presenta en la figura 3.8 (b) es la presencia de la unidad de
detección de sobreflujo, el objetivo de este bloque es generar una bandera (señal de 1 bit)
que indique la existencia de un sobreflujo, para ello es necesario conocer los signos de los
operandos ( a31 y b31 ), el tipo de operación (Binvert), el signo del resultado y tal vez la
existencia de un acarreo en el bit más significativo. El comportamiento de este circuito
puede basarse en el comportamiento de la suma descrito en la tabla 3.2.
15
Binvert Operation
CarryIn
a
0
Result
b 0 2
Less 3
a. CarryOut
Binvert Operation
CarryIn
a
0
Result
b 0 2
Less 3
Set
Overflow
Overflow
detection
b.
Fig. 3.8 El valor del bit más significativo se usará para la instrucción slt,
en a) se muestra la estructura de los 31 bits menos significativos y
en b) la estructura del bit más significativo
En la figura 3.9 se muestra la conexión de las 32 ALUs de 1 bits, las primeras 31 tienen la
misma construcción, la última difiere un poco por la presencia de la unidad de detección de
sobreflujo y porque de ahí se toma la salida set que se retroalimenta al bit 0.
16
Binvert CarryIn Operation
a0 CarryIn
b0 ALU0 Result0
Less
CarryOut
a1 CarryIn
b1 ALU1 Result1
0 Less
CarryOut
a2 CarryIn
b2 ALU2 Result2
0 Less
CarryOut
CarryIn
Fig. 3.9 ALU de 32 Bits, capaz de realizar sumas, restas, AND, OR y slt.
También puede indicar la existencia de un sobreflujo.
El acarreo de entrada sólo se ocupa para las restas, y su comportamiento es el mismo que el
de la entrada Binvert, si la entrada Binvert tiene 1, indica que se realizará una resta, y para
la obtención correcta del complemento 2, debe sumarse 1 con la entrada CarriIn del
sumador de los bits menos significativos. Si la entrada de Binvert es 0, se trata de una suma
y la entrada CarryIn deberá tener 0. Por lo tanto, las entradas Binvert y CarryIn pueden
conectarse en una sola, a la cual se llamará Bnegado como se muestra en la figura 3.10.
17
Fig. 3.10 ALU de 32 Bits, capaz de realizar sumas, restas, AND, OR y slt.
Con banderas de zero y de sobreflujo.
La ALU de la figura 3.10 tiene 3 líneas de control, concatenando la entrada Bnegado con
las entradas de operación, el comportamiento de la ALU se resume en la tabla 3.5.
La ALU se representa con su símbolo tradicional en la figura 3.11, las entradas a y b son de
32 bits, la entrada ALU Operación es de 3 bits, la salida Result es de 32 bits, y las salidas
Zero, Overflow y CarryOut son todas de 1 bit.
18
Fig. 3.10 ALU de 32 Bits, cuyo comportamiento se describe en la tabla 3.5
Existe una variedad de esquemas que permiten la generación anticipada del acarreo, estos
esquemas son más rápidos que el acarreo extendido por que viajan por menos compuertas.
Algunos resultados aceptables producen el acarreo en un orden log2 del número de bits a
sumar.
De acuerdo con los principios del álgebra Booleana, cualquier función se puede expresar
como una suma de productos, o como un producto de sumas, por lo que para su
implementación en ambos casos, requeriría de dos niveles de compuertas.
Usando solo c en lugar de CarryIn, podemos rescribir las dos expresiones anteriores como:
19
c2 = (b1c1) + (a1c1) + (a1b1)
c1 = (b0c0) + (a0c0) + (a0b0)
Esta expresión es sólo para el 2º bit, pero la ecuación crece exponencialmente con el
número de bits, de manera que si se pretende usar este esquema, el costo de la
implementación de la unidad de anticipación de acarreo, debido a su gran número de
compuertas, será mayor que el costo del resto de la ALU.
ci+1 = gi + pici
Esta expresión indica que habrá un acarreo a la salida del bloque i, si éste fue generado
dentro del bloque o si este ya existía (en ci) y se dieron las condiciones para su
propagación. Con estas definiciones de generación y propagación, es posible obtener de
manera simplificada los 4 primeros acarreos:
c1 = g0 + (p0c0)
c2 = g1 + (p1 g0) + (p1p0c0)
c3 = g2 + (p2g1) + (p2p1g0) + (p2p1p0c0)
c4 = g3 + (p3g2) + (p3p2g1) + (p3p2p1g0) + (p3p2p1p0c0)
20
Estas ecuaciones representan el sentido común: Existe acarreo si algún sumador cercano lo
generó y todos los sumadores intermedios lo propagaron. Una analogía con una tubería de
agua se muestra en la figura 3.11 para dar claridad a estas ideas.
Fig. 3.11 Una tubería como analogía para mostrar la anticipación del acarreo para 1 bit, 2 bits y 4 bits.
El acarreo va a existir (existirá agua en la salida) si fue generado (se abrió alguna de las llaves g), o si existía
un acarreo inicial y se dieron las condiciones para su propagación (todas las llaves p se abrieron).
Con las ecuaciones anteriores se demuestra que con un poco más de Hardware es posible
generar acarreos rápidos para sumadores de 4 bits. Al conectar 4 sumadores como bloques
de un Sumador de acarreo extendido, se tendrá un sumador de 16 bits más rápido que si el
acarreo se arrastrase por los 16 bits.
Para mejorarlo aún más, es posible usar este esquema en un nivel más alto. Para obtener el
acarreo anticipado en sumadores de 4 bits, es necesario generar y propagar señales en este
nivel más alto. La propagación para bloques con sumadores de 4 bits será posible si todos
los bits dentro de un bloque la hacen posible, esto es:
21
P0 = p3p2p1p0
P1 = p7p6p5p4
P2 = p11p10p9p8
P3 = p15p14p13p12
Para la generación debe considerarse que será verdadera si se generó en el bit más
significativo, o si se generó en uno de los bits inferiores al más significativo, y durante las
etapas intermedias se realizó su propagación.
Cada Gi representa una “súper” generación en un sumador de 4 bits. Una analogía con una
tubería, para estas nuevas versiones de generación y propagación, se muestra en la figura
3.12 para dar claridad a estas ideas.
Fig. 3.12 La tubería como analogía para mostrar la anticipación del acarreo, en otro nivel de abstracción. P0
estará abierto sólo si todas las pi ( i = 0 .. 3) están abiertas; además, fluirá agua en G0 si al menos una gi esta
abierta y las pi permiten su propagación.
Entonces, en un nivel de abstracción más alto, es posible escribir las ecuaciones de los
acarreos de salida de cada bloque de 4 bits.
C1 = G0 + (P0c0)
C2 = G1 + (P1 G0) + (P1P0c0)
C3 = G2 + (P2G1) + (P2P1G0) + (P2P1P0c0)
C4 = G3 + (P3G2) + (P3P2G1) + (P3P2P1G0) + (P3P2P1P0c0)
22
Estas ecuaciones son iguales a las versiones en minúsculas mostradas anteriormente,
excepto que cada Ci corresponde al acarreo de un bloque de 4 bits. En la figura 3.13 se
muestra un sumador de 16 bits (a bloques), resaltando el bloque por medio del cual se
procesan los acarreos de cada sumador de 4 bits, para generar el acarreo de los 16 bits.
Fig. 3.13 Se utilizan ALUs de 4 bits para anticipar el acarreo de un sumador de 16 bits.
Tarea 5
23
4. Encontrar la secuencia más corta de instrucciones MIPS para determinar si existió
acarreo de salida después de la suma de dos registros, supongamos que $t3 se sumó con
$t4 y el resultado se almacenó en $t5. Colocar 0 o 1 en $t2 el acarreo de salida es 0 o 1,
respectivamente (Sugerencia: Esto puede hacerse en dos instrucciones).
5. Dos amigos, Enrique y Beto están en desacuerdo. Enrique dice “Todos los enteros
mayores que cero y exactamente divisibles por 6 tienen exactamente dos 1s en su
representación binaria”. Beto no está de acuerdo, él dice “No, pero tales números tienen
un número par de 1s en su representación”. ¿Estás de acuerdo con Enrique, con Beto o
con ninguno de los dos?
Determinar los valores de gi, pi, Pi y Gi con los dos números y encuentre CarryOut14
(C4).
Práctica de laboratorio 2:
1. Desarrollar y simular en VHDL las ALU’s de 1 bit que se muestran en la figura 3.8 (a)
y (b).
2. Construir y simular en VHDL una ALU de 16 bits, con base en la figura 3.10.
3.6 Multiplicación
La multiplicación es una operación más complicada que la suma y que la resta. Para
entender cómo el hardware realiza esta operación, con base en la ALU desarrollada,
primero se revisa cómo se realiza esta operación de manera manual, recordando así los
nombres de los diferentes elementos que intervienen en la operación. Por ejemplo:
Multiplicando 1000
Multiplicador x 1001
1000
0000
0000
1000
Producto 1001000
Otra observación importante es que, sin importar la base numérica en la que se obtenga el
producto, al multiplicar un número de n-dígitos con otro de m-dígitos, el resultado puede
llegar a requerir, a lo mas, de n + m dígitos. En el caso de MIPS se multiplicarán dos
registros de 32 bits, de manera que el resultado puede requerir hasta de 64 bits para su
representación.
25
Fig. 3.15 Algoritmo para la multiplicación (primera versión)
Usando números de 4 bits, para reducir espacio, multiplicar 6diez x 3diez. (0110dos x 0011dos).
Respuesta:
26
1: 0 => No operación 0000 0001 1000 0001 0010
3 2: Desp. Mcando. a la izq. 0000 0011 0000 0001 0010
3: Desp. Mdor. a la der. 0000 0011 0000 0001 0010
1: 0 => No operación 0000 0011 0000 0001 0010
4 2: Desp. Mcando. a la izq. 0000 0110 0000 0001 0010
3: Desp. Mdor. a la der. 0000 0110 0000 0001 0010
La nueva versión para el hardware se muestra en la figura 3.16, mientras que en la figura
3.17 se muestra la nueva versión para el algoritmo. Se conservan las 32 iteraciones y los 3
pasos en cada iteración.
27
Fig. 3.17 Algoritmo para la multiplicación (segunda versión)
Respuesta:
28
1: 1 => prod = prod + mcando 0001 0110 1001 0000
2 2: Desp. Producto a la der. 0011 0110 0100 1000
3: Desp. Mdor. a la der. 0000 0110 0100 1000
1: 0 => No operación 0000 0110 0100 1000
3 2: Desp. Producto a la der. 0000 0110 0010 0100
3: Desp. Mdor. a la der. 0000 0110 0010 0100
1: 0 => No operación 0000 0110 0010 0100
4 2: Desp. Producto a la der. 0000 0110 0001 0010
3: Desp. Mdor. a la der. 0000 0110 0001 0010
En el hardware mostrado en la figura 3.16 pueden notarse que, el registro del multiplicador
y el registro del producto se desplazan a la derecha, y que cuando el algoritmo comienza no
importa lo que haya en la mitad derecha del registro del producto, por que se va a perder. Y
cuando el algoritmo termina, el registro del multiplicador queda con 0’s, es decir, su valor
se va perdiendo durante el desarrollo del algoritmo.
De manera que puede obtenerse una versión mejorada del hardware, si al comienzo del
algoritmo se coloca al multiplicador a la mitad derecha del producto. Con ello, además de
reducir los recursos, da pie a un algoritmo más rápido, por que en lugar de 2
desplazamientos sólo se realizará 1. En la figura 3.18 se muestra la versión final del
hardware para la multiplicación y en la figura 3.19 se muestra al algoritmo que desarrollará
el control en esta versión final. Puede notarse que en cada iteración se ha reducido a 2 el
número de pasos.
29
Fig. 3.19 Algoritmo para la multiplicación (versión final)
Respuesta:
En este caso la tabla sólo cuenta con una columna para el multiplicando y otra para el
producto:
30
1: 0 => No operación 0110 0010 0100
4
2: Desp. Producto a la der. 0110 0001 0010
Existen otros algoritmos que desde un principio consideran los signos de los operandos,
uno de ellos es el algoritmo de Booth.
3.7 División
1010 Cociente
Divisor 100 101011 Dividendo
- 100
101
- 100
11 Residuo
En una división entera el resultado quedará en dos registros, en uno de ellos se tendrá al
cociente y en el otro se tendrá al residuo o resto.
31
operación es manual, es posible determinar por inspección cuantos dígitos son necesarios
para que “alcance” el divisor en una parte del dividendo. Con hardware, la única manera
para determinar si alcanza un número en otro es por medio de una resta. Si después de
hacer la resta el resultado es mayor o igual que cero, efectivamente, alcanzó el divisor en
una parte del dividendo. Pero si el resultado es menor que cero, significa que no alcanzó el
divisor y habrá que restablecer el valor que el dividendo tenía antes de la resta.
32
Fig. 3.21 Algoritmo para la división (primera versión)
Usando números de 4 bits, para reducir espacio, dividir 7diez 2diez. (0111dos x 0010dos).
Respuesta:
Debido a que los números son de 4 bits, el algoritmo requerirá de 5 iteraciones, en la tabla
siguiente se muestran los pasos en cada iteración:
En cada iteración se subraya en el residuo al bit más significativo, porque este bit determina
si se continuará con el paso 2a o con el paso 2b (indica si el resultado de la resta es mayor o
menor que cero).
Observando a la figura 3.20 y analizando con detalle el desarrollo del algoritmo, puede
notarse que la parte significativa de la resta es de 32 bits, por que en los otros 32 se están
restando 0’s, por lo que la ALU que realiza las restas puede reducirse a 32 bits. Además, se
consigue el mismo resultado si en lugar de desplazar el divisor a la derecha, éste se
mantiene fijo y se desplaza al registro del residuo a la izquierda.
Debe recordarse que al comienzo del algoritmo, el registro del residuo deberá contener al
dividendo en sus 32 bits más a la derecha.
34
Fig. 3.22 Hardware para la división (segunda versión)
El hardware de la figura 3.22 puede mejorarse si se observa que tanto el registro del
cociente y el del residuo se desplazan a la izquierda; además, en cada desplazamiento que
realiza el registro del residuo, se introduce un 0 en el bit menos significativo, de manera
que cuando el algoritmo termina, el residuo queda en los 32 bits más significativos,
mientras que los 32 bits menos significativos quedan llenos de 0’s.
Entonces, el hardware puede modificarse de manera que los bits que se introduzcan sean
los que correspondan al cociente, con ello, además de reducir un poco los recursos de
hardware, produce un algoritmo más rápido, puesto que en lugar de realizar dos
desplazamientos, sólo se realizará 1. Al final del algoritmo, en un registro de 64 bits se
tendrá al residuo (en los 32 bits más significativos) y al cociente (en los 32 bits menos
significativos).
En las figuras 3.23 y 3.24 se muestran la versión final del hardware y del algoritmo de la
división, respectivamente.
35
Fig. 3.23 Hardware para la división (versión final)
36
Ejemplo: Versión final del algoritmo de la división
Con la versión final del algoritmo, dividir 7diez 2diez. (0111dos x 0010dos).
Respuesta:
Con esta nueva versión sólo se requerirá de 4 iteraciones y en cada iteración se realizarán
dos pasos:
Después de las 4 iteraciones se desplaza a la izquierda la mitad izquierda del registro del
residuo. En los 4 bits menos significativos se tiene al cociente.
Los registros en los que se ubicará el resultado (en ambos casos) son conocidos como HI y
LO. Al realizar una multiplicación, HI contendrá la parte alta del producto y LO la parte
baja. En el caso de una división, HI quedará con el residuo, mientras que LO contendrá al
cociente.
Otros tipos de datos importantes son los números de punto flotante, los cuales son una
aproximación a los números reales. La mayoría de computadoras utilizan al estándar IEEE
754 el cual establece una representación de 32 bits para números en punto flotante en
simple precisión y 64 bits para números en punto flotante en doble precisión (MIPS no es la
excepción, también emplea ese formato).
El estándar IEEE 754 representa a los números en notación científica normalizada (en base
2). La versión normalizada deja un dígito a la izquierda del punto decimal y los dígitos
restantes se sitúan a la derecha; por ejemplo, el número: 0.000111, una vez normalizado es
37
1.11 x 2-4 y el número 11000000 al normalizarse queda como: 1.1 x 27, de manera que
cualquier número puede ser aproximado con una expresión de la forma:
1.xxxxxxdos x 2yyyyyy
Pero además, los números en punto flotante pueden ser positivos o negativos, de manera
que en la representación de un número debe considerarse un campo para el signo, un campo
para el exponente y otro para la mantisa. De los 32 bits que se disponen en simple
precisión, la distribución de los campos es:
31 30 29 28 . . . 24 23 22 21 20 19 . . . 3 2 1 0
signo Exponente Mantisa
1 bit 8 bits 23 bits
Se han dedicado 8 bits para el exponente, lo que significa que se tienen 256 combinaciones,
de las cuales deben considerarse algunas mayores y otras menores que cero, para
representar números muy pequeños y números muy grandes. Sin embargo y debido a que es
más fácil manipular números sin signo, las combinaciones se conservarán desde el valor 0
hasta el 255, y para obtener el valor representado, al valor del exponente se le restará un
número conocido como desplazamiento.
La mantisa corresponde a los dígitos que quedan a la derecha del punto decimal, después de
la normalización. La representación contiene un 1 que no se escribe por que todos los
números normalizados lo incluirán.
El valor del desplazamiento es de 127 para simple precisión, por lo que el número más
cercano al cero se obtiene con una cadena de 32 ceros (correspondería a 1 x 2 -127), y está en
el orden de 10-39. Por convención, esta combinación es interpretada como 0.0, puesto que
en simple precisión no es posible encontrar un número más cercano al 0.
El número más alejado del 0 se obtiene con una cadena de 1s (a excepción del bit de signo,
que puede tener 0). Esta combinación está en el orden de 1038, que aunque es un número
grande, difiere de lo que consideramos como infinito.
Las operaciones en punto flotante pueden producir resultados más pequeños (bajo flujo) o
resultados más grandes (sobre flujo) de los que se pueden representar, por lo que en
ocasiones será necesario contar con mas bits para la representación.
38
El estándar IEEE 754 incluye una representación de doble precisión, la cual utiliza 64 bits,
por lo que los tamaños de los campos crecen significativamente:
31 30 29 28 . . . 21 20 19 18 17 . . . 3 2 1 0
signo Exponente Mantisa
1 bit 8 bits 23 bits
31 30 29 28 . . . 3 2 1 0
Mantisa
32 bits
Para el campo del exponente se dispone de 11 bits, mientras que para la mantisa se tienen
52; con ello, el número más cercano al 0 está en el orden de 10-308 y el más alejado del 0
está en el orden de 10308.
Para obtener el valor que se está representando, se emplea la misma expresión utilizada en
simple precisión, con la diferencia de que el valor del desplazamiento será de 1023.
1 10000001 01000000000....
signo exponente mantisa
Respuesta:
Respuesta:
39
exponente – 127 = -1, de manera que exponente = 127 – 1 = 126
1 01111110 1 0 0 0 0 0 0 0 0 0 0 0. . . .
signo exponente mantisa
Para entender cómo sería el algoritmo y hardware para sumar números en punto flotante, se
revisa como se realiza la operación con números en decimal. Se sumarán los números
9.999diez x 101 con 1.610diez x 10-1, suponiendo que sólo es posible conservar cuatro dígitos
decimales en la mantisa (uno a la izquierda del punto decimal) y dos en el exponente.
a) Para que la suma sea correcta, primero se deben alinear los números adecuadamente, es
decir, se debe buscar que el exponente sea el mismo para los dos números. Para ello, se
desplaza al número con el exponente más pequeño, para que coincida con el del
exponente más grande:
1.610diez x 10-1 = 0.1610diez x 100 = 0.01610diez x 101
0.016diez x 101
9.999 diez
+ 0.016 diez
10.015 diez
La suma es 10.015 x 101.
d) Finalmente, puesto que solo se pueden almacenar 4 dígitos para la mantisa, el resultado
debe redondearse a 4 dígitos, el redondeo consiste en aproximar al número inmediato
superior el penúltimo dígito, si el dígito menos significativo es mayor o igual a 5.
Obteniéndose como resultado final:
1.002 x 102
En el inciso (c) al normalizar la suma puede ocurrir un error de sobre flujo si el valor del
exponente es mayor al que se puede representar o bajo flujo en caso de que sea menor. El
algoritmo para la suma en punto flotante se muestra en la figura 3.25, en donde se muestra
que después de un redondeo, puede ser necesaria otra normalización. La detección del
40
sobre flujo o bajo flujo depende de la precisión que se esté utilizando para la representación
de los números.
Sumar los números 0.5diez y –0.4375 diez en binario, usando el algoritmo de la figura 3.25
Respuesta:
1) Se desplaza al número con exponente más pequeño (a la derecha), hasta alinearlo con el
exponente mayor:
- 1.110dos x 2-2 = - 0.111dos x 2-1
41
2) Se suman las mantisas: 1.000dos x 2-1 + (- 0.111dos x 2-1 ) = 0.001dos x 2-1
Puesto que 127 > - 4 > - 126, no hay sobre flujo ni bajo flujo (El exponente desplazado
sería – 4 + 127 = 123, y está entre 1 y 254).
Muchas máquinas dedican hardware para ejecutar operaciones de punto flotante tan rápido
como sea posible. En la figura 3.26 se esboza la organización básica del hardware para la
suma en punto flotante.
42
3.10 Multiplicación en punto flotante
Para entender cómo se realiza la multiplicación en punto flotante, se inicia con números
decimales en notación científica, multiplicando 1.110diez x 1010 con 9.200diez x 10-5.
Suponiendo que sólo es posible conservar cuatro dígitos decimales en la mantisa (uno a la
izquierda del punto decimal) y dos en el exponente.
Con los exponentes desplazados el nuevo exponente es erróneo, dado que 10 + 127 =
137, y –5 + 127 = 122, por lo tanto:
El problema es que el desplazamiento se realizó dos veces (una por cada exponente), de
manera que el exponente desplazado es:
Hay tres dígitos a la derecha de cada factor, de manera que deberá haber 6 dígitos a la
derecha del punto decimal del producto: 10.212000diez
Como sólo se pueden mantener 3 dígitos a la derecha del punto decimal, el producto
resultante sería: 10.212diez x 105
43
e) El signo del producto depende de los signos de los factores, si son iguales el producto
es positivo y si son diferentes, el producto será negativo.
El signo en la suma fue determinado por la suma de las mantisas, pero en el producto el
signo se determina por los signos de los operandos. En la figura 3.27 se muestra el
algoritmo de multiplicación binaria en punto flotante. En donde se muestra que después de
la normalización, es posible que ocurra un error de sobre flujo o bajo flujo; y después del
redondeo, es posible que se requiera normalizar nuevamente.
44
Ejemplo: Producto en punto flotante.
Respuesta:
Siguiendo el algoritmo:
El producto es 1.110000 dos x 2-3, si se va a mantener en 4 bits se obtiene: 1.110 dos x 2-3
5) Los signos de los operandos son diferentes, de manera que el resultado es:
- 1.110 dos x 2-3
MIPS soporta a los formatos del estándar IEEE 754 para simple y doble precisión, con las
instrucciones:
El código MIPS para cargar 2 números de punto flotante de simple precisión, desde la
memoria, para sumarlos y almacenar el resultado en memoria es:
TAREA 6
1. Construir una tabla donde se muestren los resultados de multiplicar a 13diez con 3diez
dividir al 13diez entre el 3diez, con base en el algoritmo mostrado en la versión final de la
división.
2. Mostrar la representación binaria IEEE 754 en simple precisión para los números
10.5diez y –2/3diez. (Aproxime empleando todos los bits de la mantisa).
Practica de Laboratorio 3:
46