Lenguaje Ensamblador para PC

Lenguaje Ensamblador para PC
Paul A. Carter
18 de octubre de 2006
www.detodoprogramacion.com
Copyright c 2001, 2002, 2003, 2004 by Paul Carter
Traducido al espa nol por Leonardo Rodrguez M ujica. Sus comentaros y
sugerencias acerca de la traduccion por favor a: lrodri@udistrital.edu.co
Este documento puede ser reproducido y distribuido totalmente (incluida
esta paternidad literaria, copyright y aviso de autorizacion), no se puede co-
brar por este documento en s mismo, sin el consentimiento del autor. Esto
incluye una utilizacion racional de extractos como revisiones y anuncios,
y trabajos derivados como traducciones.
Observe que esta restriccion no esta prevista para prohibir el cobro por el
servicio de impresion o copia del documento
A los docentes se les recomienda usar este documento como recurso de clase;
sin embargo el autor apreciara ser noticado en este caso.
Prefacio
Proposito
El proposito de este libro es dar la lector un mejor entendimiento de como
trabajan realmente los computadores a un nivel mas bajo que los lengua-
jes de alto nivel como Pascal. Teniendo un conocimiento profundo de como
trabajan los computadores, el lector puede ser mas productivo desarrollan-
do software en lenguajes de alto nivel tales como C y C++. Aprender a
programar en lenguaje ensamblador es una manera excelente de lograr este
objetivo. Otros libros de lenguaje ensamblador a un ense nan a programar el
procesador 8086 que uso el PC original en 1981. El procesador 8086 solo
soporta el modo real. En este modo, cualquier programa puede acceder a
cualquier direccion de memoria o dispositivo en el computador. Este modo
no es apropiado para un sistema operativo multitarea seguro. Este libro, en
su lugar discute como programar los procesadores 80386 y posteriores en
modo protegido (el modo en que corren Windows y Linux). Este modo so-
porta las caractersticas que los sistemas operativos modernos esperan, como
memoria virtual y proteccion de memoria. Hay varias razones para usar el
modo protegido
1. Es mas facil de programar en modo protegido que en el modo real del
8086 que usan los otros libros.
2. Todos los sistemas operativos de PC se ejecutan en modo protegido.
3. Hay disponible software libre que se ejecuta en este modos.
La carencia de libros de texto para la programacion en ensamblador de PC
para modo protegido es la principal razon por la cual el autor escribio este
libro.
Como lo dicho antes, este libro hace uso de Software Libre: es decir el
ensamblador NASM y el compilador de C/C++ DJGPP. Ambos se pueden
descargar de Internet. El texto tambien discute como usar el codigo del en-
samblador NASM bajo el sistema operativo Linux y con los compiladores de
C/C++ de Borland y Microsoft bajo Windows. Todos los ejemplos de estas
i
ii PREFACIO
plataformas se pueden encontrar en mi sitio web: http://www.drpaulcarter.com/pcasm.
Debe descargar el codigo de los ejemplos, si desea ensamblar y correr los mu-
chos ejemplos de este tutorial.
Tenga en cuenta que este libro no intenta cubrir cada aspecto de la
programacion en ensamblador. El autor ha intentado cubrir los topicos mas
importantes que todos los programadores deberan tener
Reconocimientos
El autor quiere agradecer a los muchos programadores alrededor del mun-
do que han contribuido al movimiento de Software Libre. Todos los programe
y a un este libro en s mismo fueron producidos usando software libre. El
autor deseara agradecerle especialmente a John S. Fine, Simon Tatham,
Julian Hall y otros por desarrollar el ensamblador NASM ya que todos los
ejemplos de este libro estan basados en el; a DJ Delorie por desarrollar el
compilador usado de C/C++ DJGPP; la numerosa gente que ha contribuido
al compilador GNU gcc en el cual esta basado DJGPP; a Donald Knuth y
otros por desarrollar los lenguajes de composicion de textos T
E
X y L
A
T
E
X2
que fueron usados para producir este libro; a Richar Stallman (fundador de
la Free Software Fundation), Linus Torvalds (creador del n ucleo de Linux) y
a otros que han desarrollado el software que el autor ha usado para producir
este trabajo.
Gracias a las siguientes personas por correcciones:
John S. Fine
Marcelo Henrique Pinto de Almeida
Sam Hopkins
Nick DImperio
Jeremiah Lawrence
Ed Beroset
Jerry Gembarowski
Ziqiang Peng
Eno Compton
Josh I Cates
Mik Miin
Luke Wallis
iii
Gaku Ueda
Brian Heward
Chad Gorshing
F. Gotti
Bob Wilkinson
Markus Koegel
Louis Taber
Dave Kiddell
Eduardo Horowitz
Sebastien Le Ray
Nehal Mistry
Jianyue Wang
Jeremias Kleer
Marc Janicki
Recursos en Internet
Pagina del autor http://www.drpaulcarter.com/
Pagina de NASM en SourceForge http://sourceforge.net/projects/nasm/
DJGPP http://www.delorie.com/djgpp
Ensamblador con Linux http://www.linuxassembly.org/
The Art of Assembly http://webster.cs.ucr.edu/
USENET comp.lang.asm.x86
Documentacion de Intel http://developer.intel.com/design/Pentium4/documentation.htm
Comentarios
El autor agradece cualquier comentario sobre este trabajo.
E-mail: pacman128@gmail.com
WWW: http://www.drpaulcarter.com/pcasm
iv PREFACIO
Captulo 1
Introduccion
1.1. Sistemas de numeracion
La memoria en un computador esta compuesta de n umeros. La memoria
del computador no almacena estos n umeros en decimal (base 10). Porque
se simplica mucho el hardware, los computadores almacenan toda la in-
formacion en binario (base 2). Primero haremos una revision del sistema
decimal.
1.1.1. Decimal
Los n umeros con base 10 estan compuestos de 10 posibles dgitos (0-9).
Cada dgito de un n umero tiene una potencia de 10 asociada con el, basada
en su posicion en el n umero. Por ejemplo:
234 = 2 10
2
+ 3 10
1
+ 4 10
0
1.1.2. Binario
Los n umeros en base dos estan compuestos de dos posibles dgitos (0 y
1). Cada dgito de un n umero tiene una potencia de 2 asociada con el basada
en su posicion en el n umero. Por ejemplo:
11001
2
= 1 2
4
+ 1 2
3
+ 0 2
2
+ 0 2
1
+ 1 2
0
= 16 + 8 + 1
= 25
Esto muestra como los n umeros binarios se pueden convertir a decimal.
El Cuadro 1.1 muestra como se representan los primeros n umeros en binario.
1
2 CAP
ITULO 1. INTRODUCCI
ON
Decimal Binary Decimal Binary
0 0000 8 1000
1 0001 9 1001
2 0010 10 1010
3 0011 11 1011
4 0100 12 1100
5 0101 13 1101
6 0110 14 1110
7 0111 15 1111
Cuadro 1.1: Decimal de 0 a 15 en binario
No hay carry antes S hay carry antes
0 0 1 1 0 0 1 1
+0 +1 +0 +1 +0 +1 +0 +1
0 1 1 0 1 0 0 1
c c c c
Figura 1.1: Suma binaria (c es carry)
La Figura 1.1 muestra como se suman los dgitos binarios individuales
(bits). Aca sigue un ejemplo:
11011
2
+10001
2
101100
2
Si uno considera la siguiente division decimal:
1234 10 = 123 r 4
podemos ver que esta division suprime el dgito mas a la derecha de n umero
y desplaza los otros dgitos una posicion a la derecha. Dividiendo por dos
hacemos una operacion similar, pero para los dgitos binarios de un n umero.
Consideremos la siguiente division binaria
1
:
1101
2
10
2
= 110
2
r 1
Este hecho se puede usar para convertir un n umero decimal a su repre-
sentacion equivalente en binario como muestra la Figura 1.2. Este metodo
encuentra primero el bit del extremo derecho, llamado bit menos signicati-
vo (lsb). El bit del extremo izquierdo es llamado bit mas signicativo (msb).
La unidad basica de memoria esta compuesta de 8 bits y es llamado byte
1
El subndice 2 se usa para mostrar que el n umero esta representado en binario no en
decimal
1.1. SISTEMAS DE NUMERACI
ON 3
Decimal Binary
25 2 = 12 r 1 11001 10 = 1100 r 1
12 2 = 6 r 0 1100 10 = 110 r 0
6 2 = 3 r 0 110 10 = 11 r 0
3 2 = 1 r 1 11 10 = 1 r 1
1 2 = 0 r 1 1 10 = 0 r 1
As 25
10
= 11001
2
Figura 1.2: Conversion a decimal
1.1.3. Hexadecimal
Los n umero hexadecimales tienen base 16. Los hexadecimales (o hex) se
pueden usar como una representacion resumida de los n umeros binarios. Los
n umeros hexadecimales tienen 16 dgitos posibles. Esto crea un problema
ya que no hay smbolos para estos dgitos adicionales despues del nueve.
Por convencion se usan letras para estos dgitos adicionales. Los 16 dgitos
hexadecimales son: 0-9 y luego A, B, C, D, E, F. El dgito A equivale a 10
en decimal, B es 11 etc. Cada dgito de un n umero hexadecimal tiene una
potencia de 16 asociada con el. Por ejemplo:
2BD
16
= 2 16
2
+ 11 16
1
+ 13 16
0
= 512 + 176 + 13
= 701
Para convertir de decimal a hex use la misma idea que la usada para la
conversion binaria excepto que se divide por 16. Vea la Figura 1.3 para un
ejemplo.
La razon por la cual los hexadecimales son utiles es que hay una manera
facil para convertir entre hex y binario. Los n umero binarios se tornan largos
y molestos rapidamente. Los hex son una manera mucho mas compacta de
representar los n umeros binarios.
Para convertir un n umero hexadecimal a binario simplemente convierta
cada dgito hexadecimal a un n umero binario de 4 bits. Por ejemplo, 24D
16
se convierta a 0010 0100 1101
2
. Observe que los ceros delanteros son impor-
tantes! Si los ceros del dgito de la mitad de 24D
16
no se usan el resultado
es erroneo. Convertir de binario a hex es as de facil. Uno hace el proceso
4 CAP
ITULO 1. INTRODUCCI
ON
589 16 = 36 r 13
36 16 = 2 r 4
2 16 = 0 r 2
As 589 = 24D
16
Figura 1.3:
inverso, convierte cada segmento de 4 bits a hexadecimal comenzando desde
el extremo derecho, no desde el izquierdo, del n umero binario. Esto asegura
que el segmento de 4 bits es correcto
2
. Ejemplo:
110 0000 0101 1010 0111 1110
2
6 0 5 A 7 E
16
Un n umero de 4 bits es llamado nibble . As cada dgito hexadecimal
corresponde a un nibble. Dos nibbles conforman un byte y por lo tanto un
byte puede ser representado por dos dgitos hexadecimales. Los valores de
un byte van de 0 a 11111111 en binario, 0 a FF en hex y 0 a 255 en decimal.
1.2. Organizacion del computador
1.2.1. La Memoria
La unidad basica de memoria es el byte. Un computador con 32 Mega La memoria es medida
en unidades de kilobytes
( 2
10
= 1024 bytes), mega
bytes ( 2
20
= 1048576
bytes) y giga bytes ( 2
30
=
1073741824 bytes).
bytes de memoria puede almacenar aproximadamente 32 millones de bytes
de informacion. Cada byte esta etiquetado por un n umero unico conocido
como su direccion. Tal como lo muestra la Figura 1.4.
Direccion 0 1 2 3 4 5 6 7
Memoria 2A 45 B8 20 8F CD 12 2E
Figura 1.4: Direcciones de Memoria
A menudo la memoria se usa en trozos mas grandes que un byte. en la
arquitectura del PC, los nombres que se le han dado a estas secciones de
memoria mas grandes se muestran en la Tabla 1.2.
2
Si no es claro porque el punto de inicio hace la diferencia, intente convertir el ejemplo
comenzando desde la izquierda
1.2. ORGANIZACI
ON DEL COMPUTADOR 5
word 2 bytes
double word 4 bytes
quad word 8 bytes
paragraph 16 bytes
Cuadro 1.2: Unidades de memoria
Todos los datos en la memoria son numericos. Los caracteres son almace-
nados usando codigos de caracteres que traduce un n umero en un caracter.
Uno de los codigos de caracteres es conocido como ASCII (American Stan-
dar Code for Information Interchange). Un nuevo codigo, mas completo,
que esta reemplazando al ASCII es el Unicode. Una diferencia clave entre
los dos codigos es que el ASCII usa un byte para codicar un caracter, pero
Unicode usa dos bytes (o una palabra) por caracter. Por ejemplo ASCII de-
codica el byte 41
16
(65
10
) en la A may uscula. Unicode la codica con la
palabra 0041
16
. Ya que ASCII usa un byte esta limitado a solo 256 caracteres
diferentes.
3
Unicode ampla los valores ASCII a palabras y permite que se
representen muchos mas caracteres. Esto es importante para representar los
caracteres de todas las lenguas del mundo.
1.2.2. La CPU
La Unidad Central de Procesamiento (CPU) es el dispositivo fsico que
ejecuta las instrucciones. Las instrucciones que ejecuta la CPU son por lo
general muy simples. Las instrucciones pueden requerir datos que esten en un
lugar especial de almacenamiento de la CPU en s misma llamados registros.
La CPU puede acceder a los datos en los registros mucho mas rapido que en
la memoria. Sin embargo el n umero de registros en la CPU es limitado, as el
programador debe tener cuidado de dejar solo los datos que este usando en
los registros.
Las instrucciones que un tipo de CPU ejecuta las hace en lenguaje de
maquina. Los programas en lenguaje de maquina tienen una estructura mu-
cho mas basica que los lenguajes de alto nivel. Las instrucciones en lenguaje
de maquina son codicadas como n umeros no en formatos de texto ami-
gables. Una CPU debe estar en capacidad de decodicar una instruccion
de proposito muy rapidamente para correr ecientemente. Los lenguajes de
maquina son dise nados con este objetivo en mente , no para ser facilmente
descifrados por humanos. Los programas escritos en otros lenguajes deben
ser convertidos en lenguaje de maquina nativo para que se ejecute en el com-
putador. Un compilador es un programa que traduce programas escritos en
3
De hecho ASCII solo usa los 7 bits mas bajos y solo tiene 128 valores diferentes
6 CAP
ITULO 1. INTRODUCCI
ON
un lenguaje de programacion a el lenguaje de maquina de una arquitectura
en particular de un computador. En general cada tipo de CPU tiene su pro-
pio y unico lenguaje de maquina. Esa es una de las razones por las cuales
programas escritos para un Mac no corren en un PC tipo IBM
Los computadores usan un reloj para sincronizar la ejecucion de las
instrucciones.. El reloj pulsa a una frecuencia ja conocida como velocidad GHz signica giga Hertz o
mil millones de ciclos por
segundo. Una CPU de 1.5
GHz tiene mil quinientos
millones de pulsos de reloj
por segundo.
del reloj. Cuando Ud. compra un computador de 1.5 GHz, la frecuencia de
su reloj es 15.GHz. Simplemente toca a una razon constante, la electronica
de la CPU usa un ritmo para realizar sus operaciones correctamente, como
el ritmo de un metronomo para la ejecucion de m usica al ritmo correcto.
El n umero de toques (o como ellos llaman com unmente ciclos) que una
instruccion requiere depende de la instruccion anterior y de otros factores
tambien.
1.2.3. La familia de CPU 80x86
Las PC de tipo IBM tienen una CPU de la familia Intel (o un clon de
ellas) Las CPU de esta familia todas tienen algunas caractersticas comunes
incluyendo el lenguaje de maquina basico. Sin embargo los miembros mas
recientes amplan grandemente las caractersticas.
8888,8086: Estas CPU desde el punto de vista de la programacion son
iguales. Ellas fueron las CPUs usadas en las primeras PC. Ellos usan
varios registros AX, BX, CX, DX, SI, DI, BP, SP, CS, DS, SS, ES, IP,
FLAG. Ellas solo soportan hasta 1 Mega byte de memoria y solo opera
en modo real. En este modo un programa puede acceder a cualquier
direccion de memoria, a un a la memoria de otros programas Esto hace
la depuracion y seguridad muy difcil. Tambien la memoria del pro-
grama tiene que ser dividida en segmentos. Cada segmento no puede
ser mas largo que 64 KB
80286: Esta CPU se usa en los PC tipo AT. Agrega unas instrucciones
nuevas al lenguaje de maquina base del 8080/86. Sin embargo la nueva
caracterstica principal nueva es el modo protegido de 16 bits. En este
modo puede acceder hasta 16 Mega bytes de memoria y proteger los
programas del acceso de otros. Sin embargo los programas todava
estan divididos en segmentos que no pueden ser mas grandes de 64K.
80386: Esta CPU es una gran ampliacion del 80286. Primero extiende los
registros para almacenar 32 bits ((EAX, EBX, ECX, EDX, ESI, EDI,
EBP, ESP, EIP) y a nade dos nuevos registros de 16 bits FS y GS. Tam-
bien a nade un nuevo modo protegido de 32 bits. En este modo pueden
acceder hasta 4 Gigabyes. Los programas otra vez estan divididos en
1.2. ORGANIZACI
ON DEL COMPUTADOR 7
AX
AH AL
Figura 1.5: El registro AX
segmentos, pero ahora cada segmento tambien puede ser hasta de 4
Giga bytes en tama no
80486/Pentium/Pentium Pro: Estos miembros de la familia 80x86 a naden
muy pocas caractersticas nuevas. Ellos principalmente aceleran la eje-
cucion de las instrucciones.
Pentium MMX: Este procesador a nade instrucciones MMX (eXtensiones
MultiMedia) al Pentium. Estas instrucciones pueden acelerar instruc-
ciones comunes gracas.
item[Pentium II:] Este es el procesador Pentium Pro con las instruc-
ciones MMX a nadidas (El pentium III es esencialmente solo un Pen-
tium II rapido.
1.2.4. Registros de 16 bits del 8086
La CPU original 8086 suministra 4 registros de 16 bits de proposito gen-
eral AX, BX, CX y DX. Cada uno de esos registros puede ser descompuesto
en los registros AL y AH que muestra la Figura 1.5. El registro AH con-
tiene los 8 bits superiores de AX t AL contiene los 8 bits bajos de AX. A
menudo AH y AL son usados como registros independientes de 8 bits sin
embargo cambiando el valor de AX cambiara AH y AL y viceversa. Los
registros de proposito general son usados en muchos movimientos de datos
e instrucciones aritmeticas.
Hay dos registros de ndice de 16 bits SI y DI. Ellos son a menudo usa-
dos como apuntadores, pero pueden ser usados para muchos de los mismos
propositos como los registros generales. Sin embargo, ellos no se pueden
descomponer en registros de 8 bits.
Los registros de 16 bits BP y SP son usados para se nalar a los datos en
la pila y son llamados Apuntador Base (Base Pointer) y apuntador a la pila
(Stack Pointer), respectivamente. Ellos se discutiran luego.
Los registros de 16 bits CS, DS, SS y ES son registros de segmento. Ellos
se nalan que memoria es usada por diferentes partes de un programa. CS
signica segmento de codigo (code segment), DS segmento de datos (data
segment), SS Segmento de la pila (Stack Segment) y ES segmento extra
(Extra Segment). ES es usado como un registro temporal. Los detalles de
estos registros estan en las Secciones 1.2.6 y 1.2.7.
8 CAP
ITULO 1. INTRODUCCI
ON
El registro IP Apuntador a la instruccion (instruction pointer) es usado
con el registro CS para obtener la direccion de la siguiente instruccion a ser
ejecutada por la CPU. Normalmente cuando se ejecuta una instruccion IP
avanza hasta se nalar a la siguiente instruccion en memoria.
The Instruction Pointer (IP) register is used with the CS register to
keep track of the address of the next instruction to be executed by the
CPU. Normally, as an instruction is executed, IP is advanced to point to
the next instruction in memory.
El registro FLAGS almacena informacion importante sobre los resultados
de una instruccion anterior. Estos resultados son almacenados como bits
individuales en el registro. Por ejemplo el bit Z es 1 si el resultado de la
instruccion anterior fue cero o 0 si el resultado no fue cero. No todas las
instrucciones modican bits en FLAGS, consulte la tabla en el apendice
para ver como instrucciones especcas afectan el registro FLAGS
1.2.5. Registros de 32 bits del 80386
El 80386 y los procesadores posteriores tienen registros extendidos. Por
ejemplo el registro de 16 bits AX se extendio para se de 32 bits. Para la
compatibilidad con sus predecesores, AX se reere al registro de 16 bits y
EAX se usa para referirse al registro extendido de 32 bits. AX son los 16
bits inferiores de EAX tal como AL son los 8 bits inferiores de AX (y EAX).
No hay forma de acceder directamente a los 16 bits superiores de EAX Los
otros registros extetendidos son EBX, ECX, EDX, ESI and EDI.
Muchos de los otros registros se extienden tambien BP se convierte en
EBP, SP se convierte en ESP , FLAGS en EFLAGS e IP en EIP. Sin embargo
son diferentes los registros de ndice y los de proposito general, en el modo
protegido de 32 bits (discutidos abajo) solo se usan las versiones extendidas
de estos registros.
Los registros de segmento contin uan siendo de 16 bits en el 80386. Hay
tambien dos nuevos registros de segmento: FS y GS. Sus nombres no signif-
ican nada. Ellos son registros adicionales para segmentos temporales (como
ES).
Una de las deniciones del termno word se reere a el tam no del registro
de datos de la CPU. Para la familia 80x86, el termino es ahora un poco
confuso. En la Tabla 1.2, uno ve que word esta denida para ser 20 bytes
(o 16 bits). Este fue el signicado que se le dio, cuando se lanzo la primera
vez el 8086. Cuando se desarrollo el 80386, se decidio dejar la denicion de
word sin cambio, auque el tama no del registro cambio.
1.2.6. Modo Real
En el modo real la memoria esta limitada a solo 1 mega byte (2
20
bytes) De d onde viene el in-
fame lmite de 640K de
DOS? La BIOS requerida
algunode 1M para el c odi-
go y para los dispositivos
de hardware como la pan-
talla de video
1.2. ORGANIZACI
ON DEL COMPUTADOR 9
Las direcciones validas estan desde 0000 hasta FFFFF. (en hexadecimal)
Estas direcciones requieren un n umero de 20 bits Obviamente un n umero
de 20 bits no cabra en ning un registro de 16 bits. Intel soluciono este prob-
lema usando 2 valores de 16 bits para determinar una direccion. El primer
valor de 16 bits es llamado selector. Los valores del selector deben estar
almacenados en registros de segmento El segundo valor de 16 bits es lla-
mado desplazamiento (oset) La direccion fsica referenciada por un par
selector:desplazamiento es calculada por la formula:
16 selector + oset
multiplicar por 16 en hexadecimal es muy facil, es solo a nadir un 0 a la
derecha del n umero. Por ejemplo la direccion fsica referenciada por 047C:0048
esta dada por:
047C0
+0048
04808
En efecto, el valor selector es un n umero parrafo (vea la Tabla 1.2).
direcciones reales segmentadas tienen desventajas:
Un solo valor de selector solo puede referenciar 64 K de memoria (el
lmite superior del desplazamiento de 16 bits). Que pasa si un progra-
ma tiene mas de 64 K de codigo? Un solo valor en CS no se puede usar
para toda la ejecucion del programa. El programa se debe dividir en
secciones (llamadas segmentos menores de 64 K en tama no. Cuando la
ejecucion se mueve de un segmento a otro los valores de CS se deben
cambiar. Esto puede ser muy incomodo
Cada byte de memoria no tiene una sola direccion segmentada. La di-
reccion fsica 04804 puede ser referenciada por 047C:0048, 047D:0038,
0047E:0028 o 047B:0058. Esto puede complicar la comparacion de di-
recciones segmentadas.
1.2.7. Modo protegido de 16 bits
En el modo protegido del 80286 los valores del selector son interpretados
completamente diferente que en el modo En el modo real, un valor de selector
es un n umero de parrafo de memoria fsica. En el modo protegido un valor
selector es un ndice en una tabla de descripcion. En ambos modos, los
programas son divididos en segmentos. En modo real estos segmentos estan
en posiciones jas en la memoria fsica y el selector denota el n umero de
parrafo de comienzo del segmento. En modo protegido los segmentos no
10 CAP
ITULO 1. INTRODUCCI
ON
estan en posiciones jas en la memoria fsica. De hecho no tiene que estar
todo el segmento en memoria.
El modo protegido usa una tecnica llamada memoria virtual . La idea
basica de un sistema de memoria virtual, es dejar solo los datos y el codigo
que los programas estan usando en un momento dado. Otros datos y codigo
son almacendos temporalmente en el disco hasta que ellos se necesiten de
nuevo. Cuando retorna un segmento a la memoria del disco, es muy probable
que se coloque en un area diferente de memoria en el que estuvo antes de
ser enviada al disco. Todo esto es hecho transparementemente por el sistema
operativo. El programa no se tiene que escribir de otra manera para que la
memoria virtual trabaje.
En el modo protegido a cada segmento se le asigna una entrada en una
tabla de descriptores. Esta entrada tiene toda la informacion que el sistema
necesita conocer sobre el segmento. Esta informacion incluye: si esta ac-
tualemente en memoria, si es as donde esta, permiso de acceso (ejem: solo
lectura). El ndice de la entrada del segmento es el valor del selector que
esta almacendo en los registros de segmento.
Una gran desventaja del modo protegido es que los desplazamientos estan Un conocido columnista de
PC llamo al 286 cerebro
muerto.
a un en cantidades de 16 bits Como una consecuencia de esto, los tama nos
de los segmentos estan todava limitados a un maximo de 64K. Esto hace
problematico el uso de arreglos grades.
1.2.8. Modo protegido de 32 bits
El 80386 introdujo el modo protegido de 32 bits. Hay dos grandes difer-
encias entre los modos protegidos de un 386 de 32 bits y un 286 de 16 bits
1. Los desplazamientos se amplan a 32 bits. Esto permite un rango de de-
splazamiento hasta 4 billones. As los segmentos pueden tener tama nos
hasta de 4 gigabytes.
2. Los segmentos pueden ser divididos en unidades mas peque nas de 4K
llamadas paginas. El sistema de memoria virtual trabaja ahora con
paginas en lugar de segmentos. Esto signica que solo partes de un
segmento pueden estar en memoria a la vez. En el modo de 16 bits del
286 o todo el segmento esta en memoria o no esta. Esto no es practico
con los grandes segmentos que permite el modo de 32 bits.
En Windows 3.x el modo standar se reere al modo protegido de 16 bits
del 286 y el modo ampliado se reere al modo de 32 bits.
1.2.9. Interrupciones
Algunas veces el ujo ordinario de un programa debe ser interrumpido
para procesar eventos que requieren una respuesta rapida. El hardware de
1.3. LENGUAJE ENSAMBLADOR 11
un computador provee un mecanismo llamado interrupcion para manipu-
lar estos eventos. Por ejemplo cuando se mueve el raton la interrupcion de
hardware del raton es el programa actual para manejar el movimiento del
raton (para mover el cursor del mouse, etc) Las interrupciones hacen que
el control se pase a un manipulador de interrupciones. Los manipuladores
de interrupciones son rutinas que procesan la interrupcion. A cada tipo de
interrupcion se le asigna un n umero entero. En el comienzo de la memoria
fsica una tabla de vectores de interrupcion que contiene la direccion del seg-
mento de los manipuladores de la interrupcion. El n umero de la interrupcion
es escencialmente un ndice en esta tabla.
Las interrupciones externas son levantadas desde el exterior de la CPU
(el raton es un ejemplo de esto). Muchos dispositivos de E/S levantan inter-
rupciones (teclado, temporizador, disco duro CD ROM y tarjetas de sonido)
Las interrupciones internas son levantadas desde la CPU, desde una instruc-
cion de error o desde una instruccion de interrupcion. Las instrucciones de
error tambien se llaman trampas. Las instrucciones generadas desde la in-
struccion de interrupcion son llamadas interrupciones de sofware. DOS usa
estas interrupciones paa implementar su API (Interfaz de programas de
Aplicacion) Sistema operativos mas modernos (como Windows y Linux) us-
an una interfaz basada en C
4
Muchos manipuladores de interrupcion devuelven el control al programa
interrumpido cuando ella culmina. Ella restaura todos los registros con los
mismos valores que tenan antes que ocurriera la interrupcion. Las trampas
generalmente no retornan. A menudo ellas acaban el programa.
1.3. Lenguaje ensamblador
1.3.1. Lenguaje de maquina
Cada tipo de CPU entiende su propio lenguaje de maquina. Las instruc-
ciones en lenguaje de maquina son n umeros almacenados como bytes en
memoria. Cada instruccion tiene su propio y unico codigo llamado codigo
de operacion u opcode. Las instrucciones del procesador 80X86 varan en
tama no. El opcode esta siempre al inicio de la instruccion. Muchas instruc-
ciones incluyen tambien datos (ver constantes o direcciones) usados por las
instrucciones.
El lenguaje de maquina es muy difcil de programar directamente. De-
scifrar el signicado de las instrucciones codicadas numericamente es te-
dioso para los humanos. Por ejemplo la instruccion para sumar los registros
EAX y EBX y almacenar el resultado en EAX esta codicada por los sigu-
ientes codigos hexadecimales
4
Sin embargo, ellas pueden usar una interfaz de bajo nivel (a nivel del kernel)
12 CAP
ITULO 1. INTRODUCCI
ON
03 C3
Esto no es obvio. Afortunadamente, un programa llamado ensamblador
puede hacer este aburrido trabajo para el programador.
1.3.2. Lenguaje ensamblador
Un programa Escrito en lenguaje ensamblador es almacenado como texto
(tal como programas de alto nivel). Cada instruccion representa exactamente
una instruccion de la maquina. Por ejemplo, la instruccion de suma descrita
arriba podra ser representada en lenguaje ensambaldor como:
add eax, ebx
Aca el signicado de la instruccion es mucho mas claro que el codigo de la
maquina. La palabra add es el nemonico nemonico para la instruccion de
suma . La forma general de una instruccion de ensamblaje es:
mnemonico operando(s)
Un ensamblador es un programa que lee un archivo de texto con instruc-
ciones de ensamblador y convierte el ensamblador en codigo de maquina. Los
compiladores son programas que hacen conversiones similares para lenguajes
de programacion de alto nivel. Un ensamblador es mucho mas simple que un
compilador. Cada instruccion de lenguaje ensamblador representa una sola Les tomo varios a nos a
los cientcos de la com-
putacion imaginarse como
escribir un compilador
instruccion de la maquina. Las instrucciones de un lenguaje de alto nivel son
mucho mas complejas y pueden requerir muchas instrucciones de maquina.
Otra diferencia importante entre los lenguajes ensamblador y de alto
nivel es que debido a que cada tipo de CPU tiene su propio lenguaje de
maquina, tambien tiene su propio lenguaje ensamblador. Trasladar progra-
mas entre arquitecturas de computador diferentes es mucho mas difcil que
en un lenguaje de alto nivel.
En los ejemplos de este libro se usa Netwide Assembler o NASM .
Esta disponible libremente en internet (vea el prefacio para la URL). Los
ensambladores mas comunes son el ensamblador de Microsoft (MASM) y el
de Borland (TASM) . Hay algunas diferencias en la sintaxis del ensamblador
de NASM, MASM y TASM .
1.3.3. Operandos de las instrucciones
Los codigos de las instrucciones de maquina tienen una variedad de tipos
y operandos; sin embargo, en general cada instruccion en si misma tiene un
n umero jo de operandos (0 a 3). Los operandos pueden tener los siguientes
tipos:
registro: Estos operandos se reeren directamente al contenido de los reg-
istros de la CPU.
memoria: Estos se reeren a los datos en la memoria. La direccion de los
datos puede ser una constante ja en la instruccion o puede ser cal-
culada usando los valores de los registros. Las direcciones son siempre
desplazamientos relativos al comienzo de un segmento.
immediato: Estos son valores jos que estan listados en la instruccion en
s misma. Ellos son almacenados en la instruccion en si misma (en el
segmento de codigo), no en el segmento de datos.
implicado: Estos operandos no son mastrados explcitamente. Por ejemplo,
la instruccion de incremento a nade uno a un registro o a memoria. El
uno esta implcito.
1.3.4. instrucciones basicas
La instruccion esencial es MOV . Ella translada datos de un lugar a otro
(como el operador de asignacion en un lenguaje de alto nivel). Toma dos
operandos:
mov dest, src
El dato especicado por src es copiado a dest. Una restriccion es que los dos
operandos no pueden ser operandos de memoria. Esto se nala otra peculiari-
dad del ensamblador. Hay a menudo algunas reglas arbitrarias sobre como
se usan las instrucciones. Los operandos deben tener el mismo tama no. El
valor de AX no puede ser almacenado en BL.
Aca hay un ejemplo(los ; inician un comentario)
mov eax, 3 ; almacena 3 en el registro EAX (3 es el operando inmediato)
mov bx, ax ; almacena el valor de AX en el registro BX
La instruccion ADD se usa para sumar enteros.
add eax, 4 ; eax = eax + 4
add al, ah ; al = al + ah
La instruccion SUB resta enteros.
sub bx, 10 ; bx = bx - 10
sub ebx, edi ; ebx = ebx - edi
Las instrucciones INC y DEC incrementan o decrementan valores en uno.
Ya que el uno es un operando implcito, el codigo de de maquina para INC
y el DEC es mas peque no que los de las instrucciones ADD y SUB.
inc ecx ; ecx++
dec dl ; dl--
14 CAP
ITULO 1. INTRODUCCI
ON
1.3.5. Directivas
Una directiva es un articio del ensamblador no de la CPU. Ellas se usan
generalmente para decirle al ensamblador que haga alguna cosa o informarle
al ensamblador de algo. Ellas no se traducen en codigo de maquina. Los usos
comunes de las directivas son:
Denir constantes
Denir memoria para almacenar datos en ella
Denir la memoria para almacenar datos en ella
Agrupar la memoria en segmentos
Inclur codigo fuente condicionalmente
Inclur otros archivos
El codigo de NASM pasa a traves de un preprocesador tal como C.
Tiene muchas de las ordenes del preprocesador tal como C. Sin embargo las
directivas del preprocesador de NASM comienzan con un como en C.
directiva equ
La directiva equ se puede usar para denir un smbolo. Los smbolos son
constantes con nombre que se pueden emplear en el programa ensamblador.
El formato es:
smbolo equ valor
Los valores de los smbolos no se pueden redenir posteriormente.
La directiva %dene
Esta directiva es parecida a la #dene de C. Se usa normalmente para
denir macros tal como en C.
%define SIZE 100
mov eax, SIZE
El codigo de arriba dene un macro llamado size y muestra su uso en una
instruccion MOV. Los macros son mas exibles que los smbolos de dos man-
eras. Los macros se pueden redenir y pueden ser mas que simples constantes
n umericas.
Unidad Letra
byte B
word W
double word D
quad word Q
ten bytes T
Cuadro 1.3: Letras para las directivas RESX y DX
Directivas de datos
Las directivas de datos son usadas en segmentos de datos para denir
espacios de memoria. Hay dos formas en que la memoria puede ser reservada.
La primera es solo denir el espacio para los datos; la segunda manera dene
el espacio y el valor inicial. El primer metodo usa una de las directivas
RESX. La X se reemplaza con una letra que determina el tama no del objeto
(u objetos) que sera almacenados. La tabla 1.3 muestra los valores posibles.
El segundo metodo (que dene un valor inicial tambien) usa una de las
directivas DX. Las X son las mismas que las de la directiva RESX.
Es muy com un marcar lugares de memoria con etiquetas. Las etiquetas
le permiten a uno referirse facilmente a lugares de la memoria en el codigo.
Abajo hay varios ejemplos.
L1 db 0 ; byte etiquetado como L1 con valor inicial 0
L2 dw 1000 ; palabra etiquetada como L2 con valor inicial de 1000
L3 db 110101b ; byte con valor inicial binario de 110101 (53 en decimal)
L4 db 12h ; byte con valor inicial hex de 12 (18 en decimal)
L5 db 17o ; byte con valor inicial octal de 17 (15 en decimal)
L6 dd 1A92h ; plabra doble con valor inicial hex de 1A92
L7 resb 1 ; un byte sin valor inicial
L8 db "A" ; byte con valor inicial del codigo ASCII para A (65)
Las comillas dobles o simples se interpretan igual. Las deniciones con-
secutivas de datos se almacenaran secuencialmente en memoria. Esto es, la
palabra L2 se almacenara inmediatamente despues que la L1. Se pueden
denir tambien secuencias de memoria.
L9 db 0, 1, 2, 3 ; define 4 bytes
L10 db "w", "o", "r", d, 0 ; define una cadena tipo C = "word"
L11 db word, 0 ; igual que L10
La directiva DD se puede usar para denir o enteros o constantes de
punta otante de presicion simple.
5
Sin embargo DQ solo se puede usar
para denir constantes de punta otante de doble precision.
5
Punto otante de presicion simple es equivalente a la variable oat en C.
16 CAP
ITULO 1. INTRODUCCI
ON
Para secuencias largas la directiva TIMES de NASM es a menudo util.
Esta directiva repite su operando un n umero especicado de veces por ejem-
plo:
L12 times 100 db 0 ; equivalente a 100 veces db 0
L13 resw 100 ; reserva lugar para 100 palabras
Recuerde que las etiqueta pueden ser usadas para referirse a datos en el
codigo. Si se usa una etiqueta esta es interpretada como la direccion (o
desplazamiento) del dato. Si la etiqueta es colocada dentro de parentesis
cuadrados ([]), se interpreta como el dato en la direccion. En otras palabras,
uno podra pensar de una etiqueta como un apuntador al dato y los parente-
sis cuadrados como la des referencia al apuntador tal como el asterisco lo
hace en C (MSSM y TASM siguen una convencion diferente). En el modo
de 32 bits las direcciones son de 32 bits. Aca hay algunos ejemplos.
1 mov al, [L1] ; copia el byte que esta en L1 en AL
2 mov eax, L1 ; EAX = direccion del byte en L1
3 mov [L1], ah ; copia AH en el byte en L1
4 mov eax, [L6] ; copia la palabra doble en L6 en EAX
5 add eax, [L6] ; EAX = EAX + la palabra doble en L6
6 add [L6], eax ; la palabra doble en L6 += EAX
7 mov al, [L6] ; copia el primer byte de la palabra doble en L6 en AL
La lnea 7 de los ejemplos muestra una propiedad importante de NASM.
El ensamblador no recuerda el tipo de datos al cual se reere la etiqueta.
De tal forma que el programador debe estar seguro que usa la etiqueta
correctamente. Luego sera com un almacenar direcciones de datos en registros
y usar los registros como una variable apuntador en C. Una vez mas no se
verica que el apuntador se use correctamente. De este modo el ensamblador
es mucho mas propenso a errores a un que C.
Considere la siguiente instruccion:
mov [L6], 1 ; almacena 1 en L6
Esta instruccion produce un error de tama no no especicado. Por que?
Porque el ensamblador no sabe si almacenar el 1 como byte, palabra o pal-
abra doble. Para denir esto, se a nade un especicador de tama no .
mov dword [L6], 1 ; almacena 1 at L6
Esto le dice al ensamblador que almacene un 1 en la palabra doble que
comienza en L6. Otros especicadores son: BYTE, WORD, QWORD Y
TWORD.
6
6
TWORD dene un area de memoria de 10 bytes. El coprocesador de punto otante
usa este tipo de dato.
print int imprime en la pantalla el valor del entero almacendo
en EAX
print char imprime en la pantalla el caracter cuyo codigo ASCII
este almacendo en AL
print string imprime en la pantalla el contenido de la cadena en
la direccion almacenada en EAX. La cadena debe ser
tipo C, terminada en NULL).
print nl imprime en pantalla el caracter de nueva lnea.
read int lee un entero del teclado y lo almacena en el registro.
read char lee un solo caracter del teclado y almacena el codigo
ASCII en el registro EAX.
Cuadro 1.4: Rutinas de E/S en ensamblador
1.3.6. Entrada y Salida
La entrada y salida son acciones muy dependientes del sistema . Involucra
comunicarse con el hardware del sistema. Los lenguquajes del alto nivel,
como C, proveen bibliotecas normalizadas de rutinas que suministran una
interfas de programacion simple y uniforme para la dE/ S. Los lenguajes
ensamblador no disponen de bibliotecas normalizadas. Ellas deben acceder
directamente al hardware (que es una operacion privilegiada en el modo
protegido) o usar rutina de bajo nivel que provea el sistema operativo.
Es muy com un que se interfacen rutinas de ensamblador con C. Una de
las ventajas de esto es que el codigo en ensamblador puede usar las rutinas
E/S de las bibliotecas estandar de C. Sin embargo uno debe conocer las
reglas que usa C para pasar informacion entre rutinas. Estas reglas son
muy complicadas para cubrir aca (ellas se veran luego) . Para simplicar la
E/S el autor ha desarrollado sus propias rutinas que ocultan las complejas
reglas de C y provee una interfas mucho mas simple. La tabla 1.4 describe
las rutinas suministradas. Todas las rutinas preservan el valor de todos los
registros , excepto las rutinas de lectura. Estas rutinas modican el valor
del registro EAX. Para usar estas rutinas uno debe incluir un archivo con
la informacion que el ensamblador necesita usarlas. Para incluir un archivo
en NASM use la directiva del preprocesador %include. La siguiente lnea
incluye el archivo necesario para las rutinas de E/S hechos por el autor
http://www.drpaulcarter.com/pcasm:
%include "asm_io.inc"
Para usar una de las rutinas print, uno carga EAX con el valor correcto
y usa la instruccion Call para invocarla.La instruccion Call es equivalente
a un llamado de funcion en un lenguaje de alto nivel. Hace un salto en la
ejecucion hacia otra seccion de codigo pero despues retorna al origen luego
18 CAP
ITULO 1. INTRODUCCI
ON
que la rutina a culminado. El programa muestra varios ejemplos de llamadas
de estas rutinas de E/S.
1.3.7. Depuracion
La biblioteca del autor tambien contiene algunas rutinas utiles para
depurar los programas. Estas rutinas de depuracion muestran informacion
sobre el estado del computador sin modicar su estado. Estas rutinas son
en realidad macros que muestran el estado de la CPU y luego hacen un
llamado a una subrutina. Los macros estan denidos en el archivo code
asm io.inc discutido antes. Los matros se usan como instrucciones normales.
Los operandos de los macros se separan con comas.
Hay cuatro rutinas de depuracion llamadasdump regs, dump mem, dump stack
and dump math; Ellas muestran los valores de los registros, memoria, pila y
el coprocesador matematico respctivamente
dump regs Este macro imprime los valores de los registros (en hexadeci-
mal) del computador stdout (la pantalla). Tambien imprime el estado
de los bits del registto FLAGS.
7
Por ejemplo si la bandera cero es 1
se muestra ZF. Si es cero no semuestra nada. Torma un solo entero
como parametro que luego se imprime. Este entero se puede usar para
distinguir la salida de diferentes ordenes dump regs.
dump mem Este macro imprime los valores de una region de memoria
(en hexadecimal) y tambien como caracteres ASCII. Toma tres argu-
mentos delimitados por comas. El primero es un entero que es usado
para identicar la salida (tal cual como el argumento de dump regs).
El segundo argumento es la direccion a mostrar (esta puede ser una
etiqueta). El ultimo argumento es un n umero de l6 bytes para mostrar
luego de la direcccion. La memoria mostrada comenzara en el primer
lmite un parrafo antes de la direccion solicitada.
dump stack Este macro imprime los valores de la pila de la CPU (la pi-
la se vera en el captulo 4). La pila esta organizada como palabras
dobles y esta rutina las mostrara de esta forma. Toma tres paramet-
ros separados por comas. El primero es un identicador entero (como
dump regs). El segundo es el n umero de palabras dobles para mostrar
luego de la direccion que tenga almacenada el regisstro EBP, y el ter-
cer argumento es el n umero de palabras dobles a imprimir sobre la
direccion de EBP.
dump math Este macro imprime los valores de los registros del coproce-
sador matematico. Toma un solo parametro entero como argumen-
7
El captulo 2 discute este registro
1.4. CREANDO UN PROGRAMA 19
int main()
{
int ret status ;
ret status = asm main();
return ret status ;
}
Figura 1.6: codigo de driver.c
to que se usa para identicar la salida tal como el argumento de
dump regs lo hace.
1.4. Creando un programa
Hoy da no es com un crear un programa independiente escrito totalmente
en lenguaje ensamblador. El ensamblador es usado para desarrollar ciertas
rutinas crtica. Por que? Es mucho mas facil programar en un lenguaje
de alto nivel que en ensamblador. Tambien al usar ensamblador es muy
difcil transportar el programa a otras plataformas. De hecho es raro usar el
ensamblador en todo.
Por que alguien quisiera aprender ensamblador?
1. Algunas veces el codigo escrito en ensamblador puede ser mas rapido
y peque no que el codigo generado por un compilador.
2. El ensamblador permite acceder directamente a caractersticas del
hardware del sistema que puede ser difcil o imposible de usar des-
de un lenguaje de alto nivel.
3. Aprender a programar en ensamblador le ayuda a uno a ganar un
entendimiento profundo de como trabaja el computador.
4. Aprender a programar en ensamblador ayuda a entender mejor como
trabajan los compiladores y los lenguajes de alto nivel como C.
Los ultimos dos puntos demuestran que aprender ensamblador puede ser
util a un si uno nunca programa en el mas. De hecho, el autor raramente
programa en ensamblador pero usa las ideas aprendidas de el todos los das.
1.4.1. Primer programa
Los primeros programas en este texto comenzaran todos con un progra-
ma sencillo de C mostrado en la Figura 1.6. Simplemente llama otra funcion
20 CAP
ITULO 1. INTRODUCCI
ON
llamada asm main. Esta es la rutina escrita en ensamblador. Hay varias ven-
tajas de usar este programa en C. Primero dejamos que C je todos los
parametros para que el programa se ejecute correctamente en el modo pro-
tegido. Todos los segmentos y sus correspondientes registro de segmento
seran iniciados por C. El codigo en ensamblador no necesita preocuparse de
nada de esto. Segundo las bibliotecas de C estaran disponibles para ser us-
adas en el codigo de ensamblador. Las rutinas de E/S del autor aprovechan
esto. Ellas usan las funciones de E/S de C (printf, etc.). Ahora se muestra
un programa elemental en ensamblador.
The early programs in this text will all start from the simple C driver
program in Figure 1.6. It simply calls another function named asm main.
This is really a routine that will be written in assembly. There are several
advantages in using the C driver routine. First, this lets the C system set
up the program to run correctly in protected mode. All the segments and
their corresponding segment registers will be initialized by C. The assembly
code need not worry about any of this. Secondly, the C library will also be
available to be used by the assembly code. The authors I/O routines take
advantage of this. They use Cs I/O functions (printf, etc.). The following
shows a simple assembly program.
first.asm
1 ; Archivo: first.asm
2 ; Primer programa en ensamblador. Este programa pide dos
3 ; enteros como entrada e imprime su suma
4
5 ; Para crear el ejecutable usando djgpp:
6 ;
7 ; nasm -f coff first.asm
8 ; gcc -o first first.o driver.c asm_io.o
9
10 %include "asm_io.inc"
11 ;
12 ; Los datos iniciados se colocan en el segmento .data
13 ;
14 segment .data
15 ;
16 ; Estas etiquetas se refieren a las cadenas usadas para la salida
17 ;
18 prompt1 db "Digite un numero: ", 0 ; no olvide el fin de cadena
19 prompt2 db "Digite otro numero: ", 0
20 outmsg1 db "Ud. ha digitado ", 0
21 outmsg2 db " y ", 0
22 outmsg3 db ", la suma es ", 0
23
24 ;
25 ; Los datos no iniciados se colocan en el segmento .bss
26 ;
27 segment .bss
28 ;
29 ; Estas etiquetas se~nalan a palabras dobles usadas para almacenar los datos
30 ; de entrada
31 ;
32 input1 resd 1
33 input2 resd 1
34
35 ;
36 ; El codigo se coloca en el segmento .text
37 ;
38 segment .text
39 global _asm_main
40 _asm_main:
41 enter 0,0 ; setup routine
42 pusha
43
44 mov eax, prompt1 ; print out prompt
45 call print_string
46
47 call read_int ; lee un entero
48 mov [input1], eax ; lo almacena en input1
49
50 mov eax, prompt2 ; print out prompt
52
53 call read_int ; lee un entero
54 mov [input2], eax ; lo almacena en input2
55
56 mov eax, [input1] ; eax = dword en input1
57 add eax, [input2] ; eax += dword en input2
58 mov ebx, eax ; ebx = eax
59
60 dump_regs 1 ; imprime los valores de los registros
61 dump_mem 2, outmsg1, 1 ; imprimer la memoria
62 ;
63 ; ahora, se imprimen los resultados en una serie de pasos
64 ;
22 CAP
ITULO 1. INTRODUCCI
ON
65 mov eax, outmsg1
66 call print_string ; se imprime el primer mensaje
67 mov eax, [input1]
68 call print_int ; se imprime input1
69 mov eax, outmsg2
70 call print_string ; se imprime el segundo mensaje
72 call print_int ; se imprime input2
73 mov eax, outmsg3
74 call print_string ; se imprime el tercer mensaje
75 mov eax, ebx
76 call print_int ; se imprime la suma (ebx)
77 call print_nl ; se imprime una nueva linea
78
79 popa
80 mov eax, 0 ; retorna a C
81 leave
82 ret
first.asm
La lnea 13 del programa dene una seccion del programa que especica
la memoria al ser almacenada en el segmento de datos ( cuyo nombre es
.data ). Solo los datos iniciados se deberan denir en este segmento. En
las lneas 17 a 21 se declaran varias cadenas. Ellas seran impresas con las
bibliotecas de C y como tal deben estar terminadas con el caracter null (el
codigo ASCII 0). Recuerde que hay una gran diferencia entre 0 y 0.
Los datos no iniciados deberan declararse en el segmento bss (llamado
.bss en la lnea 26). Este segmento toma su nombre de un operador de
ensamblador basado en UNIX que signica block started by simbol. Existe
tambien el segmento de la pila.Sera discutido despues.
El segmento de codigo es llamado .text por razones historicas. Aca es
donde se colocan las instrucciones. Observe que la etiqueta de la rutina
principal (lnea 38) tiene un prejo de guion bajo. Esto es parte de las con-
venciones de llamado de C. Esta convencion especica las reglas que usa C
cuando compila el codigo. Es muy importante conocer esta convencion cuan-
do se interfaza C con ensamblador. Luego se presentara toda la convencion,
sin embargo por ahora uno solo necesita conocer que todos los smbolos de C
( funciones y variables globales ) tienen un guion bajo como prejo anexado
a el por el compilador de C. (Esta regla es especca para Dos/windows, el
compilador de C de linux no antepone nada a los nombres de los smbolos).
La directiva global en la lnea 37 le dice al ensamblador que tome la
etiqueta asm main como global. Como en C, las etiquetas tienen un alcance
interno por defecto. Esto signica que solo el codigo en el mismo modulo
puede usar la etiqueta. La directiva global da a la (s) etiqueta (s) espec-
cadas de (s) un alcance externo. Este tipo de etiqueta puede ser alcanzado
por cualquier modulo en el programa. El modulo asm io declara las etiquetas
print int etc., globales . Este es el porque uno puede usarlas en el modulo
first.asm.
1.4.2. Dependencias del compilador
El codigo de ensamblador de arriba es especco del compilador libre
GNU C/C++
8
DJGPP .
9
Este compilador puede ser descargado libremente
de internet. Requiere un PC 386 o posterior y se ejecuta bajo Dos, Windows
95/98 o NT. Este compilador usa archivos objeto con formato COFF (com-
mon objet le format). Para ensamblar este formato use la opcion -f coff
con nasm (como se muestra en los comentarios del codigo). La extension del
archivo objeto resultante sera o.
El compilador de C de linux tambien es GNU. Para convertir el codigo
para que corra bajo linux simplemente quita los guion bajos de prejos en las
lneas 37 y38. Linux usa el formato ELF (Excecutable an Linkable Format)
para los archivos objetos. Use la opcion -f elf para linux. Tambien produce
un objeto con una extension o. Los archivos de un
compilador dado estan
disponibles en la pagina
web del autor ya modica-
dos para que trabajen con
el compilador apropiado.
Borland C/C++ es otro compilador popular. Usa el formato de OMF
de microsoft para los archivos objeto. Use la opcion -f obj para los com-
piladores de Borland. La extension del archivo objeto sera obj. El formato
OMF utiliza unas directivas de segmento diferentes que los otros formatos
de objetos. El segmento data (lnea 13) se debe cambiar a:
segment DATA public align=4 class=DATA use32
el segmento bss (line 26) se debe cambiar a:
segment BSS public align=4 class=BSS use32
El segmento text (line 36) se debe cambiar a:
segment TEXT public align=1 class=CODE use32
Ademas se debe a nadir una nueva lnea antes de la lnea 36.
group DGROUP BSS DATA
El compilador de Microsoft C/C++ puede usar el formato OMF o el
win 32 para los archivos objeto (si le dan un formato OMF, el convierte la
informacion internamente en win 32). El formato win 32 permite que los
segmentos se denan tal como DJGPP y linux. Use la opcion -f win 32
para este formato. La extension del archivo objeto sera obj.
8
GNU es un proyecto de la Free Software Foundation (http://www.fsf.org)
9
http://www.deloire.com/djgpp
24 CAP
ITULO 1. INTRODUCCI
ON
1.4.3. Ensamblando el codigo
El primer paso es ensamblar el codigo. Desde la lnea de orden digite ;
nasm -f formato-de-objeto first.asm
Donde el formato del objeto es co ,elf , obj o win 32 dependiendo que compi-
lador de C sera usado. (Recuerde que tambien se deben cambiar los archivos
fuente por linux y Borland tambien).
1.4.4. Compilando el codigo de C
Compile el archivo driver.c usando un compilador de C. Para DJGPP,
digite:
gcc -c driver.c
La opcion -c signica que solo compile, no intente encadenar a un. Esta
misma opcion trabaja en los compiladores de Linux, Borland, y Microsoft
tambien.
1.4.5. encadenando los archivos objeto
El encadenamiento es un proceso de combinar el codigo de maquina y
los datos en archivos objeto con archivos de biblioteca para crear un archivo
ejecutable. Como se vera adelante, este proceso es complicado.
El codigo de C requieren la biblioteca estandar de C y un codigo de inicio
especial para ejecutarse. Es mucho mas facil dejar que el compilador de C
llame al encadenador con los parametros correctos que intentar llamar al
encadenador directamente. Por ejemplo encadenar el codigo para el primer
programa utilizando DJGPP, digite:
gcc -o first driver.o first.o asm io.o
Esto crea un ejecutable llamado first.exe (o solo first bajo Linux).
Con Borland uno usara:
bcc32 first.obj driver.obj asm io.obj
Borland usa el nombre del primer archivo en la lista para determinar el
nombre del ejecutable. As en el caso anterior el programa debera llamarse
first.exe.
Es posible combinar el paso de compilar y encadenar. Por ejemplo:
gcc -o first driver.c first.o asm io.o
Ahora gcc compilara driver.C y entonces lo encadenara.
1.4.6. Entender un archivo de listado de ensamblador
La opcion -l archivo-de-listado se puede usar para decirle a nasm
que cree un archivo de listado con un nombre dado. Este archivo muestra
como se ensamblo el codigo. Se muestra como las lneas 17 y 18 (en el
segmento data) aparecen en el archivo de listado. Los n umeros de las lneas
estan en el archivo de listado; sin embargo observe que los n umeros de las
lneas en el archivo fuente pueden no ser los mismas que las del archivo de
listado.
48 00000000 456E7465722061206E- prompt1 db "Enter a number: ", 0
49 00000009 756D6265723A2000
50 00000011 456E74657220616E6F- prompt2 db "Enter another number: ", 0
51 0000001A 74686572206E756D62-
52 00000023 65723A2000
La primera columna en cada lnea es el n umero de lnea y la segunda es el
desplazamiento (en hex) de los datos en el segmento. La tercera columna
muestra los valores en hexadecimal que seran almacenados. En este caso el
dato hexadecimal corresponde a codigos ASCII. Finalmente en la lnea se
muestra el texto del codigo fuente. Los desplazamientos mostrados en la se-
gunda columna son muy probables que no sean los desplazamientos reales,
los datos seran colocados en el programa completo. Cada modulo puede
denir sus propias etiquetas en el segmento de datos ( y en los otros seg-
mentos tambien). En el paso de encadenamientoi vea la Seccion 1.4.5 , todas
estas deniciones de segmentos y etiquetas son combinadas para formar un
solo segmento de datos. El encadenador entonces calcula el desplazamiento
denitivo.
Se muestra una peque na seccion (lneas 54 a 56 del archivo fuente) del
segmento de texto en el archivo de listado.
94 0000002C A1[00000000] mov eax, [input1]
95 00000031 0305[04000000] add eax, [input2]
96 00000037 89C3 mov ebx, eax
La tercera columna muestra el codigo de maquina generado por el ensam-
blador. A menudo el codigo completo de una instruccion no se puede calcular
a un. Por ejemplo, en la lnea 94 el desplazamiento (o direccion) de input1
no se conoce hasta que el codigo se encadene. El ensamblador puede calcu-
lar el codigo de la instruccion mov (que del listado es A1), pero escribe el
desplazamiento en parentesis cuadrados porque el valor exacto no se puede
calcular en este momento. En este caso se utiliza un desplazamiento tempo-
ral de 0 porque input1 esta al inicio de la parte del segmento bss denido
en este archivo. Recuerde que esto no signica que estara al comienzo del
segmento bss denitivo del programa. Cuando el codigo es encadenado, el
26 CAP
ITULO 1. INTRODUCCI
ON
encadenador insertara el desplazamiento en la posicion correcta. Otras in-
strucciones como la lnea 96 no hacen referencia a ninguna etiqueta. Aca el
ensamblador puede calcular el codigo de maquina completo.
Representaciones Big y Little Endian
Si uno mira de cerca en la lnea 95 hay algo muy extra no sobre el de-
splazamiento en los parentesis cuadrados del codigo de maquina. La etiqueta
input2 tiene un desplazamiento de 4 (como esta denido en este archivo); sin
embargo, el desplazamiento que aparece en la memoria no es 0000004, pero
04000000. Por que? Diferentes procesadores almacenan enteros de varios
bytes en ordenes diferentes en la memoria. Existen dos metodos populares
de almacenar enteros: big endian y littel endian. Big endian es el metodo que Endian se pronuncia como
indian.
se ve mas natural. El byte mayor (mas signicativo) se almacena primero, y
luego los siguientes. Por ejemplo, la palabra doble 00000004 se debera alma-
cenar como los cuatro bytes 00 00 00 04. Los mainframes IBM, la mayora de
los procesadores RISC y los procesadores Motorola todos ellos usan el meto-
do de Big endian. Sin embargo los procesadores Intel usan el metodo little
endian. Aca se almacena primero el byte menos signicativo. As 00000004
se almacenara en memoria como 04 00 00 00. Este formato esta cableado en
la CPU y no se puede cambiar. Normalmente el programador no necesita
preocuparse sobre que formato esta usando. Sin embargo hay circunstancias
donde esto es importante.
1. Cuando un dato binario es transere entre computadores diferentes (o
de archivos o a traves de una red)
2. Cuando un dato binario es escrito fuera de la memoria como un entero
multibyte y luego se vuelve a leer como bytes individuales o vice versa
Lo Endian no se aplica al orden de los elementos de un arreglo. El primer
elemento de un arreglo esta siempre en la direccion menor. Esto se aplica a
cadenas (que solo son arreglos de caracteres). Lo Endian solo se aplica a los
elementos idividuales de un arreglo.
1.5. Archivo esqueleto
La Figura 1.7 muestra un archivo esqueleto que se puede usar como
punto de partida para escribir programas en ensamblador
1.5. ARCHIVO ESQUELETO 27
skel.asm
2 segment .data
3 ;
4 ; los datos iniciados se colocan en el segmento de
5 ; datos aca
6 ;
7
8 segment .bss
9 ;
10 ; Datos no iniciados se colocan en el segmento bss
11 ;
12 segment .text
13 global _asm_main
14 _asm_main:
15 enter 0,0 ; rutina de
16 pusha
17
18 ;
19 ; El codigo esta colocado en el segmento de texto. No modifique el
20 ; codigo antes o despues de este comentario
21 ;
22 popa
23 mov eax, 0 ; retornar a C
24 leave
25 ret
skel.asm
Figura 1.7: Programa esqueleto
28 CAP
ITULO 1. INTRODUCCI
ON
Captulo 2
Lenguaje ensamblador basico
2.1. Trabajando con enteros
2.1.1. Representacion de enteros
Hay dos tipos de enteros: sin signo y con signo. Los enteros sin signo
(que son no negativos) estan representados de una manera muy sencilla en
binario. El n umero 200 como un byte entero sin signo sera representado
como 11001000 (o C8 en hex).
Los enteros con signo (que pueden ser positivos o negativos) se repre-
sentan de modo mas complejo. Por ejemplo considere 56. +56 como byte
sera representado por 00111000. En el papel uno podra representar 56
como 111000, pero como podra representarse en un byte en la memoria
del computador? Como se almacenara el signo?
Hay 3 tecnicas que se han usado para representar n umeros enteros en la
memoria del computador. Todos estos metodos usan el bit mas signicativo
como un bit de signo. Este bit es 0 si el n umero es positivo y 1 si es negativo.
Magnitud y signo
El primer metodo es el mas elemental y es llamado magnitud y signo.
Representa los enteros como dos partes. La primera es el bit de signo y la
segunda es la magnitud del entero. As 56 sera representado como el byte
00111000 (el bit de signo esta subrayado) y 56 sera 10111000. El mayor
valor de un byte sera 01111111 o +127 y el menor valor sera 11111111 o
127. Para negar un valor se cambia el bit del signo. Este metodo es sencillo,
pero tiene sus inconvenientes. Primero hay dos valores posibles de cero +0
(00000000) y 0 (10000000). Ya que cero no es ni positivo ni negativo, las dos
representaciones podran servir igual. Esto complica la logica de la aritmetica
para la CPU. Segundo, la aritmetica general tambien es complicada. Si se
29
30 CAP
ITULO 2. LENGUAJE ENSAMBLADOR B
ASICO
a nade 10 a 56, este debe transformarse en la resta de 10 y 56. Una vez
mas, esto complica la logica de la CPU.
Complemento a uno
El segundo metodo es conocido como complemento a uno. El complemen-
to a uno de un n umero se encuentra invirtiendo cada bit en el n umero. (Otra
manera de ver esto es que el nuevo valor del bit es 1 elvalorantiguodelbit).
Por ejemplo el complemento a uno de 00111000 (+56) es 11000111. En la
notacion de complemento a uno calcular el complemento a uno es equiva-
lente a la negacion. As 11000111 es la representacion de 56. Observe que
el bit de signo fue cambiado automaticamente por el complemento a uno y
que como se esperara al aplicar el complemento a 1 dos veces produce el
n umero original. Como el primer metodo hay dos representaciones del cero
00000000 (+0) y 11111111 (0). La aritmetica con n umeros en complemento
a uno es complicada.
Hay un truco util para encontrar el complemento a 1 de un n umero en
hexadecimal sin convertirlo a binario. El truco es restar el n umero hexadec-
imal de F (o 15 en decimal) . Este metodo supone que el n umero de dgitos
binarios en el n umero es un m ultiplo de 4. Un ejemplo: +56 se representa
por 38 en hex. Para encontrar el complemento a 1 reste F de cada dgito
para obtener C7 en hexadecimal. Esto es coherente con el resultado anterior.
Complemento a dos
Los dos primeros metodos descritos fueron usados en los primeros com-
putadores. Los computadores modernos usan un tercer metodo llamado la
representacion en complemento a 2. El complemento a 2 de un n umero se
halla con los dos pasos siguientes:
1. Hallar el complemento a uno del n umero.
2. Sumar uno al resultado del paso 1.
Aca esta un ejemplo usando 00111000 (56). Primero se calcula el comple-
mento a uno: 11000111. Entonces se a nade uno:
11000111
+ 1
11001000
En la notacion de complemento a dos, calcular el complemento a dos es
equivalente a negar el n umero. As 11001000 es la representacion en comple-
mento a dos de 56. Dos negaciones deberan reproducir el n umero original.
2.1. TRABAJANDO CON ENTEROS 31
Number Hex Representation
0 00
1 01
127 7F
-128 80
-127 81
-2 FE
-1 FF
Cuadro 2.1: Representacion de complemento a dos
Sorprendentemente el complemento a dos no re une este requisito. Tome el
complemento a dos de 11001000 a nadiendo uno al complemento a uno.
00110111
+ 1
00111000
Cuando realizamos la suma en una operacion en complemento a dos, la
suma del bit del extremo izquierdo puede producir un carry. Este carry no
se usa. Recuerde que todos los datos en el computador son de un tama no
jo (en terminos de n umeros de bits). Sumar 2 bytes siempre produce como
resultado un byte (tal como sumar 2 palabras produce otra palabra, etc.).
Esta propiedad es importante para la notacion en complemento a dos. Por
ejemplo, considere el cero como un n umero en complemento a dos de un
byte (00000000). Calcular el complemento a 2 produce la suma:
11111111
+ 1
c 00000000
donde c representa un carry (luego se mostrara como detectar este carry,
pero no se almacena en el resultado). As en la notacion de complemento a
dos existe solo un cero. Esto hace la aritmetica de complemento a dos mas
simple que los metodos anteriores.
Usando la notacion en complemento a dos un byte con signo se puede usar
para representar los n umeros desde 128 hasta +127. La Tabla 2.1 muestra
algunos valores seleccionados. Si se usan 16 bits, se pueden representar los
n umeros con signo desde 32,768 hasta 32,767 que esta representado por
7FFF, 32,768 por 8000, 128 como FF80 y -1 como FFFF. Los n umeros
de 32 bits en complemento a dos estan en el rango de 2 mil millones a +2
mil millones aproximadamente.
La CPU no tiene ni idea que supuesta representacion tiene un byte en
particular (palabra, o palabra doble). El ensamblador no tiene ni idea de los
32 CAP
ASICO
tipos de datos que tienen los lenguajes de alto nivel. Como se interpretan
los datos depende de que instruccion se usa con el dato. Si el valor FF
es considerado para representar 1 o +255 depende del programador. El
lenguaje C dene tipos de entero con y sin signo (Signed, unisigned). Esto
le permite al compilador determinar las instrucciones correctas a usar con
el dato.
2.1.2. Extension del signo
En ensamblador, todos los datos tienen un tama no determinado. No es
raro necesitar cambiar el tama no del dato para usarlo con otro dato. Reducir
el tama no es facil.
Reduciendo el tama no de los datos
Para reducir el tama no del dato simplemente quite los bits mas signi-
cativos del dato. Un ejemplo trivial:
mov ax, 0034h ; ax = 52 (almacenado en16 bits)
mov cl, al ; cl = los 8-bits inferiores de ax
Claro esta, si el n umero no se puede representar correctamente en el
tama no mas peque no la reduccion de tama no no funcionara. Por ejemplo
si AX era 0134h (o 308 en decimal) entonces el codigo anterior almacenara
en CL 34h. Este metodo trabaja con n umeros con o sin signo. Considere
n umeros con signo, si AX era FFFFh (-1 como palabra), entonces code CL
sera FFh (1 como byte). Sin embargo, observe que esto no es correcto si
el valor en AX era sin signo!
La regla para n umeros sin signo es que todos los bits al ser quitados
deben ser 0 para que la conversion sea correcta. La regla para los n umeros
con signo es que los bits que sean quitados deben ser o todos 1o todos 0.
Ademas el primer bit no se debe quitar pero debe tener el mismo valor que
los bits quitados. Este bit sera el nuevo bit de signos del valor mas peque no.
Es importante que sea el bit del signo original.
Aumentando el tama no de los datos
Incrementar el tama no de los datos es mas complicado que disminuirlo.
Considere el byte hex FF. Si se extiende a una palabra, Que valor debera
tener la palabra? Depende de como se interprete la palabra. Si FF es un
byte sin signo (255 en decimal), entonces la palabra debera ser 00FF; sin
embargo, si es un byte con signo (1 en decimal), entonces la palabra debera
ser FFFF.
En general, para extender un n umero sin signo, uno hace cero todos
los bits nuevos del n umero extendido. As FF se convierte en 00FF. Sin
embargo, para extender un n umero con signo uno debe extender el bit de
signo. Esto signica que los nuevos bits se convierten en copias del bit de
signo. Ya que el bit de signo de FF es 1, los nuevos bits deben ser todos
unos, para producir FFFF. Si el n umero con signo 5A (90 en decimal) fue
extendido, el resultado sera 005A.
Existen varias instrucciones que suministra el 80386 para la extension de
los n umeros. Recuerde que el computador no conoce si un n umero esta con o
sin signo. Es responsabilidad del programador usar la instruccion adecuada.
Para n umeros sin signo, uno puede simplemente colocar ceros en los bits
superiores usando una instruccion MOV. Por ejemplo, para extender el byte
en AL a una palabra sin signo en AX:
mov ah, 0 ; cero los 8-bits superiores
Sin embargo, no es posible usar la instruccion MOV para convertir la palabra
sin signo en AX a una palabra doble en EAX. Por que no? No hay manera
de referirse a los 16 bits superiores de EAX con una instruccion MOV. El 80386
resuelve este problema con una nueva instruccion MOVZX . Esta instruccion
tiene dos operandos. El destino (primer operando) debe ser un registro de 16
o 32 bits. La fuente (segundo operando) puede ser un registro de 8 o 16 bits
o un byte o una palabra en memoria. La otra restriccion es que el destino
debe ser mayor que la fuente (la mayora de instrucciones requieren que la
fuente y el destino sean del mismo tama no). Algunos ejemplos:
movzx eax, ax ; extiende ax en eax
movzx eax, al ; extiende al en eax
movzx ax, al ; extiende al en ax
movzx ebx, ax ; extiende ax en ebx
Para n umeros con signo, no hay una manera facil de usar la instruccion
MOV. EL 8086 suministra varias instrucciones para extender n umeros con
signo. La instruccion CBW (Convert Byte to Word) extiende el registro AL
en AX. Los operandos son implcitos. La instruccion CWD (Convert Word
to Double Word) extiende AX en DX:AX. La notacion DX:AX signica in-
terpretar los registros DX y AX como un registro de 32 bits con los 16 bits
superiores almacenados en DX y los 16 bits inferiores en AX. (Recuerde
que el 8086 no tena ning un registro de 32 bits). El 80386 a nadio varias
instrucciones nuevas. La instruccion CWDE (Convert Word to Double word
Extended) extiende AX en EAX. La instruccion CDQ (Convert Double word
to Quad word) extiende EAX en EDX:EAX (64 bits!). Finalmente, la in-
struccion MOVSX trabaja como MOVZX excepto que usa las reglas para n umeros
con signo.
34 CAP
ASICO
unsigned char uchar = 0xFF;
signed char schar = 0xFF;
int a = (int ) uchar ; / a = 255 (0x000000FF) /
int b = (int) schar ; / b = 1 (0xFFFFFFFF) /
Figura 2.1:
char ch;
while( (ch = fgetc(fp)) != EOF ) {
/ hace algo con ch /
}
Figura 2.2:
Aplicacion a la programacion en C
Extender enteros con y sin signo tambien ocurre en C. Las variables en C ANSI C no dene si el tipo
char es con signo o no,
es responsabilidad de ca-
da compilador decidir esto.
Esta es la razon por la cual
el tipo esta explcitamente
denido en la Figura 2.1.
se pueden declarar como int signed o unsigned (int es signed) . Considere el
codigo de la Figura 2.1. En la lnea 3, la variable code a se extiendo usando
las reglas para valores sin signo (usando MOVZX), pero en la lnea 4 se usan
las reglas con signo para b (usando MOVSX).
Hay un error muy com un en la programacion en C que tiene que ver
con esto directamente. Considere el codigo de la Figura 2.2. El prototipo de
fgetc( ) es: fgetc()is:
int fgetc( FILE * );
Uno podra preguntar Por que la funcion retorna un int siendo que lee
caracteres? La razon es que normalmente retorna un char (extendido a un
valor entero usando la extension cero). Sin embargo hay un valor que puede
retornar que no es un caracter, EOF. Este es un macro que normalmente se
dene como 1. As fgetc() o retorna un caracter extendido a entero (que
es como 000000xx en hex) o EOF (que es FFFFFFF en hex).
El problema principal con el programa de la Figura 2.2 es que fgetc()
retorna un entero, pero este valor se almacena en un char. C truncara los
bits de mayor peso para que el entero quepa en el caracter. El unico problema
es que los n umeros (en hex) 000000FF y FFFFFFFF ambos se truncaran al
byte FF. As el ciclo while no puede distinguir entre el byte FF y el n de
archivo (EOF).
Lo que sucede exactamente en este caso, depende de si el char es con
signo o sin signo por que? Porque en la lnea 2 ch es comparada con EOF.
Ya que EOF es un valor int.
1
ch sera extendido a un int de modo que los
dos valores comparados sean del mismo tama no.
2
como se muestra en la
Figura 2.1, donde si la variable es con signo o sin signo es muy importante.
Si char es unsigned, FF se extendera a 000000FF. Esto se compara con
EOF (FFFFFFFF) y encontrara que no es igual. As, el bucle nunca terminara!.
Si char es con signo se extendera a FFFFFFFF. Esto se compara como
igual y el bucle naliza. Sin embargo, ya que el byte FF puede haber sido
ledo de un archivo, el bucle podra terminar prematuramente.
La solucion a este problema es denir la variable ch como un int no
como un char. Cuando esto se hace no se truncara o extendera en la lnea 2.
Dentro del bucle es seguro truncar el valor ya que ah ch debe ser un simple
byte.
2.1.3. Aritmetica de complemento a dos
Como se vio al principio, la instruccion add efect ua una suma y la in-
struccion sub efect ua una resta. Dos de los bits en el registro FLAGS, que
estas instrucciones jan son las banderas de desborde y carry. La bandera
de desborde se ja si el resultado verdadero de la operacion es muy grande
para caber en el destino para aritmetica con signo. La bandera de carry se
ja si hay carry en el bit mas signicativo de una suma o un prestamo en
el bit mas signicativo de una resta. As, el se puede usar para detectar un
desborde para aritmetica sin signo. Los usos de la bandera de carry para
aritmetica con signo se veran dentro de poco. Una de las grandes ventajas
del complemento a 2 es que las reglas para la adicion y sustraccion son exac-
tamente las mismas que para los enteros sin signo. As add y sub se pueden
usar con enteros con o sin signo.
002C 44
+ FFFF + (1)
002B 43
Hay un carry generado, pero no es parte de la respuesta.
1
Es un concepto erroneo pensar que los archivos tienen un caracter EOF al nal. Esto
no es verdad!
2
La razon para este requerimiento se mostrara luego.
36 CAP
ASICO
dest source1 source2 Action
reg/mem8 AX = AL*source1
reg/mem16 DX:AX = AX*source1
reg/mem32 EDX:EAX = EAX*source1
reg16 reg/mem16 dest *= source1
reg32 reg/mem32 dest *= source1
reg16 immed8 dest *= immed8
reg16 reg/mem16 immed8 dest = source1*source2
Cuadro 2.2: instrucciones imul
Hay dos instrucciones diferentes para multiplicar y dividir. Primero para
multiplicar use la instruccion MUL o IMUL. La instruccion MUL se emplea para
multiplicar n umeros sin signo e IMUL se usa para multiplicar enteros con
signo. Por que se necesitan dos instrucciones diferentes? Las reglas para la
multiplicacion son diferentes para n umeros en complemento a dos con signo
o sin signo. Como as? Considere la multiplicacion del byte FF con s mismo
dando como resultado una palabra. Usando una multiplicacion sin signo es
255 veces 255 o 65025 (o FE01 en hex). Usando la multiplicacion con signo
es 1 veces 1 (o 0001 en hex).
Hay varias formas de las instrucciones de multiplicacion. La mas antigua
es:
mul source
source es un registro o una referencia a memoria. No puede ser un valor
inmediato. Exactamente que multiplicacion se realiza depende del tama no
del operando source. Si el operando es de un byte, este es multiplicado por
el byte del registro AL y el resultado se almacena en los 16 bits de AX. Si
la fuente es de 16 bits, se multiplica por la palabra en AX y el resultado de
32 bits se almacena en DX:AX. Si la fuente es de 32 bits este se multiplica
por EAX y el resultado de 64 bits se almacena en EDX:EAX.
La instruccion IMUL tiene la misma forma de MUL, pero tambien tiene
algunos otros formatos. Hay dos y tres formas de operandos.
imul dest, source1
imul dest, source1, source2
La Tabla 2.2 muestra las posibles combinaciones.
Los dos operadores para la division son DIV e IDIV. Ellas efect uan la
division sin signo y con signo respectivamente. El formato general es:
div source
Si la fuente es de 8 bits, entonces AX es dividido por el operando. El cociente
se almacena en AL y el residuo en ah. Si la fuente es de 16 bits, entonces
DX:AX se divide por el operando. El cociente se almacena en AX y el resid-
uo en DX. Si la fuente es de 32 bits, entonces EDX:EAX se divide por el
operando y el cociente se almacena en EAX y el residuo en EDX. La in-
struccion IDIV trabaja de la misma manera. No hay instrucciones especiales
IDIV como las especiales en IMUL. Si el cociente es muy grande para caber
en el registro o el divisor es cero, el programa se interrumpe y termina. Un
error muy com un es olvidar iniciar DX o EDX antes de la division.
La instruccion NEG niega su operando calculando su complemento a dos.
El operando puede ser cualquier registro de 8, 16 o 32 bits o un lugar de
memoria.
2.1.4. Programa de ejemplo
math.asm
38 CAP
ASICO
2 segment .data ; Cadenas de salida
3 prompt db "Digite un numero: ", 0
4 square_msg db "La entrada al cuadrado es ", 0
5 cube_msg db "La entrada al cubo es ", 0
6 cube25_msg db "La entrada al cubo 25 veces es ", 0
7 quot_msg db "El cociente del cubo/100 es ", 0
8 rem_msg db "El residuo del cube/100 es ", 0
9 neg_msg db "La negacion del residuo es ", 0
10
11 segment .bss
12 input resd 1
13
14 segment .text
15 global _asm_main
16 _asm_main:
17 enter 0,0 ; rutina de inicio
18 pusha
19
20 mov eax, prompt
22
23 call read_int
24 mov [input], eax
25
26 imul eax ; edx:eax = eax * eax
27 mov ebx, eax ; guarda la respuesta en ebx
28 mov eax, square_msg
30 mov eax, ebx
31 call print_int
32 call print_nl
33
34 mov ebx, eax
35 imul ebx, [input] ; ebx *= [input]
36 mov eax, cube_msg
38 mov eax, ebx
39 call print_int
40 call print_nl
41
42 imul ecx, ebx, 25 ; ecx = ebx*25
43 mov eax, cube25_msg
45 mov eax, ecx
46 call print_int
47 call print_nl
48
49 mov eax, ebx
50 cdq ; inicia edx con la extension de signo
51 mov ecx, 100 ; no puede dividirse por el valor inmediato
52 idiv ecx ; edx:eax / ecx
53 mov ecx, eax ; guarda el cociente ecx
54 mov eax, quot_msg
56 mov eax, ecx
57 call print_int
58 call print_nl
59 mov eax, rem_msg
61 mov eax, edx
62 call print_int
63 call print_nl
64
65 neg edx ; niega el residuo
66 mov eax, neg_msg
68 mov eax, edx
69 call print_int
70 call print_nl
71
72 popa
74 leave
75 ret
2.2. ESTRUCTURAS DE CONTROL 39
math.asm
2.1.5. Aritmetica de precision extendida
El lenguaje ensamblador tambien suministra instrucciones que le permi-
tan a uno hacer operaciones de suma y resta de n umeros mas grandes que
palabras dobles. Como se vio antes las instrucciones ADD y SUB modican la
bandera de carry si se ha generado un carry o un prestamo respectivamente.
Esta informacion almacenada en la bandera de carry se puede usar para
sumar o restar n umeros grandes dividiendo la operacion en piezas peque nas
de palabras dobles (o menores).
Las instrucciones ADC y SBB usan esta informacion en la bandera de carry.
La instruccion ADC hace la siguiente operacion:
operando1 = operando1 + bandera de carry + operando2
La instruccion SBB realiza:
operando1 = operando1 - bandera de flag - operando2
Como se usan? Considere la suma de enteros de 64 bits en EDX:EAX y
EBX:ECX . El siguiente codigo poda almacenar la suma en EDX:EAX
1 add eax, ecx ; suma los 32-bits inferiores
2 adc edx, ebx ; suma los 32-bits superiores y el carry de la suma anterior
La resta es muy similar. El siguiente codigo resta EBX:ECX de EDX:EAX
1 sub eax, ecx ; resta los 32-bits inferiores
2 sbb edx, ebx ; resta los 32-bits superiores y el prestamo
Para n umeros realmente grandes, se puede usar un bucle (vea seccion
2.2). Para el bucle suma sera conveniente usar la instruccion ADC para
cada iteracion (en todas menos la primera). Esto se puede hacer usando la
instruccion CLC (CLear Carry) antes que comience el bucle para iniciar la
bandera de carry a cero. Si la bandera de carry es cero no hay diferencia
entre ADD y ADC. La misma idea se puede usar tambien para la resta.
2.2. Estructuras de control
Los lenguajes de alto nivel suministran estructuras del alto nivel (instruc-
ciones if while), que controlan el ujo de ejecucion. El lenguaje ensamblador
no suministra estas complejas estructuras de control. En lugar de ello usa el
difamado goto y su uso inapropiado puede resultar en un codigo spaghetTi!
Sin embargo es posible escribir programas estructurados en ensamblador.
El procedimiento basico es dise nar la logica del programa usando las estruc-
turas de control de alto nivel y traducir el dise no en lenguaje ensamblador
apropiado (parecido a lo que hara el compilador).
40 CAP
ASICO
2.2.1. Comparaciones
Las estructuras de control deciden que hacer basados en la comparacion
de datos. En ensamblador, el resultado de una comparacion se almacenan
en el registro FLAGS para usarlas luego. El 80x86 suministra la instruccion
CMP para realizar comparaciones. El registro FLAGS se ja basado en la
diferencia de los dos operandos de la instruccion CMP. Los operandos se
restan y se ja el registro FLAGS basado en el resultado, pero el resultado
no se almacena en ninguna parte. Si necesita el resultado use la instruccion
SUB en lugar de la instruccion CMP. Para enteros sin signos hay dos banderas
(bits en el registro FLAGS) que son importante: cero (ZF) y carry (CF). La
bandera cero se ja si el resultado de la resta es cero. La bandera carry se
usa como bandera de prestamo para la resta. Considere una comparacion
como:
cmp vleft, vright
La resta de vleft - vright se calcula y las banderas se jan de acuerdo
al resultado. Si la diferencia de CMP es cero, vleft = vright, entonces ZF
se ja (ZF=1) y CF se borra (CF=0). Si vleft > vright, entonces ZF se
borra y CF tambien (no hay prestamo). Si vleft < vright, entonces ZF
se borrara y CF se jara (hay prestamo).
Para enteros con signo, hay tres banderas que son importante: la bandera
cero (ZF), la bandera de desborde (OF) y la bandera de signo (SF). La Por que hace SF = OF
si vleft > vright? Si no
hay desborde, entonces la
diferencia tendra el valor
correcto y debe ser no neg-
ativo. As, SF = OF = 0.
Sin embargo, si hay un
desborde, la diferencia no
tendra el valor correcto (y
de hecho sera negativo).
As SF = OF = 1.
bandera de desborde se ja si el resultado de una operacion se desborda (o
underows). La bandera de signo se ja si el resultado de una operacion es
negativo. Si vleft = vright, la ZF se ja ( tal como para los enteros sin
signo). Si vleft > vright, ZF es cero y SF = OF. Si vleft < vright, ZF
es cero y SF = OF.
No olvide que otras instrucciones tambien cambian el registro FLAGS,
no solo CMP.
2.2.2. Instrucciones de ramicacion
Las instrucciones de ramicacion pueden transferir la ejecucion de un
programa a un punto arbitrario. En otras palabras funcionan como goto.
Hay dos tipos de ramicaciones: condicionales e incondicionales. Una ram-
icacion incondicional es tal cual como goto, siempre hace el salto. Una
ramicacion condicional puede o no hacer el salto dependiendo de las ban-
deras del registro FLAGS. Si una ramicacion condicional no hace el salto,
el control pasa a la siguiente instruccion.
La instruccion JMP (acronimo de jump) hace ramicaciones incondi-
cionales. Su argumento normalmente es una etiqueta de codigo a la instruc-
cion a la cual se debe saltar. El ensamblador o el encadenador reemplazara la
etiqueta con la direccion correcta de la instruccion. Esta es otra de las labores
aburridas que realiza el ensamblador para hacer la vida del programador mas
facil. Es importante tener en cuenta que la instruccion inmediatamente de-
spues de la instruccion JMP nunca se ejecutara a menos que otra instruccion
salte a ella.
Hay variaciones de la instruccion de salto.
SHORT Este salto es de tama no muy limitado, solo se puede mover ar-
riba o abajo 128 bytes en memoria. La ventaja de este tipo es que
usa menos memoria que otros. Usa un byte con signo para almace-
nar el desplazamiento del salto. El desplazamiento es cuantos bytes
se mueve adelante o atras. (El desplazamiento se a nade a EIP). Para
especicar un salto corto, use la palabra SHORT inmediatamente antes
de la etiqueta en la instruccion JMP.
NEAR Este salto es el tipo por defecto en las ramicaciones condicionales
e incondicionales y se puede usar para saltar a cualquier lugar del seg-
mento. Actualmente el 80386 soporta 2 tipos de saltos cercanos. Uno
usa dos bytes para el desplazamiento. Esto le permite a uno moverse
aproximadamente 32000 bytes arriba o abajo. El otro tipo usa cuatro
bytes para el desplazamiento, que le permite a uno moverse a cualquier
lugar en el segmento de codigo. El tipo de 4 bytes es el de defecto en
el modo protegido del 386. El tipo de 2 bytes se puede especicar colo-
cando la palabra WORD antes de la etiqueta en la instruccion JMP.
FAR Este salto permite mover el control a otro segmento de codigo. Este
es una cosa muy rara para hacerla en el modo protegido del 386.
Las etiquetas de codigo validas siguen las mismas reglas que las etique-
tas de datos. Las etiquetas de codigo estan denidas para colocarlas en el
segmento de codigo al frente de la instruccion sus etiquetas. Dos puntos se
colocan al nal de la etiqueta en este punto de la denicion. Los dos puntos
no son parte del nombre.
Hay muchas instrucciones de ramicacion condicional diferentes. Ellas
tambien toman la etiqueta como su operando. Las mas sencillas solo ven
una bandera en el registro FLAGS para determinar si salta o no. Vea la
Tabla 2.3 para una lista de estas instrucciones (PF es la bandera de paridad
que indica si el n umero de unos en los 8 bit inferiores es par o impar).
El siguiente pseudocodigo:
if ( EAX == 0 )
EBX = 1;
else
EBX = 2;
42 CAP
ASICO
JZ salta solo si ZF es uno
JNZ salta solo si ZF es cero
JO salta solo si OF es uno
JNO salta solo si OF es cero
JS salta solo si SF es uno
JNS salta solo si SF es cero
JC salta solo si CF es uno
JNC salta solo si CF es cero
JP salta solo si PF es uno
JNP salta solo si PF es cero
Cuadro 2.3: Saltos condicionales simples
Se podra escribir en ensamblador como:
1 cmp eax, 0 ; establece las banderas (ZF se fija si eax - 0 = 0)
2 jz thenblock ; si ZF es 1 salta a thenblock
3 mov ebx, 2 ; parte ELSE del if
4 jmp next ; salta sobre la parte THEN del IF
5 thenblock:
6 mov ebx, 1 ; parte THEN del IF
7 next:
Las otras comparaciones no son faciles usando las ramicaciones condi-
cionales de la Tabla 2.3 Para ilustrar esto considere el siguiente pseudocodi-
go:
if ( EAX >= 5 )
EBX = 1;
else
EBX = 2;
Si EAX es mayor que o igual a 5, ZF debe estar ja o borrada y SF sera igual
a OF. Aqu esta el codigo en ensamblador que prueba estas condiciones
(asumiendo que EAX es con signo):
1 cmp eax, 5
2 js signon ; salta a signon si SF = 1
3 jo elseblock ; salta a elseblock si OF = 1 y SF = 0
4 jmp thenblock ; salta a thenblock si SF = 0 y OF = 0
5 signon:
6 jo thenblock ; salta a thenblock si SF = 1 y OF = 1
7 elseblock:
8 mov ebx, 2
Signed Unsigned
JE salta si vleft = vright JE salta si vleft = vright
JNE salta si vleft = vright JNE salta si vleft = vright
JL, JNGE salta si vleft <vright JB, JNAE salta si vleft <vright
JLE, JNG salta si vleft vright JBE, JNA salta si vleft vright
JG, JNLE salta si vleft >vright JA, JNBE salta si vleft >vright
JGE, JNL salta si vleft vright JAE, JNB salta si vleft vright
Cuadro 2.4: Instrucciones de comparacion con y sin signo
9 jmp next
10 thenblock:
11 mov ebx, 1
12 next:
El codigo anterior es muy complicado. Afortunadamente, el 80x86 sum-
inistra otras instrucciones de ramicacion que hace este tipo de pruebas
mucho mas facil. Hay versiones con y sin signo para cada tipo. La Tabla 2.4
muestra estas instrucciones. Las ramicaciones igual y no igual (JE y JNE)
son identicas para enteros con y sin signo. (De hecho JE y JNE son las mis-
mas que JZ y JNZ respectivamente). Cada una de las otras instrucciones
de ramicacion tienen dos sinonimos. Por ejemplo mire que JL (jump less
than) y JNGE (jump not greater than or equal to). Son la misma instruccion
porque:
x < y =not(x y)
Las ramicaciones sin signo usan A por above y B para below en lugar de L
y G.
Usando estas nuevas instrucciones de ramicacion, el pseudocodigo de
arriba puede ser traducido a ensamblador mucho mas facil.
1 cmp eax, 5
2 jge thenblock
3 mov ebx, 2
4 jmp next
5 thenblock:
6 mov ebx, 1
7 next:
2.2.3. Instrucciones de bucle
El 80x86 suministra varias instrucciones para implementar bucles del
tipo for. Cada una de esas instrucciones tiene una etiqueta como unico
operando.
44 CAP
ASICO
LOOP Decrementa ECX, si ECX = 0, salta a la etiqueta
LOOPE, LOOPZ Decrementa ECX (el registro FLAGS no se modica),
si ECX = 0 y ZF = 1, salta
LOOPNE, LOOPNZ Decrementa ECX (FLAGS sin cambio), si ECX =
0 y ZF = 0, salta
Las dos ultimas instrucciones de bucle son utiles para bucles de b usqueda
secuencial. El siguiente pseudocodigo:
sum = 0;
for ( i =10; i >0; i )
sum += i;
Podra ser traducido a ensamblador como:
1 mov eax, 0 ; eax es sum
2 mov ecx, 10 ; ecx es i
3 loop_start:
4 add eax, ecx
5 loop loop_start
2.3. Traducir estructuras de control estandares
Esta seccion muestra como las estructuras de control estandares de los
lenguajes de alto nivel se pueden implementar en lenguaje ensamblador.
2.3.1. instrucciones if
El siguiente pseudocodigo:
if ( ocondicin )
bloque entonces;
else
bloque else;
podra implementarse como:
1 ; code to set FLAGS
2 jxx else_block ; selecciona xx tal que salta si la condicion es falsa
3 ; codigo para bloque entonces
4 jmp endif
5 else_block:
6 ; codigo para bloque else
7 endif:
2.3. TRADUCIR ESTRUCTURAS DE CONTROL EST
ANDARES 45
Si no hay else, entonces el else block ramicado puede ser reemplazado
por una rama a endif. If there is no else, then the else block branch can
be replaced by a branch to endif.
1 ; code to set FLAGS
2 jxx endif ; selecciona xx tal que salta si la condicion es falsa
3 ; codigo para el bloque entonces
4 endif:
2.3.2. bucles while
El bucle while se prueba al inicio del bucle:
while( ocondicin ) {
cuerpo del bucle;
}
Esto podra traducirse en:
1 while:
2 ; c odigo que fija FLAGS basado en la condicion de
3 jxx endwhile ; selecciona xx tal que salte si xx es falso
4 ; body of loop
5 jmp while
6 endwhile:
2.3.3. bucles do while
El bucle do while se prueba al nal del bucle:
do {
cuerpo del bucle;
} while( ocondicin );
Esto podra ser traducido en:
1 do:
2 ; cuerpo del bucle
3 ; c odigo para fijar FLAGS basado en la condicion
4 jxx do ; seleccionar xx tal que salte si es verdadero
46 CAP
ASICO
unsigned guess; / La conjetura actual para el primo /
unsigned factor ; / el posible factor /
unsigned limit ; / encontrar primos hasta este valor /
printf (Find primes up to : );
scanf( %u, &limit);
printf (2\n); / trata los dos primeros primos /
printf (3\n); / como caso especial /
guess = 5; / conjetura inicial /
while ( guess <= limit ) {
/ busca un factor /
factor = 3;
while ( factor factor < guess &&
guess % factor != 0 )
factor += 2;
if ( guess % factor != 0 )
printf ( %d\n, guess);
guess += 2; / oslo busca en los unmeros impares /
}
Figura 2.3:
2.4. Ejemplo: hallar n umeros primos
Esta seccion trata de un programa que encuentra n umeros primos. Re-
cuerde que un n umero primo es divisible solo por 1 y por s mismo. No hay
formula para hacer esto. El metodo basico de este programa es encontrar los
factores de todos los n umeros impares
3
bajo un lmite dado. Si no se puede
encontrar un factor para un n umero impar, es primo La Figura 2.3 muestra
el algoritmo basico escrito en C.
Aca esta la version en ensamblador
prime.asm
2 segment .data
3 Message db "Halle primos hasta: ", 0
4
5 segment .bss
6 Limit resd 1 ; halle primos hasta este lmite
7 Guess resd 1 ; la conjetura actual para el primo
8
3
2 es el unico n umero par.
2.4. EJEMPLO: HALLAR N
UMEROS PRIMOS 47
9 segment .text
10 global _asm_main
11 _asm_main:
12 enter 0,0 ; rutina de inicio
13 pusha
14
15 mov eax, Message
17 call read_int ; scanf("%u", & limit );
18 mov [Limit], eax
19
20 mov eax, 2 ; printf("2\n");
21 call print_int
22 call print_nl
23 mov eax, 3 ; printf("3\n");
24 call print_int
25 call print_nl
26
27 mov dword [Guess], 5 ; Guess = 5;
28 while_limit: ; while ( Guess <= Limit )
29 mov eax,[Guess]
30 cmp eax, [Limit]
31 jnbe end_while_limit ; use jnbe ya que los numeros son sin signo
32
33 mov ebx, 3 ; ebx is factor = 3;
34 while_factor:
35 mov eax,ebx
36 mul eax ; edx:eax = eax*eax
37 jo end_while_factor ; Si la respuesta no cabe en eax
38 cmp eax, [Guess]
39 jnb end_while_factor ; if !(factor*factor < guess)
40 mov eax,[Guess]
41 mov edx,0
42 div ebx ; edx = edx:eax % ebx
43 cmp edx, 0
44 je end_while_factor ; if !(guess % factor != 0)
45
46 add ebx,2 ; factor += 2;
47 jmp while_factor
48 end_while_factor:
49 je end_if ; if !(guess % factor != 0)
50 mov eax,[Guess] ; printf("%u\n")
48 CAP
ASICO
51 call print_int
52 call print_nl
53 end_if:
54 add dword [Guess], 2 ; guess += 2
55 jmp while_limit
56 end_while_limit:
57
58 popa
60 leave
61 ret
prime.asm
Captulo 3
Operaciones con bits
3.1. Operaciones de desplazamientos
El lenguaje ensamblador le permite al programador manipular bits indi-
viduales de los datos. Una operacion com un es llamada un desplazamiento.
Una operacion de desplazamiento mueve la posicion de los bits de alg un
dato. Los desplazamientos pueden ser hacia la izquierda (hacia el bit mas
signicativo) o hacia la derecha (el bit menos signicativo).
3.1.1. Desplazamientos logicos
Un desplazamiento logico es el tipo mas simple de desplazamiento. De-
splaza de una manera muy directa. La Figura 3.1 muestra un ejemplo del
desplazamiento de un byte.
Original 1 1 1 0 1 0 1 0
Left shifted 1 1 0 1 0 1 0 0
Right shifted 0 1 1 1 0 1 0 1
Figura 3.1: Desplazamientos logicos
Observe que los nuevos bits son siempre cero. Se usan las instrucciones
SHL y SHR para realizar los desplazamientos a la izquierda y derecha re-
spectivamente. Estas instrucciones permiten desplazar cualquier n umero de
posiciones. El n umero de posiciones puede ser o una constante o puede estar
almacenado en el registro CL. El ultimo bit desplazado se almacena en la
bandera de carry. A continuacion, algunos ejemplos:
1 mov ax, 0C123H
2 shl ax, 1 ; desplaza un bit a la izquierda, ax = 8246H, CF = 1
3 shr ax, 1 ; desplaza un bit a la derecha, ax = 4123H, CF = 0
4 shr ax, 1 ; desplaza un bit a la derecha, ax = 2091H, CF = 1
49
50 CAP
ITULO 3. OPERACIONES CON BITS

5 mov ax, 0C123H
6 shl ax, 2 ; desplaza dos bit a la izquierda, ax = 048CH, CF = 1
7 mov cl, 3
8 shr ax, cl ; desplaza tres bit a la derecha, ax = 0091H, CF = 1
3.1.2. Uso de los desplazamientos
Los usos mas comunes de las operaciones de desplazamientos son las
multiplicaciones y divisiones rapidas. Recuerde que en el sistema decimal la
multiplicacion y division por una potencia de 10 es sencilla, solo se desplazan
los dgitos. Lo mismo se aplica para las potencias de dos en binario. Por
ejemplo para duplicar el n umero binario 1011
2
(o 11 en decimal), al desplazar
una vez a la izquierda obtenemos 10110
2
(o 22). El cociente de una division
por una potencia de dos es el resultado de un desplazamiento a la derecha.
Para dividir por 2 solo haga un desplazamiento a la derecha; para dividir
por 4 (2
2
) desplace los bits 2 lugares; para dividir por 8 desplace 3 lugares a
la derecha etc. Las instrucciones de desplazamiento son muy elementales y
son mucho mas rapidas que las instrucciones correspondientes MUL y DIV .
Actualmente, los desplazamientos logicos se pueden usar para multiplicar
y dividir valores sin signo. Ellos no funcionan para valores con signo. Con-
sidere el valor bytes FFFF (1). Si este se desplaza logicamente a la derecha
una vez el resultado es 7FFF que es +32,767. Se pueden usar otro tipo de
desplazamientos para valores con signo.
3.1.3. Desplazamientos aritmeticos
Estos desplazamientos estan dise nados para permitir que n umeros con
signo se puedan multiplicar y dividir rapidamente por potencias de 2. Ellos
aseguran que el bit de signo se trate correctamente.
SAL (Shift aritmetic left). Esta instruccion es solo sinonimo para SHL. Se
ensambla con el mismo codigo de maquina que SHL. Como el bit de
signo no se cambia por el desplazamiento, el resultado sera correcto.
SAR
SAR Shift Arithmetic Right - Esta es una instruccion nueva que no desplaza
el bit de signo (el bit mas signicativo) de su operando. Los otros bits
se desplazan como es normal excepto que los bits nuevos que entran
por la derecha son copias del bit de signo (esto es, si el bit de signo
es 1, los nuevos bits son tambien 1). As, si un byte se desplaza con
esta instruccion, solo los 7 bits inferiores se desplazan. Como las otras
instrucciones de desplazamiento, el ultimo bit que sale se almacena en
la bandera de carry.
3.1. OPERACIONES DE DESPLAZAMIENTOS 51
1 mov ax, 0C123H
2 sal ax, 1 ; ax = 8246H, CF = 1
3 sal ax, 1 ; ax = 048CH, CF = 1
4 sar ax, 2 ; ax = 0123H, CF = 0
3.1.4. Desplazamientos de rotacion
Los desplazamientos de rotacion trabajan como los desplazamientos logi-
cos excepto que los bits perdidos en un extremo del dato se desplazan al otro
lado. As, el dato es tratado como si fuera una estructura circular. Las dos
rotaciones mas simples son ROL y ROR , que hacen rotaciones a la izquierda
y a la derecha respectivamente. Tal como los otros desplazamientos, estos
desplazamientos dejan una copia del ultimo bit rotado en la bandera de
carry.
1 mov ax, 0C123H
2 rol ax, 1 ; ax = 8247H, CF = 1
3 rol ax, 1 ; ax = 048FH, CF = 1
4 rol ax, 1 ; ax = 091EH, CF = 0
5 ror ax, 2 ; ax = 8247H, CF = 1
6 ror ax, 1 ; ax = C123H, CF = 1
Hay dos instrucciones de rotacion adicionales que desplazan los bits en
el dato y la bandera de carry llamadas RCL y RCR . Por ejemplo, si el registro
AX rota con estas instrucciones, los 17 bits se desplazan y la bandera de carry
se rota.
1 mov ax, 0C123H
2 clc ; borra la bandera de carry (CF = 0)
3 rcl ax, 1 ; ax = 8246H, CF = 1
4 rcl ax, 1 ; ax = 048DH, CF = 1
5 rcl ax, 1 ; ax = 091BH, CF = 0
6 rcr ax, 2 ; ax = 8246H, CF = 1
7 rcr ax, 1 ; ax = C123H, CF = 0
3.1.5. Aplicacion simple
A continuacion esta un fragmento de codigo que cuenta el n umero de
bits que estan encendidos (1) en el registro EAX.
1 mov bl, 0 ; bl contendra el numero de bits prendidos
2 mov ecx, 32 ; ecx es el bucle contador
52 CAP

X Y X AND Y
0 0 0
0 1 0
1 0 0
1 1 1
Cuadro 3.1: La operacion AND
1 0 1 0 1 0 1 0
AND 1 1 0 0 1 0 0 1
1 0 0 0 1 0 0 0
Figura 3.2: ANDdo un byte
3 count_loop:
4 shl eax, 1 ; desplaza los bits en la bandera de carry
5 jnc skip_inc ; si CF == 0, va a skip_inc
6 inc bl
7 skip_inc:
8 loop count_loop
El codigo anterior destruye el valor original de EAX (EAX es cero al nal
del bucle). Si uno desea conservar el valor de EAX, la lnea 4 debera ser
reemplazada con rol eax,1.
3.2. Operaciones booleanas entre bits
Hay cuatro operadores booleanos basicos AND, OR, XOR y NOT. Una
tabla de verdad muestra el resultado de cada operacion por cada posible
valor de los operandos.
3.2.1. La operacion AND
El resultado del AND de dos bits es 1 solo si ambos bits son 1, si no el
resultado es cero como muestra la Tabla 3.1
Los procesadores tienen estas operaciones como instrucciones que act uan
independientemente en todos los bits del dato en paralelo. Por ejemplo, si el
contenido de AL y BL se les opera con AND, la operacion se aplica a cada uno
de los 8 pares de bits correspondientes en los dos registros como muestra la
Figura 3.2 . Sigue un codigo de ejemplo:
1 mov ax, 0C123H
2 and ax, 82F6H ; ax = 8022H
3.2. OPERACIONES BOOLEANAS ENTRE BITS 53
X Y X OR Y
0 0 0
0 1 1
1 0 1
1 1 1
Cuadro 3.2: La operacion OR
X Y X XOR Y
0 0 0
0 1 1
1 0 1
1 1 0
Cuadro 3.3: La operacion XOR
3.2.2. La operacion OR
El O inclusivo entre dos bits es 0 solo si ambos bits son 0, si no el
resultado es 1 como se muestra en la Tabla 3.2 . Sigue un codigo de ejemplo:
1 mov ax, 0C123H
2 or ax, 0E831H ; ax = E933H
3.2.3. La operacion XOR
El O exclusivo entre 2 bits es 0 si y solo si ambos bits son iguales, sino
el resultado es 1 como muestra la tabla 3.3. Sigue un codigo de ejemplo:
1 mov ax, 0C123H
2 xor ax, 0E831H ; ax = 2912H
3.2.4. La operacion NOT
La operacion NOT es unaria (act ua sobre un solo operando, no como
las operaciones binarias como AND). El NOT de un bit es el valor opuesto
del bit como se muestra en la Tabla 3.4. Sigue un codigo de ejemplo:
1 mov ax, 0C123H
2 not ax ; ax = 3EDCH
Observe que NOT halla el complemento a 1. Diferente a las otras op-
eraciones entre bits, la instruccion NOT no cambian ninguno de los bits en el
registro FLAGS.
54 CAP

X NOT X
0 1
1 0
Cuadro 3.4: La operacion NOT
Prende el bit i OR the number with 2
i
(which is the binary
number with just bit i on)
Apaga el bit i AND el n umero binario con solo el bit i apa-
gado . Este operando es a menudo llamado
mascara
Complementa el bit i XOR el n umero con 2
i
Cuadro 3.5: Usos de las operaciones booleanas
3.2.5. La instruccion TEST
La instruccion TEST realiza una operacion AND, pero no almacena el
resultado. Solo ja las banderas del registro FLAGS dependiendo del resultado
que fuera (muy parecido a lo que hace la instruccion CMP con la resta que
solo ja las banderas). Por ejemplo, si el resultado fuera cero, ZF se jara.
3.2.6. Usos de las operaciones con bits
Las operaciones con bits son muy utiles para manipular bits individuales
sin modicar los otros bits. La Tabla 3.5 muestra los 3 usos mas comunes
de estas operaciones. Sigue un ejemplo de como implementar estas ideas.
1 mov ax, 0C123H
2 or ax, 8 ; prende el bit 3, ax = C12BH
3 and ax, 0FFDFH ; apaga el bit 5, ax = C10BH
4 xor ax, 8000H ; invierte el bit 31, ax = 410BH
5 or ax, 0F00H ; prende el nibble, ax = 4F0BH
6 and ax, 0FFF0H ; apaga nibble, ax = 4F00H
7 xor ax, 0F00FH ; invierte nibbles, ax = BF0FH
8 xor ax, 0FFFFH ; complemento a uno , ax = 40F0H
La operacion AND se puede usar tambien para hallar el residuo de una
division por una potencia de dos. Para encontrar el residuo de una division
por 2
i
, AND el n umero con una mascara igual a 2
i
1. Esta mascara con-
tendra unos desde el bit 0 hasta el bit i 1. Son solo estos bits los que
contienen el residuo. El resultado de la AND conservara estos bits y de-
jara cero los otros. A continuacion un fragmento de codigo que encuentra el
cociente y el residuo de la division de 100 por 16.
3.3. EVITANDO SALTOS CONDICIONALES 55
1 mov bl, 0 ; bl contendra el numero de bits prendidos
2 mov ecx, 32 ; ecx es el bucle contador
3 count_loop:
4 shl eax, 1 ; se desplaza el bit en la bandera de carry
5 adc bl, 0 ; a~nade solo la bandera de carry a bl
6 loop count_loop
Figura 3.3: Contando bits con ADC
1 mov eax, 100 ; 100 = 64H
2 mov ebx, 0000000FH ; macara = 16 - 1 = 15 or F
3 and ebx, eax ; ebx = residuo = 4
Usando el registro CL es posible modicar arbitrariamente bits. El siguiente
es un ejemplo que ja (prende) un bit arbitrario en EAX. El n umero del bit
a pender se almacena en BH.
1 mov cl, bh ; first build the number to OR with
2 mov ebx, 1
3 shl ebx, cl ; se desplaza a la derecha cl veces
4 or eax, ebx ; prende el bit
Apagar un bit es solo un poco mas difcil.
1 mov cl, bh ; first build the number to AND with
2 mov ebx, 1
3 shl ebx, cl ; se desplaza a la derecha cl veces
4 not ebx ; invierte los bits
5 and eax, ebx ; apaga el bit
El codigo para complementar un bit arbitrario es dejado como ejercicio al
lector.
Es com un ver esta instruccion en un programa 80X86.
xor eax, eax ; eax = 0
A number XORed with itself always results in zero. This instruction is used
because its machine code is smaller than the corresponding MOV instruction.
3.3. Evitando saltos condicionales
Los procesadores modernos usan tecnicas sosticadas para ejecutar el
codigo tan rapido como sea posible. Una tecnica com un se conoce como
56 CAP

ejecucion especulativa. Esta tecnica usa las capacidades de procesamiento
paralelo de la CPU para ejecutar m ultiples instrucciones a la vez. Las in-
strucciones condicionales tienen un problema con esta idea. El procesador,
en general, no sabe si se realiza o no la ramicacion.Si se toma, se ejecu-
tara de instrucciones diferentes que si no se toma. El procesador trata de
predecir si ocurrira la ramicacion. Si la prediccion fue erronea el procesador
ha perdido su tiempo ejecutando un codigo erroneo.
Una manera de evitar este problema, es evitar usar ramicaciones condi-
cionales cuando es posible. El codigo de ejemplo en 3.1.5 muestra un pro-
grama muy simple donde uno podra hacer esto. En el ejemplo anterior, los
bits encendidos del registro EAX usa una ramicacion para saltarse la
instruccion INC. La gura 3.3 muestra como se puede quitar la ramicacion
usando la instruccion ADC para sumar el bit de carry directamente.
Las instrucciones SETxx suministran una manera para suprimir rami-
caciones en ciertos casos. Esta instruccion ja el valor de un registro byte o
un lugar de memoria a cero, basado en el estudio del registro FLAGS. Los
caracteres luego de SET son los mismos caracteres usados en saltos condi-
cionales. Si la condicion correspondiente de SETxx es verdadero, el resultado
almacenado es uno, si es falso se almacena cero. Por ejemplo,
setz al ; AL = 1 if Z flag is set, else 0
Usando estas instrucciones, uno puede desarrollar algunas tecnicas inge-
niosas que calculan valores sin ramicaciones.
Por ejemplo, considere el problema de encontrar el mayor de dos valores.
La aproximacion normal para resolver este problema sera el uso de CMP y
usar un salto condicional y proceder con el valor que fue mas grande. El
programa de ejemplo de abajo muestra como se puede encontrar el mayor
sin ninguna ramicacion.
For example, consider the problem of nding the maximum of two values.
The standard approach to solving this problem would be to use a CMP and use
a conditional branch to act on which value was larger. The example program
below shows how the maximum can be found without any branches.
1 ; Archivo: max.asm
3 segment .data
4
5 message1 db "Digite un numero: ",0
6 message2 db "Digite otro numero: ", 0
7 message3 db "El mayor numero es: ", 0
8
9 segment .bss
3.3. EVITANDO SALTOS CONDICIONALES 57
10
11 input1 resd 1 ; primer numero ingresado
12
13 segment .text
14 global _asm_main
15 _asm_main:
17 pusha
18
19 mov eax, message1 ; imprime el primer mensaje
21 call read_int ; ingresa el primer numero
22 mov [input1], eax
23
24 mov eax, message2 ; imprime el segundo mensaje
26 call read_int ; ingresa el segundo numero (en eax)
27
28 xor ebx, ebx ; ebx = 0
29 cmp eax, [input1] ; compara el segundo y el primer numero
30 setg bl ; ebx = (input2 > input1) ? 1 : 0
31 neg ebx ; ebx = (input2 > input1) ? 0xFFFFFFFF : 0
32 mov ecx, ebx ; ecx = (input2 > input1) ? 0xFFFFFFFF : 0
33 and ecx, eax ; ecx = (input2 > input1) ? input2 : 0
34 not ebx ; ebx = (input2 > input1) ? 0 : 0xFFFFFFFF
35 and ebx, [input1] ; ebx = (input2 > input1) ? 0 : input1
36 or ecx, ebx ; ecx = (input2 > input1) ? input2 : input1
37
38 mov eax, message3 ; imprime los resultado
40 mov eax, ecx
41 call print_int
42 call print_nl
43
44 popa
46 leave
47 ret
El truco es crear una mascara que se pueda usar para seleccionar el valor
mayor. La instruccion SETG en la lnea 30 ja BL a 1. Si la segunda entrada
es mayor o 0 en otro caso, esta no es la mascara deseada. Para crear la
58 CAP

mascara que se r, la lnea requerida 31 usa la instruccion NEG en el registro
EBX. (Observe que se borro EBX primero). Si EBX es 0 no hace nada; sin
embargo si EBX es 1, el resultado es la representacion en complemento a
dos de -1 o 0xFFFFFFFF. Esta es la mascara que se necesita. El resto del
codigo usa esta mascara para seleccionar la entrada correcta como el mayor.
Como truco alternativo usar la instruccion DEC. En el codigo de arriba, si
NEG se reemplaza con un DEC, de nuevo el resultado sera 0 o 0xFFFFFFFF.
Sin embargo, los valores son invertidos que cuando se usa la instruccion NEG.
3.4. Manipulando bits en C
3.4.1. Las operacones entre bits de C
A diferencia de algunos lenguajes de alto nivel C suministra operadores
para operaciones entre bits. La operacion AND se representa con el operador
&
1
. La operacion OR se representa por el operador binario |. La operacion
XOR se representa con el operador binario ^ . Y la operacion NOT se
representa con el operador unario ~ .
Los desplazamientos son realizados por C con los operadores binarios <<
y >> . El operador << realiza desplazamientos a la izquierda y el operador
>> hace desplazamientos a la derecha. Estos operadores toman 2 operandos.
El de la derecha es el valor a desplazar y el de la izquierda es el n umero
de bits a desplazar. Si el valor a desplazar es un tipo sin signo, se realiza
un desplazamiento logico. Si el valor es con signo (como int), entonces se
usa un desplazamiento aritmetico. Sigue un ejemplo en C del uso de estos
operadores:
short int s ; / se asume que short int es de 16 bits /
short unsigned u;
s = 1; / s = 0xFFFF (complemento a dos) /
u = 100; / u = 0x0064 /
u = u | 0x0100; / u = 0x0164 /
s = s & 0xFFF0; / s = 0xFFF0 /
s = s u; / s = 0xFE94 /
u = u << 3; / u = 0x0B20 (desplazamiento olgico) /
s = s >> 2; / s = 0xFFA5 (desplazamiento earitmtico) /
3.4.2. Usando las operaciones entre bits en C
Los operadores entre bits se usan en C para los mismos propositos que en
lenguaje ensamblador. Ellos le permiten a uno manipular bits individuales
1
Este operador es diferente del operador binario && y del unario &!
3.4. MANIPULANDO BITS EN C 59
Macro Meaning
S IRUSR el propietario puede leer
S IWUSR el propietario puede escribir
S IXUSR el propietario puede ejecutar
S IRGRP el grupo de propietario puede leer
S IWGRP el grupo del propietario puede escribir
S IXGRP el grupo del propietario puede ejecutar
S IROTH los otros pueden leer
S IWOTH los otros pueden escribir
S IXOTH los otros pueden ejecutar
Cuadro 3.6: Macros POSIX para permisos de archivos
y se pueden usar para multiplicaciones y divisiones rapidas. De hecho, un
compilador de C inteligente usara desplazamientos automaticamente para
multiplicaciones como X*=2, Muchos API
2
(Como POSIX
3
y Win 32).
tienen funciones que usan operandos que tienen datos codicados como bits.
Por ejemplo, los sistemas POSIX mantienen los permisos de los archivos para
3 tipos diferentes de usuarios (un mejor nombre sera propietario), grupo y
otros. A cada tipo de usuario se le puede conceder permisos para leer, escribir
o ejecutar un archivo. Para cambiar los permisos de un archivo requiere
que el programador de C manipule bits individuales. POSIX dene varios
macros para ayudas (vea la tabla 3.6). La funcion chmod se puede usar para
establecer los permisos de un archivo. Esta funcion toma dos parametros,
una cadena con el nombre del archivo sobre el que se va a actuar y un entero
4
Con los bits apropiados para los permisos deseados. Por ejemplo, el codigo
de abajo ja los permisos para permitir que el propietario del archivo leerlo
y escribirlo, a los usuarios en e, grupo leer en archivo y que los otros no
tengan acceso.
chmod(foo, S IRUSR | S IWUSR | S IRGRP );
La funcion POSIX stat se puede usar para encontrar los bits de permisos
actuales de un archivo. Usada con la funcion chmod, es posible modicar
algunos de los permisos sin cambiar los otros. Un ejemplo que quita el acceso
a la escritura a los otros y a nade el acceso al propietario del archivo a la
lectura. Los otros permisos no son alterados Los otros permisos no se alteran.
struct stat le stats ; / estructura usada por stat () /
stat (foo, & le stats ); / lee la oinformacin del archivo .
2
Aplication Programming Interface
3
Signica Portable Operatting System Interface for Computer Enviroments. Una norma
desarrollada por el IEEE basado en UNIX.
4
Actualmente un parametro de tipo mode t que es un typedef a un tipo integral.
60 CAP

le stats . st mode holds permission bits /
chmod(foo, ( le stats . st mode & S IWOTH) | S IRUSR);
3.5. Representaciones Littel Endian y Big Endian
El captulo 1 introdujo el concepto de las representaciones big y little
endian de datos multibyte. Sin embargo, el autor ha encontrad que este
tema confunde a muchas personas. Esta seccion cubre el topico con mas
detalle.
El lector recordara que lo endian se reere al orden en que los bytes
individuales se almacenan en memoria (no bits) de un elemento multibyte
se almacena en memoria. Big endian es el metodo mas directo. Almacena
el byte mas signicativo primero, luego el siguiente byte en peso y as suce-
sivamente. En otras palabras los bits de mas peso se almacenan primero.
Little endian almacena los bytes en el orden contrario (primero el menos
signicativo). La familia de procesadores X86 usa la representacion little
endian.
Como un ejemplo, considere la palabra doble 12345678
16
. En la repre-
sentacion big endian, los bytes se almacenaran como 12 34 56 78. En la
representacion little endian los bytes se almacenaran como 78 56 34 12.
El lector probablemente se preguntara as mismo, por que cualquier
dise nador sensato usa la representacion little endian? Eran los ingenieros
de Intel sadicos para inigir esta confusa representacion a multitud de pro-
gramadores? Parecera que la CPU no tiene que hacer trabajo extra para
almacenar los bytes hacia atras en la memoria (e invertirlos cuando los lee de
la memoria). La respuesta es que la CPU no hace ning un trabajo extra para
leer y escribir en la memoria usando el formato little endian. O entiende que
la CPU esta compuesta de muchos circuitos electronicos que simplemente
trabajan con bits. Los bits (y bytes) no estan en un orden en particular en
la CPU.
Considere el registro de 2 bytes AX. Se puede descomponer en registros
de un byte (AH y AL). Hay circuitos en la CPU que mantienen los valores
de AH y AL. Los circuitos no estan en un orden particular en la CPU. Esto
signica que estos circuitos para AH no estan antes o despues que los circuitos
para AL. Quiere decir que, no es difcil para la CPU hacer que almacene AH
primero.
El mismo argumento se aplica a los bits individuales dentro de un byte,
no hay realmente ning un orden en los circuitos de la CPU (o la memoria). Sin
embargo, ya que los bits individuales no se pueden direccionar directamente
en la CPU o en la memoria, no hay manera de conocer que orden ellos parece
que conservaran internamente en la CPU.
3.5. REPRESENTACIONES LITTEL ENDIAN Y BIG ENDIAN 61
unsigned short word = 0x1234; / se asume sizeof ( short) == 2 /
unsigned char p = (unsigned char ) &word;
if ( p[0] == 0x12 )
printf (aMquina Big Endian\n);
else
printf (aMquina Little Endian\n);
Figura 3.4: Como determinar lo Endianness
El codigo en C en la gura 3.4 muestra como se puede determinar lo en-
dian de una CPU. El apuntador p trata la variable word como dos elementos
de un arreglo de caracteres. As, p[0] eval ua el primer byte de word en la
memoria que depende de lo endian en la CPU.
El codigo en C en la Figura 3.4 muestra como se puede determinar
lo endian de una CPU. El apuntador p trata la variable word como dos
elementos de un arreglo de caracteres. As, p[0] eval ua el primer byte de
word en la memoria que depende de lo endian en la CPU.
3.5.1. Cuando tener cuidado con Little and Big Endian
Para la programacion tpica, lo endian de la CPU no es importante. La
mayora de las veces esto es importante cuando se transere datos binarios
entre sistemas de computo diferente. Esto es ocurre normalmente usando un
medio de datos fsico (como un disco) o una red. Ya que el codigo ASCII es Ahora con los conjuntos de
caracteres multibyte como
UNICODE , lo endian es
importante a un para tex-
to. UNICODE soporta am-
bos tipos de representacion
y tiene un mecanismo para
especicar cual se esta us-
ando para representar los
datos.
de 1 byte la caracterstica endian no le es importante.
Todos los encabezados internos de TCP/IP almacena enteros en big En-
dian (llamado orden de byte de la red). Y las bibliotecas de suministran
funciones de C para tratar la cuestion endian de una manera portatil. Por
ejemplo la funcion htonl () convierte una palabra doble ( o long int) del for-
mato del host al de red. La funcion ntohl () hace la transformacion inversa.
5
Para un sistema big endian, las dos funciones solo retornan su entrada sin
cambio alguno. Esto le permite a uno escribir programas de res que com-
pilaran y se ejecutaran correctamente en cualquier sistema sin importar lo
endian. Para mas informacion sobre lo endian y programacion de redes vea
el excelente libro de W. Richard Steven UNIX Network Programming.
La Figura 3.5 muestra una funcion de C que invierte lo endian de una
palabra doble. El 486 ha introducido una nueva instruccion de maquina
5
Ahora, invertir lo endian de un entero simplemente coloca al reves los bytes; as con-
vertir de big a little o de little a big es la misma operacion. As, ambas funciones hacen la
misma cosa.
62 CAP

unsigned invert endian ( unsigned x )
{
unsigned invert ;
const unsigned char xp = (const unsigned char ) &x;
unsigned char ip = (unsigned char ) & invert;
ip [0] = xp [3]; / invierte los bytes individuales /
ip [1] = xp [2];
ip [2] = xp [1];
ip [3] = xp [0];
return invert ; / retorna los bytes invertidos /
}
Figura 3.5: Funcion invert endian
llamada BSWAP que invierte los bytes de cualquier registro de 32 bits. Por
ejemplo:
bswap edx ; intercambia los bytes de edx
Esta instruccion no se puede usar en los registros de 16 bits, sin embargo la
instruccion XCHG se puede usar para intercambiar los bytes en los registros
de 16 bits que se pueden descomponer en registros de 8 bits. Por ejemplo:
xchg ah,al ; intercambia los bytes de ax
3.6. Contando bits
Primero se dio una tecnica directa para contar el n umero de bits que
estan encendidos en una palabra doble. Esta seccion mira otros metodos
menos directos de hacer esto, como un ejercicio de usar las operaciones de
bits discutidas en este captulo.
3.6.1. Metodo uno
El primer metodo es muy simple, pero no obvio. La gura 3.6 muestra
el codigo.
Como trabaja este metodo? En cada iteracion el bucle, se apaga un bit
del dato. Cuando todos los bits se han apagado (cuando el dato es cero),
el bucle naliza. El n umero de iteraciones requerido para hacer el dato cero
es igual al n umero de bits en el valor original del dato.
3.6. CONTANDO BITS 63
int count bits ( unsigned int data )
{
int cnt = 0;
while( data != 0 ) {
data = data & (data 1);
cnt++;
}
return cnt;
}
Figura 3.6: Contando bits: metodo uno
La lnea 6 es donde se apaga un bit del dato. Como se hace esto?
Considere la forma general de la representacion en binario del dato y el 1
del extremo derecho de esta representacion. Por denicion cada bit despues
de este 1 debe ser cero. Ahora, Cual sera la representacion de data -1?
Los bits a la izquierda del 1 del extremo derecho seran los mismos que para
data, pero en el punto del 1 del extremo derecho ellos seran el complemento
de los bits originales de data. Por ejemplo:
data = xxxxx10000
data - 1 = xxxxx01111
donde X es igual para ambos n umeros. Cuando se hace data AND data
-1, el resultado sera cero el 1 del extremo derecho en data y deja todos los
otros bits sin cambio.
3.6.2. Metodo dos
Para contar bits se puede usar tambien la b usqueda en una tabla de
una palabra doble arbitraria. La aproximacion directa sera precalcular el
n umero de bits para cada palabra doble y almacenar esto en un arreglo.
Sin embargo, hay dos problemas relacionados con esta aproximacion. Hay
alrededor de 4 mil millones de palabras dobles! Esto signica que el arreglo
sera muy grande e iniciarlo consumira mucho tiempo. (de hecho, a menos
que uno vaya a utilizar realmente el arreglo de mas que 4 mil millones de
veces, se tomara mas tiempo iniciando el arreglo que el que requerira solo
calcular la cantidad de bits usando el metodo uno).
Un metodo mas real sera precalcular la cantidad de bits para todas
las posibilidades de un byte y almacenar esto en un arreglo. Entonces la
palabra doble se puede dividir en 4 bytes. Los bits considerados de estos 4
bytes se miran del arreglo y se suman para encontrar la cantidad de bits de
la palabra doble original. La gura 3.7 muestra la implementacion de esta
64 CAP

static unsigned char byte bit count [256]; / lookup table /
void initialize count bits ()
{
int cnt , i , data;
for ( i = 0; i < 256; i ++ ) {
cnt = 0;
data = i ;
while( data != 0 ) { / emtodo uno /
data = data & (data 1);
cnt++;
}
byte bit count [ i ] = cnt;
}
}
int count bits ( unsigned int data )
{
const unsigned char byte = ( unsigned char ) & data;
return byte bit count [ byte [0]] + byte bit count [ byte[1]] +
byte bit count [ byte [2]] + byte bit count [ byte [3]];
}
Figura 3.7: Metodo dos
aproximacion.
La funcion initialize count bits debe ser llamada antes, del primer
llamado a la funcion count bits . Esta funcion inicia el arreglo global
byte bit count. La funcion count bits mira la variable data no como una
palabra doble, sino como un arreglo de 4 bytes. El apuntador dword act ua
como un apuntador a este arreglo de 4 bytes. As dword [0] es uno de los
bytes en data ( el byte mas signicativo o el menos signicativo dependien-
do si es little o big endian respectivamente). Claro esta uno podra usar una
instruccion como:
(data >> 24) & 0x000000FF
Para encontrar el byte mas signicativo y hacer algo parecido con los otros
bytes; sin embargo, estas construcciones seran mas lentas que una referencia
al arreglo.
Un ultimo punto, un bucle for se podra usar facilmente para calcular
3.6. CONTANDO BITS 65
int count bits (unsigned int x )
{
static unsigned int mask[] = { 0x55555555,
0x33333333,
0x0F0F0F0F,
0x00FF00FF,
0x0000FFFF };
int i ;
int shift ; / unmero de posiciones a desplazarse a la derecha /
for ( i =0, shift =1; i < 5; i ++, shift = 2 )
x = (x & mask[i ]) + ( ( x >> shift) & mask[i ] );
return x;
}
Figura 3.8: Metodo tres
la suma en las lneas 22 y 23. Pero el bucle for incluira el trabajo extra
de iniciar el ndice del bucle, comparar el ndice luego de cada iteracion e
incrementar el ndice. Calcular la suma como la suma explcita de 4 valores
sera mas rapido. De hecho un compilador inteligente podra convertir la
version del bucle for a la suma explcita. Este proceso de reducir o eliminar
iteraciones de bucles es una tecnica de optimizacion conocida como loop
unrolling.
3.6.3. Metodo tres
Hay otro metodo ingenioso de contar bits que estan en un dato. Este
metodo literalmente a nade los unos y ceros del dato unido. Esta suma debe
ser igual al n umero de unos en el dato. Por ejemplo considere calcular los
unos en un byte almacenado en una variable llamada data. El primer paso
es hacer la siguiente operacion:
data = (data & 0x55) + ((data >> 1) & 0x55);
Que hace esto? La constante hexadecimal 0X55 es 01010101 en binario. En
el primer operando de la suma data es AND con el, los bits en las posiciones
pares se sacan. El Segundo operando (data >> 1 & 0x55), primero mueve
todos los bits de posiciones pares a impares y usa la misma mascara para
sacar estos mismos bits. Ahora, el primer operando contiene los bits pares y
el segundo los bits impares de data. Cuando estos dos operandos se suman,
se suman los bits pares e impares de data. Por ejemplo si data es 10110011
2
,
entonces:
66 CAP

data & 01010101
2
00 01 00 01
+ (data >> 1) & 01010101
2
or + 01 01 00 01
01 10 00 10
La suma de la derecha muestra los bits sumados. Los bits del byte se
dividen en 4 campos de 2 bits para mostrar que se realizan 4 sumas indepen-
dientes. Ya que la mayora de estas sumas pueden ser dos, no hay posibilidad
de que la suma desborde este campo y da ne otro de los campos de la suma.
Claro esta, el n umero total de bits no se ha calculado a un. Sin embargo
la misma tecnica que se uso arriba se puede usar para calcular el total en
una serie de pasos similares. El siguiente paso podra ser:
data = (data & 0x33) + ((data >> 2) & 0x33);
Continuando con el ejemplo de arriba (recuerde que data es ahora 01100010
2
):
data & 00110011
2
0010 0010
+ (data >> 2) & 00110011
2
or + 0001 0000
0011 0010
Ahora hay 2 campos de 4 bits que se suman independientemente.
El proximo paso es sumar estas dos sumas unidas para conformar el
resultado nal:
data = (data & 0x0F) + ((data >> 4) & 0x0F);
Usando el ejemplo de arriba (con data igual a 00110010
2
):
data & 00001111
2
00000010
+ (data >> 4) & 00001111
2
or + 00000011
00000101
Ahora data es 5 que es el resultado correcto. La Figura 3.8 muestra una
implementacion de este metodo que cuenta los bits en una palabra doble.
Usa un bucle for para calcular la suma. Podra ser mas rapido deshacer el
bucle; sin embargo, el bucle clarica como el metodo generaliza a diferentes
tama nos de datos.
Captulo 4
Subprogramas
Este captulo se concentra en el uso de subprogramas para hacer los
programas modulares e interfaces con programas de alto nivel (como C).
Las funciones y los procedimientos son ejemplos, en lenguajes de alto nivel
de subprograma.
El codigo que llama en subprograma y el subprograma en s mismo deben
estar de acuerdo en como se pasan los datos entre ellos. Estas reglas de como
se pasaran el dato son llamadas convenciones de llamado. Una gran parte de
este captulo tratara de las convenciones de llamado estandares de C, que se
pueden usar para interfasar subprogramas de ensamblador con programas
de C. Estas (y otras convenciones) a menudo pasan direcciones de datos (
apuntadores) para permitirle al subprograma acceder a datos en la memoria.
4.1. Direccionamiento indirecto
El direccionamiento indirecto le permite a los registros comportarse como
variables apuntador. Para indicar que un registro se va a usar indirectamente
como apuntador, se encierra entre parentesis cuadrados ([]) por ejemplo:
1 mov ax, [Data] ; Direccionamiento directo de memoria de una palabra
2 mov ebx, Data ; ebx = & Data
3 mov ax, [ebx] ; ax = *ebx
Porque AX almacena una palabra, la lnea 3 lee una palabra comenzando en
la direccion almacenada en EBX. Si AX lee reemplazando con AX, se leera
un solo bate. Es importante notar que los registros no tienen ning un tipo
como lo hacen las variables en C. Que EBX se asume que se nala esta to-
talmente determinada por que instrucciones se usan. Si EBX se utiliza in-
correctamente; a menudo no habra error en el ensamblador; sin embargo el
programa no trabajara correctamente. Esta es una de las muchas razones
67
68 CAP
ITULO 4. SUBPROGRAMAS
por la cual el ensamblador es mas propenso a errores que los lenguajes de
alto nivel.
Todos los registros de 32 bits de proposito general (EAX, EBX, ECX,
EDX) y los registros de ndice (ESI y EDI) se pueden usar para el direc-
cionamiento indirecto. En general los registros de 8 y 16 bits no.
4.2. Sencillo subprograma de ejemplo
Un subprograma es una unidad independiente de codigo que puede ser
usada desde diferentes partes de un programa. En otras palabras, un sub-
programa es como una funcion en C. Se puede usar un salto para invocar el
subprograma, pero el retorno representa un problema. Si el subprograma es
usado en diferentes partes del programa debe retornar a la parte del codi-
go desde la que se la invoco. As, el salto de retorno desde el subprograma
no puede ser a una etiqueta. El codigo siguiente muestra como se puede
realizar esto usando una forma indirecta de la instruccion JMP. Esta forma
de la instruccion JMP usa el valor de un registro para determinar a donde
saltar (as, el registro se comporta como un apuntador a una funcion en
C). Aca esta el primer programa del captulo 1 reescrito para usarlo como
subprograma.
sub1.asm
1 ; file: sub1.asm
2 ; Subprograma programa de ejemplo
4
5 segment .data
6 prompt1 db "Ingrese un numero: ", 0 ; no olvide el NULL
7 prompt2 db "Ingrese otro numero: ", 0
8 outmsg1 db "Ud. ha ingresado ", 0
9 outmsg2 db " y ", 0
10 outmsg3 db ", la suma de ellos es ", 0
11
12 segment .bss
13 input1 resd 1
14 input2 resd 1
15
16 segment .text
17 global _asm_main
18 _asm_main:
20 pusha
21
4.2. SENCILLO SUBPROGRAMA DE EJEMPLO 69
22 mov eax, prompt1 ; imprime el prompt
24
25 mov ebx, input1 ; almacena la direccion de input1 en ebx
26 mov ecx, ret1 ; almacena la direccion de retorno en ecx
27 jmp short get_int ; lee un entero
28 ret1:
29 mov eax, prompt2 ; imprime el prompt
31
32 mov ebx, input2
33 mov ecx, \$ + 7 ; ecx = esta direccion + 7
34 jmp short get_int
35
36 mov eax, [input1] ; eax = palabra doble en input1
37 add eax, [input2] ; eax += palabra doble en input2
38 mov ebx, eax ; ebx = eax
39
40 mov eax, outmsg1
41 call print_string ; imprime el primer mensaje
43 call print_int ; imprime input1
44 mov eax, outmsg2
45 call print_string ; imprime el segundo mensaje
47 call print_int ; imprime input2
48 mov eax, outmsg3
49 call print_string ; imprime el tercer mensaje
50 mov eax, ebx
51 call print_int ; imprime sum (ebx)
52 call print_nl ; imprime nueva lnea
53
54 popa
55 mov eax, 0 ; retorno a C
56 leave
57 ret
58 ; subprogram get_int
59 ; Parameters:
60 ; ebx - address of dword to store integer into
61 ; ecx - direccion de la instruccion a donde retornar
62 ; Notes:
63 ; value of eax is destroyed
70 CAP
64 get_int:
65 call read_int
66 mov [ebx], eax ; almacena la entrada en memoria
67 jmp ecx ; salta al llamador
sub1.asm
El subprograma get int usa una convencion de llamado simple basada
en un registro. Ella espera que el registro EBX almacene la direccion de la
DWORD a almacenar el n umero de entrada y el registro ECX a almacenar
el codigo de la instruccion a saltar. En las lneas 25 a 28, el operador $ se
usa para calcular la direccion de retorno. El operador $ retorna la direccion
actual para la lnea en que aparece. La expresion $ + 7 calcula la direccion
de la instruccion MOV de la lnea 36.
Los dos calculos de la direccion de retorno son complicados. El primer
metodo requiere que una etiqueta se dena en cada llamado a subprograma.
El segundo metodo no requiere una etiqueta, pero requiere un tratamiento
cuidadoso. Si fue usado un salto NEAR en lugar de un short el n umero a
a nadirle a $ podra no ser 7! Afortunadamente hay una manera mucho mas
simple de invocar subprogramas. Este metodo usa la pila.
4.3. La pila
Muchas CPU tienen soporte para una pila. Una pila es una lista LIFO
(Last In Firist Out). La pila es un arca de memoria que esta organizada de
esta manera. La instruccion PUSH a nade datos a la pila y la instruccion POP
quita datos. El dato extrado siempre es el ultimo dato insertado (esta es la
razon por la cual es llamado FIFO).
El registro de segmento SS especica el segmento de datos que contiene
la pila. (Normalmente este es el mismo segmento de datos). El registro ESP
contiene la direccion del dato que sera quitado de la pila. Los datos solo
se pueden a nadir en unidades de palabras dobles. Esto es, que no se puede
insertar un solo byte en la pila.
La instruccion PUSH inserta una palabra doble
1
en la pila restandole
4 a ESP y entonces almacena la palabra doble en [ESP]. La instruccion
POP lee la palabra doble almacenada en [ESP] y luego a nade 4 a ESP. El
codigo siguiente demuestra como trabajan estas instrucciones asumiendo que
el valor inicial de ESP es 1000H.
1 push dword 1 ; 1 almacendao en 0FFCh, ESP = 0FFCh
2 push dword 2 ; 2 almacenado en 0FF8h, ESP = 0FF8h
3 push dword 3 ; 3 almacenado en 0FF4h, ESP = 0FF4h
1
Actualmente tambien se pueden empujar palabras, pero en el modo protegido de 32
bits es mejor trabajar solo con palabras dobles en la pila.
4.4. LAS INSTRUCCIONES CALL Y RET 71
4 pop eax ; EAX = 3, ESP = 0FF8h
5 pop ebx ; EBX = 2, ESP = 0FFCh
6 pop ecx ; ECX = 1, ESP = 1000h
La pila se puede usar como un almacen de datos temporal muy conve-
niente. Tambien se usa para el llamado a subprogramas, pasando parametros
y variables locales.
El 80x86 tambien suministra la instruccion PSHA que empuja el valor de
los registros: EAX, EBX, ECX, EDX, ESI, EOI y EBP (no en este orden).
La instruccion POPA se puede usar para devolver todos estos registros a su
valor anterior.
4.4. Las instrucciones CALL y RET
El 80X86 suministra dos instrucciones que usa la pila para hacer lla-
mados a subprogramas rapido y facil. La instruccion CALL hace un salto
incondicional a un subprograma y empuja en la pila la direccion de la proxi-
ma instruccion. La instruccion RET saca una direccion de la pila y salta a
esta direccion. Cuando se usa esta instruccion, es muy importante que uno
administre la pila correctamente ya que la instruccion RET debe extraer de
la pila el n umero correcto.
El programa anterior se puede reescribir usando estas nuevas instruc-
ciones cambiando las lneas 25 a 34 por:
mov ebx, input1
call get_int
mov ebx, input2
call get_int
y cambiando el subprograma get int a:
get_int:
call read_int
mov [ebx], eax
ret
Hay varias ventajas de CALL y RET
Es simple
Permite a los subprogramas hacer llamados anidados facilmente. Ob-
serve que get int llama read int. Esta llamada empuja otra direccion
72 CAP
en la pila. Al nal del codigo de red int hay un RET que saca la di-
reccion de retorno y que salta de nuevo al codigo de get int. Cuando
la instruccion RET de get int se ejecuta, saca la direccion de retorno
que salta de nuevo a asm main. Esto trabaja correctamente por la
propiedad LIFO de la pila.
Recuerde es muy importante sacar todos los datos que se han empujado
en la pila. Por ejemplo considere lo siguiente:
1 get_int:
2 call read_int
3 mov [ebx], eax
4 push eax
5 ret ; <<saca el valor de EAX, no la direccion de retorno!!
Este codigo no retornara correctamente.
4.5. Convenciones de llamado
Cuando un subprograma se invoca, el codigo llamado y el subprograma
(el llamador) deben estar de acuerdo en como se pasan datos entre ellos.
Los lenguajes de alto nivel tienen maneras estandares de pasarse datos,
conocidas como convenciones de llamado. Para interfasar codigo de alto
nivel con lenguaje ensamblador, este debe usar las mismas convenciones que
el lenguaje de alto nivel. Las convenciones de llamado pueden diferir de
compilador a compilador o puede variar de como se compila el codigo (si se
ha optimizado o no). Una convencion universal es que el codigo sera invocado
con la instruccion CALL y retornara con RET.
Todos los compiladores de C para PC soportan una convencion de llama-
do que sera descrito en el resto del captulo por etapas. Estas convenciones le
permiten a uno crear subprogramas que sean reentrantes. Un subprograma
reentrante puede ser llamado en cualquier punto del programa con seguridad
(a un dentro del subprograma mismo).
4.5.1. Pasando parametros en la pila
Los parametros a un subprograma se pueden pasar en la pila. Ellos se em-
pujan en la pila antes de la instruccion CALL. Tal como en C, si el parametro
es cambiado por el subprograma se debe pasar la direccion del dato no su
valor. Si el tama no del parametro es menor que una palabra doble, se debe
convertir a palabra doble antes de ser empujada en la pila.
Los parametros no son sacados de la pila por el subprograma, en lugar
de ello son accedidos desde la pila misma.Por que?
4.5. CONVENCIONES DE LLAMADO 73
ESP + 4 Parametro
ESP Direccion de retorno
Figura 4.1:
ESP + 8 Parametro
ESP + 4 Direccion de retorno
ESP datos del subprograma
Figura 4.2:
Ya que ellos se han empujado a la pila antes de la instruccion CALL,
la direccion de retorno tendra que haberse sacado primero (y luego
metido otra vez).
A menudo los parametros tendran que usarse en varios lugares en el
subprograma. Normalmente, ellos no se pueden dejar en un registro
durante todo el subprograma y tendra que almacenarse en memoria.
Dejandolos en la pila tenemos una copia del dato en memoria que se
puede acceder en cualquier parte del subprograma.
Considere un subprograma al que se le pasa un solo parametro en la pila. Cuando se usa direc-
cionamiento indirecto, el
procesador 80X86 accede
a segmentos diferentes de-
pendiendo de que registros
se usan en la expresion de
direccionamiento indirec-
to. ESP (y EBP usan el
segmento de la pila) mien-
tras que EAX, EBX, ECX
y EDX usan el segmento
de datos. Sin embargo,
esto normalmente no
tiene importancia para la
mayora de los programas
en modo protegido, porque
para ellos los segmentos
de datos y de pilas son los
mismos.
Cuando el subprograma se invoca, la pila se ve como en la Figura 4.1. Se
puede acceder al parametro usando direccionamiento indirecto ([ESP+4])
2
.
Si la pila se usa dentro del subprograma para almacenar datos, el n umero
necesario a ser agregado a ESP cambiara. Por ejemplo, la Figura 4.2 muestra
como se ve la pila si una palabra doble se empuja en ella. Ahora el parametro
es ESP + 8 y no ESP + 4. As, esto puede ser muy propenso a errores usar
ESP cuando uno se reere a parametros. Para resolver este problema, el
80386 suministra otro registro para usar: EBP. El unico proposito de este
registro es referenciar datos en la pila. La convencion de llamado de C ordena
que un subprograma primero guarde el valor de EBP en la pila y luego
lo haga igual a ESP. Esto le permite a ESP cambiar cuando los datos se
empujen o se saquen de la pila sin modicar EBP. Al nal del subprograma,
se debe restaurar el valor de EBP (esta es la razon por la cual se guarda el
valor al principio del subprograma). La Figura 4.3 muestra la forma general
de un subprograma que sigue estas convenciones.
2
Es valido a nadir una constante a un registro cuando se usa direccionamiento indirec-
to. Se pueden construir expresiones mas complicadas tambien. Este topico se vera en el
captulo siguiente.
74 CAP
1 subprogram_label:
2 push ebp ; guarda el valor original de EBP en la pila
3 mov ebp, esp ; nuevo EBP = ESP
4 ; subprogram code
5 pop ebp ; restaura el valor original de EBP
6 ret
Figura 4.3: Forma general de un subprograma
ESP + 8 EBP + 8 Parametro
ESP + 4 EBP + 4 Direccion de retorno
ESP EBP EBP guardado
Figura 4.4:
Las lneas 2 y 3 de la Figura 4.3 componen el prologo general de un
subprograma. Las lneas 5 y 6 conforman el eplogo. La gura 4.4 muestra
como se ve la pila inmediatamente despues del prologo. Ahora los parametros
se pueden acceder con [EBP + 8] en cualquier lugar del subprograma sin
importar que haya empujado en la pila el subprograma.
Luego que el subprograma culmina, los parametros que se empujan en
la pila se deben quitar. La convencion de llamado de C especica que el
codigo llamador debe hacer esto. Otras convenciones son diferentes. Por
ejemplo la convencion de llamado de Pascal especica que el subprograma
debe quitar los parametros de la pila (hay otra forma de la instruccion RET
que hace esto facil). Algunos compiladores de C soportan esta convencion
tambien. El identicador pascal se usa en la denicion del prototipo de la
funcion para decirle al compilador que use esta convencion. De hecho, la
convencion stdcall que usan las funciones de C del API de MS Windows
trabajan de esta forma. Cual es la ventaja de este modo? Es un poco mas
eciente que la convencion de llamado de C. Por que todas las funciones
no usan esta convencion entonces? En general C le permite a una funcion
tener un n umero variable de argumentos(printf y scanf son ejemplos).
Para este tipo de funciones, la operacion de quitar los parametros de la pila
variara de un llamado de la funcion a otra. La convencion de C permite las
instrucciones para realizar esta operacion facilmente de un llamado a otro.
Las convenciones de Pascal y stdcall hacen esta operacion muy difcil. As,
la convencion de Pascal (como el lenguaje Pascal) no permite este tipo de
funciones. MS Windows puede usar esta convencion ya que ninguna de las
funciones del API toma un n umero variable de argumentos.
1 push dword 1 ; pasa 1 como parametro
2 call fun
3 add esp, 4 ; quita el parametro de la pila
Figura 4.5: Muestra del llamado a un subprograma
La Figura 4.5 muestra como sera invocado un subprograma usando la
convencion de llamado de C. La lnea 3 quita los parametros de la pila manip-
ulando directamente el apuntador de la pila. Una instruccion POP se podra
usar para hacer esto pero requerira que el resultado in util se almacene en un
registro. Actualmente, para este caso en particular muchos compiladores po-
dran usar una instruccion POP ECX para quitar el parametro. El compilador
usara POP en lugar de ADD porque ADD requiere mas bytes para la instruc-
cion. Sin embargo, POP tambien altera el valor de ECX. Luego esta otro
programa de ejemplo con dos subprogramas que usan la convencion de lla-
mado de C discutida arriba. La lnea 54 (y otras lneas) muestran que se
pueden declarar varios segmentos de datos y texto en un solo archivo fuente.
Ellos seran combinados en un solo segmento de texto y datos en el proceso
de encadenamiento. Dividir el codigo y los datos en segmentos separados
permite que los datos de un subprograma se denan cerca del codigo del
subprograma.
sub3.asm
2
3 segment .data
4 sum dd 0
5
6 segment .bss
7 input resd 1
8
9 ;
10 ; pseudo-codigo
11 ; i = 1;
12 ; sum = 0;
13 ; while( get_int(i, &input), input != 0 ) {
14 ; sum += input;
15 ; i++;
16 ; }
17 ; print_sum(num);
18 segment .text
76 CAP
19 global _asm_main
20 _asm_main:
22 pusha
23
24 mov edx, 1 ; edx es i en el pseudocodigo
25 while_loop:
26 push edx ; guarda i en la pila
27 push dword input ; empuja la direccion de input en la pila
28 call get_int
29 add esp, 8 ; quita i e &input de la pila
30
31 mov eax, [input]
32 cmp eax, 0
33 je end_while
34
35 add [sum], eax ; sum += input
36
37 inc edx
38 jmp short while_loop
39
40 end_while:
41 push dword [sum] ; empuja el valor de sum en la pila
42 call print_sum
43 pop ecx ; quita [sum] de la pila
44
45 popa
46 leave
47 ret
48
49 ; subprograma get_int
50 ; Parametros (en el orden que es empujan en la pila)
51 ; numero de input (en [ebp + 12])
52 ; address of word to store input into (at [ebp + 8])
53 ; Notas:
54 ; Los valores de eax y ebx se destruyen
55 segment .data
56 prompt db ") Ingrese un entero (0 para salir): ", 0
57
58 segment .text
59 get_int:
60 push ebp
61 mov ebp, esp
62
63 mov eax, [ebp + 12]
64 call print_int
65
66 mov eax, prompt
68
69 call read_int
70 mov ebx, [ebp + 8]
71 mov [ebx], eax ; almacena input en memoria
72
73 pop ebp
74 ret ; retorna al llamador
75
76 ; subprograma print_sum
77 ; imprime la suma
78 ; Parameter:
79 ; suma a imprimir (en [ebp+8])
80 ; Nota: destrueye el valor de eax
81 ;
82 segment .data
83 result db "La suma es ", 0
84
85 segment .text
86 print_sum:
87 push ebp
88 mov ebp, esp
89
90 mov eax, result
92
93 mov eax, [ebp+8]
94 call print_int
95 call print_nl
96
97 pop ebp
98 ret
sub3.asm
78 CAP
1 subprogram_label:
2 push ebp ; guarda el valor original de EBP en la pila
3 mov ebp, esp ; nuevo EBP = ESP
4 sub esp, LOCAL_BYTES ; = # de bytes necesitados por las variables locales
5 ; subprogram code
6 mov esp, ebp ; libera las variables locales
7 pop ebp ; restaura el valor original de EBP
8 ret
Figura 4.6: Forma general de un subprograma con variables locales
void calc sum( int n, int sump )
{
int i , sum = 0;
for ( i =1; i <= n; i++ )
sum += i;
sump = sum;
}
Figura 4.7: version de C de sum
4.5.2. Variables locales en la pila
La pila se puede usar como un lugar adecuado para las variables locales.
Ah es exactamente donde C almacena las variables normales (o automatic
como se dice en C). Usar la pila para las variables es importante si uno
desea que el programa sea reentrante. Un programa reentrante trabajara si
es invocado en cualquier lugar, incluido en subprograma en s mismo. En
otras palabras, los programas reentrantes pueden ser invocados recursiva-
mente. Usar la pila para las variables tambien ahorra memoria. Los datos
no almacenados en la pila estan usando la memoria desde el comienzo hasta
el nal del programa (C llama este tipo de variable globalo static). Los datos
almacenados en la pila solo usan la memoria cuando el subprograma que los
dene esta activo.
Las variables locales son almacenadas justo despues que se guardo el valor
EBP en la pila. Ellas son colocadas restando el n umero de bytes requeridos de
ESP en el prologo del subprograma. La Figura 4.6 muestra el nuevo esqueleto
del subprograma. El registro EBP se usa para acceder a las variables locales.
Considere la funcion de C en la Figura 4.7. La Figura 4.8 muestra como se
podra escribir un programa equivalente en ensamblador.
1 cal_sum:
2 push ebp
3 mov ebp, esp
4 sub esp, 4 ; hace espacio para la sum local
5
6 mov dword [ebp - 4], 0 ; sum = 0
7 mov ebx, 1 ; ebx (i) = 1
8 for_loop:
9 cmp ebx, [ebp+8] ; es i <= n?
10 jnle end_for
11
12 add [ebp-4], ebx ; sum += i
13 inc ebx
14 jmp short for_loop
15
16 end_for:
17 mov ebx, [ebp+12] ; ebx = sump
18 mov eax, [ebp-4] ; eax = sum
19 mov [ebx], eax ; *sump = sum;
20
21 mov esp, ebp
22 pop ebp
23 ret
Figura 4.8: Version en ensamblador de sum
La Figura 4.9 muestra como se ve la pila luego del prologo del programa
en la Figura 4.8. Esta parte de la pila que contiene la informacion de retorno,
los parametros y las variables locales es llamado marco de pila (stack frame).
Cada invocacion a una funcion de C crea un nuevo marco de la pila en la
pila. A pesar del hecho que
ENTER y LEAVE simpli-
can el prologo y el eplo-
go ellos no se usan muy a
menudo. Por que? Porque
ellas son mas lentas que
instrucciones equivalentes
mas simples. Este es un
ejemplo de cuando uno no
puede asumir que una sola
instruccion es mas rapida
que una secuencia de in-
strucciones.
El prologo y el eplogo de un subprograma se pueden simplicar usando
dos instrucciones especiales que estan dise nadas especcamente para este
proposito. La instruccion ENTER ejecuta el codigo del prologo y LEAVE ejecuta
el eplogo. La instruccion ENTER toma dos operandos inmediatos. Para la
convencion de llamado de C, el segundo operando es siempre 0. El primer
operando es el n umero de bytes necesarios para las variables locales. La
instruccion LEAVE no tiene operandos. La Figura 4.10 muestra como se usan
estas instrucciones. Observe que el programa esqueleto (Figura 1.7) tambien
usa ENTER y LEAVE.
80 CAP
ESP + 16 EBP + 12 sump
ESP + 12 EBP + 8 n
ESP + 8 EBP + 4 Direccion de retorno
ESP + 4 EBP EBP guardado
ESP EBP - 4 sum
Figura 4.9:
1 subprogram_label:
2 enter LOCAL_BYTES, 0 ; = numero de bytes necesitados por las
3 ; variables locales
4 ; subprogram code
5 leave
6 ret
Figura 4.10: Forma general de un subprograma con variables locales usando
ENTER and LEAVE
The prologue and epilogue of a subprogram can be simplied by using
two special instructions that are designed specically for this purpose. The
ENTER instruction performs the prologue code and the LEAVE performs the
epilogue. The ENTER instruction takes two immediate operands. For the C
calling convention, the second operand is always 0. The rst operand is
the number bytes needed by local variables. The LEAVE instruction has no
operands. Figure 4.10 shows how these instructions are used. Note that the
program skeleton (Figure 1.7) also uses ENTER and LEAVE.
4.6. Programas Multinmodulo
Un programa multimodulo es uno que esta compuesto de mas de un
archivo objeto. Todos los programas presentados aca han sido multimodulo.
Ellos estan compuestos del archivo objeto driver y el archivo objeto de en-
samblador (mas los archivos objeto de las bibliotecas de C). Recuerde que
el encadenador combina los archivos objeto en un solo programa ejecutable.
El encadenador debe emparejar las referencias hechas para cada etiqueta en
un modulo (archivo objeto) con su denicion en otro modulo. Para que el
modulo A use la etiqueta denida en el modulo B, se debe usar la directiva
extern. Luego de la directiva extern viene una lista de etiquetas separadas
por comas. La directiva le dice al ensamblador que trate esas etiquetas co-
mo externas al modulo. O sea, esas son etiquetas que se pueden usar en
este modulo pero estan denidas en otro. El archivo asm io.inc dene las
4.6. PROGRAMAS MULTINM
ODULO 81
rutinas read int, etc. como externas.
En ensamblador, no se puede acceder externamente a las etiquetas por
defecto. Si una etiqueta puede ser accedida desde otros modulos diferentes
al cual se denio, debe declararse global en su modulo. La directiva global
hace esto, la lnea 13 del programa esqueleto listado en la Figura 1.7 muestra
que la etiqueta asm main esta denida como global. Sin esta declaracion,
debera haber error del encadenador. Por que? Porque el codigo de C no
podra hacer referencia a la etiqueta interna asm main.
Luego esta el codigo para el ejemplo anterior, reescrito para usar dos
modulos. Los dos subprogramas (get int y print sum) estan en archivos
fuentes diferentes que la rutina asm main.
main4.asm
2
3 segment .data
4 sum dd 0
5
6 segment .bss
7 input resd 1
8
9 segment .text
10 global _asm_main
11 extern get_int, print_sum
12 _asm_main:
14 pusha
15
16 mov edx, 1 ; edx es i en el pseudocodigo
17 while_loop:
18 push edx ; guarda i en la pila
19 push dword input ; empuja la direccion input en la pila
20 call get_int
21 add esp, 8 ; quita i e &input de la pila
22
23 mov eax, [input]
24 cmp eax, 0
25 je end_while
26
27 add [sum], eax ; sum += input
28
29 inc edx
30 jmp short while_loop
82 CAP
31
32 end_while:
33 push dword [sum] ; empuja el valor de sum de la pila
34 call print_sum
35 pop ecx ; quita sum de la pila
36
37 popa
38 leave
39 ret
main4.asm
sub4.asm
2
3 segment .data
4 prompt db ") Ingrese un numero entero (0 para salir): ", 0
5
6 segment .text
7 global get_int, print_sum
8 get_int:
9 enter 0,0
10
11 mov eax, [ebp + 12]
12 call print_int
13
14 mov eax, prompt
16
17 call read_int
18 mov ebx, [ebp + 8]
19 mov [ebx], eax ; almacena la entrada en memoria
20
21 leave
22 ret ; retorna
23
24 segment .data
25 result db "La suma es ", 0
26
27 segment .text
28 print_sum:
29 enter 0,0
30
31 mov eax, result
4.7. INTERFAZANDO ENSAMBLADOR CON C 83
33
34 mov eax, [ebp+8]
35 call print_int
36 call print_nl
37
38 leave
39 ret
sub4.asm
El ejemplo anterior solo tiene etiquetas de codigo global sin embargo las
etiquetas de datos trabajan exactamente de la misma manera.
4.7. Interfazando ensamblador con C
Hoy da, pocos programas estan escritos completamente en ensamblador.
Los compiladores son muy buenos en convertir codigo de alto nivel en un
codigo de maquina eciente. Ya que es mucho mas facil escribir codigo en
un lenguaje de alto nivel, es mas popular. Ademas, el codigo de alto nivel
es mucho mas portatil que el ensamblador.
Cuando se usa ensamblador, se usa a menudo para peque nas partes de
codigo. Esto se puede hacer de dos maneras: llamando rutinas de ensam-
blador desde C o ensamblado en lnea. El ensamblado en lnea le permite al
programador colocar instrucciones de ensamblador directamente en el codi-
go de C. Esto puede ser muy conveniente; sin embargo hay desventajas del
ensamblado en lnea. El codigo en ensamblador se debe escribir en el forma-
to que usa el compilador. No hay compilador que en el momento soporte el
formato NASM. Los diferentes compiladores requieren diferentes formatos.
Borland y Microsoft requieren el formato NASM . DJGPP y el gcc de Linux
requieren el formato GAS
3
. La tecnica de llamar una rutina en ensamblador
esta mucho mas generalizada en el PC.
Las rutinas de ensamblador com unmente se usan con C por las siguientes
razones:
Se necesita acceso directo a caractersticas del hardware del computa-
dor que es imposible o difcil acceder desde C.
La rutina debe ser lo mas rapida posible y el programador puede op-
timizar a mano el codigo mejor que el compilador
La ultima razon no es tan valida como una vez lo fue. La tecnologa de los
compiladores se ha mejorado con los a nos y a menudo generan un codigo muy
eciente. (Especialmente si se activan las optimizaciones del compilador).
3
GAS es el ensamblador que usan todos los compiladores GNV. Usa la sintaxis AT&T
que es muy diferente de la sintaxis relativamente similares de MASM, TASM y NASM.
84 CAP
1 segment .data
2 x dd 0
3 format db "x = %d\n", 0
4
5 segment .text
6 ...
7 push dword [x] ; empuja el valor de x
8 push dword format ; empuja la direccion de la cadena con formato
9 call _printf ; observe el guion bajo
10 add esp, 8 ; quita los parametros de la pila
Figura 4.11: Llamado a printf
EBP + 12 valor de x
EBP + 8 direccion de la cadena con formato
EBP + 4 Direccion de retorno
EBP EBP guardado
Figura 4.12: Pila dentro de printf
Las desventajas de las rutinas en ensamblador son: portabilidad reducida y
lo poco legible.
La mayora de las convenciones de llamado ya se han especicado. Sin
embargo hay algunas caractersticas adicionales que necesitan ser descritas.
4.7.1. Ahorrando registros
Primero, C asume que una subrutina conserva los valores de los siguientes La palabra reservada
register se puede usar
en una declaracion de
una variable de C para
sugerirle al compilador
que use un registro para
esta variable en vez de un
lugar en memoria. Ellas
se conocen como variables
register. Los compiladores
modernos hacen esto au-
tomaticamente sin requerir
ninguna sugerencia.
registros: EBX, ESI, EDI, EBP, CS, DS, SS, ES. Esto no signica que la
subrutina no puede cambiarlos internamente. En vez de ello, signica que
si se hace un cambio en sus valores, deben restablecer los valores originales
antes que la subrutina retorne. Los valores en EBX, ESI y EDI no se deben
modicar porque C usa esos registros para variables register. Normalmente
la pila se usa para guardar los valores originales de estos registros.
4.7.2. Etiquetas de funciones
La mayora de compiladores anteponen un guion bajo ( ) al inicio de los
nombres de funciones y variables globales o static. Por ejemplo una funcion
llamada f se le asignara la etiqueta f. As, si esta es una rutina en en-
samblador se debe llamar f no f. El compilador gcc de Linux no antepone
ning un caracter. Bajo los ejecutables ELF de Linux, uno simplemente usara
la etiqueta f para la funcion de C f. Sin embargo el gcc de DJGPP antepone
un guion bajo. Observe que en el programa esqueleto de ensamblador (Figu-
ra 1.7) la etiqueta de la rutina principal es asm main.
4.7.3. Pasando parametros
Bajo la convencion de llamado de C, los argumentos de una funcion se
empujan en la pila en el orden inverso que aparecen en el llamado a la
funcion.
Considere la siguiente instruccion en C: printf ("x=%d/n",x); la Figu-
ra 4.11 muestra como se compilara esto (mostrado en el formato equivalente
de NASM). La Figura 4.12 muestra como se ve la pila luego del prologo den-
tro de la funcion printf. La funcion printf es una de las funciones de la
biblioteca de C que puede tomar cualquier n umero de argumentos. Las re-
glas de la convencion de llamado de C fueron escritas especcamente para
permitir este tipo de funciones. Ya que la direccion de la cadena con formato No es necesario usar
ensamblador para procesar
un n umero arbitrario
de parametros en C.
El archivo de cabecera
stdarg.h dene marcos
que se pueden usar para
procesarlos con portabili-
dad. Vea cualquier buen
libro de C para los detalles
se empuja de ultimo, este lugar en la pila sera siempre EBP + 8 no importa
cuantos parametros se le pasan a la funcion. El codigo printf puede ver
en la cadena con formato cuantos parametros se le debieron haber pasado y
verlos en la en la pila.
Claro esta, si se comete un error, printf ("x=%d/n"); el codigo de
printf esperara imprimir una palabra doble en [EBP+12]. Sin embargo este
no sera el valor de x.
4.7.4. Calculando las direcciones de las variables locales
Hallar la direccion de una variable local denida en el segmento data
o bss es sencillo. Sin embargo calcular la direccion de una variable local
(o parametro) en la pila no es directo. Sin embargo, es una necesidad muy
com un cuando se llaman subrutinas. Considere el caso de pasar la direccion
de una variable (la llamaremos x) a una funcion (que llamaremos foo). Si x
esta en EBP 8 en la pila, uno no puede usar:
mov eax, ebp - 8
Por que? El valor que MOV almacena en EAX debe ser calculado por el en-
samblador (esto es, debe ser una constante). Sin embargo, hay una instruc-
cion que hace el calculo deseado. Es llamado LEA (Load Efective Adress). Lo
siguiente calculara la direccion de x y la almacena en EAX:
lea eax, [ebp - 8]
Ahora EAX almacena la direccion de x y podra ser empujada en la pila
cuando se llame la funcion foo. No se confunda, parece como si esta instruc-
cion esta leyendo el dato en [EBP8]; sin embargo esto no es verdad. La
86 CAP
instruccion LEA nunca lee la memoria! Solo calcula la direccion que sera
leda por otra instruccion y almacena esta direccion en el primer operando
de registro. Ya que no se hace ninguna lectura a memoria, no hay necesidad,
ni esta permitido denir el tama no de la memoria (dword).
4.7.5. Retornando valores
Las funciones diferentes a void retornan un valor. La convencion de lla-
mado de C especica como se hace esto. Los valores de retorno se pasan a
traves de registros. Todos los tipos enteros (char, int, enum, etc.) se retor-
nan en el registro EAX. Si son mas peque nos que 32 bits, ellos son extendidos
a 32 bits cuando se almacenan en EAX. (el como se extienden depende de si
ellos tipos son con o sin signo.) Los valores de 64 bits se retornan en el par
de registros EDX:EAX. Los valores tipo apuntador tambien se almacenan en
EAX. Los valores de punto otante son almacenados en el registro ST0 del
coprocesador matematico. (Este registro se discute en el captulo de punto
otante).
4.7.6. Otras convenciones de llamado
Las reglas anteriores describen la convencion de llamado estandar de C
que es soportada por todos los compiladores de C para 80x86. A menudo los
compiladores soportan otras convenciones de llamado tambien. Cuando se
interfaza con lenguaje ensamblador es muy importante conocer que conven-
cion de llamado esta usando el compilador cuando llama su funcion. Nor-
malmente, el defecto es usar la convencion de llamado estandar; sin embargo
no siempre es este el caso
4
. Los compiladores que usan varias convenciones
a menudo tienen opciones de la lnea de ordenes que se pueden usar para
cambiar la convencion por defecto. Ellos tambien suministran extensiones a
la sintaxis de C para asignar explcitamente convenciones de llamado a fun-
ciones individuales. Sin embargo, estas extensiones no estan normalizadas y
pueden variar de un compilador a otro.
El compilador GCC permite diferentes convenciones de llamado. La con-
vencion de una funcion se puede declarar explcitamente usando la extension
attribute . Por ejemplo para declarar una funcion void que usa la con-
vencion de llamado estandar llamada f que toma un parametro int, use la
siguiente sintaxis para su prototipo:
void f ( int ) attribute ((cdecl ));
4
El compilador de C de Watcom es un ejemplo de uno que no usa la convencion de
llamado estandar por defecto. Vea el codigo fuente de ejemplo para Watcom para los
detalles
GCC tambien soporta la convencion de llamado estandar. La funcion de
arriba se podra declarar para usar esta convencion reemplazando cdecl con
stdcall. La diferencia entre stdcall y cdecl es que stdcall requiere que
la subrutina quite los parametros de la pila (como lo hace la convencion
de llamado de Pascal). As, la convencion stdcall solo se puede usar con
funciones que tomen un n umero jo de parametros (ej unas diferentes a
printf y scanf).
GCC tambien soporta un atributo adicional regparam que le dice al
compilador que use los registros para pasar hasta 3 argumentos enteros a su
funcion en lugar de usar la pila. Este es un tipo com un de optimizacion que
soportan muchos compiladores.
Borland y Microsoft usan una sintaxis com un para declarar convenciones
de llamado. Ellas a naden a las palabras reservadas cdecl stdcall a C. Es-
tas palabras reservadas act uan como modicadoras de funciones y aparecen
inmediatamente antes nombre de la funcion en un prototipo. Por ejemplo,
la funcion f de arriba se podra denir para Borland y Microsoft as:
void cdecl f ( int );
Hay ventajas y desventajas para cada convencion de llamado. La prin-
cipal ventaja de la convencion cdecl es que es simple y muy exible. Se
puede usar para cualquier tipo de funcion de C y cualquier compilador de
C. Usar otras convenciones puede limitar la portabilidad de la subrutina.
Su principal desventaja es que puede ser mas lenta que alguna de las otras
y usa mas memoria (ya que cada invocacion de la funcion requiere codigo
para quitar los parametros de la pila).
Las ventajas de la convencion stdcall es que usa menos memoria que
cdecl. No se requiere limpiar la pila despues de la instruccion CALL. La
principal desventaja es que no se puede usar con funciones que tengan un
n umero variable de argumentos.
La ventaja de usar una convencion que use registros para pasar enteros es
la velocidad. La principal desventaja es que la convencion es mas compleja.
Algunos parametros pueden estar en los registros y otros en la pila.
4.7.7. Ejemplos
El siguiente es un ejemplo como una rutina de ensamblador se puede
interfasar con un programa de C (observe que este programa no usa el pro-
grama esqueleto de ensamblador (Figura 1.7) o el modulo driver.c)
main5.c
#include <stdio.h>
/ prototipo para la rutina en ensamblador /
88 CAP
void calc sum( int , int ) attribute ((cdecl ));
int main( void )
{
int n, sum;
printf (Sumar enteros hasta: );
scanf( %d, &n);
calc sum(n, &sum);
printf (Sum is %d\n, sum);
return 0;
}
main5.c
sub5.asm
1 ; subroutinea _calc_sum
2 ; halla la suma de los enteros de 1 hasta n
3 ; Parametros:
4 ; n - hasta donde sumar (en [ebp + 8])
5 ; sump - apuntador a un int para almacenar sum (en [ebp + 12])
6 ; pseudocodigo en C:
7 ; void calc_sum( int n, int * sump )
8 ; {
9 ; int i, sum = 0;
10 ; for( i=1; i <= n; i++ )
11 ; sum += i;
12 ; *sump = sum;
13 ; }
14
15 segment .text
16 global _calc_sum
17 ;
18 ; local variable:
19 ; sum at [ebp-4]
20 _calc_sum:
21 enter 4,0 ; hace espacio para sum en la pila
22 push ebx ; IMPORTANTE!
23
24 mov dword [ebp-4],0 ; sum = 0
25 dump_stack 1, 2, 4 ; imprime la pila desde ebp-8 hasta ebp+16
26 mov ecx, 1 ; ecx es i en el pseudocodigo
27 for_loop:
Sumar enteros hasta: 10
Stack Dump # 1
EBP = BFFFFB70 ESP = BFFFFB68
+16 BFFFFB80 080499EC
+12 BFFFFB7C BFFFFB80
+8 BFFFFB78 0000000A
+4 BFFFFB74 08048501
+0 BFFFFB70 BFFFFB88
-4 BFFFFB6C 00000000
-8 BFFFFB68 4010648C
Sum is 55
Figura 4.13: Muestra de la ejecucion del programa sub5
28 cmp ecx, [ebp+8] ; cmp i y n
29 jnle end_for ; si no i <= n, sale
30
31 add [ebp-4], ecx ; sum += i
32 inc ecx
34
35 end_for:
36 mov ebx, [ebp+12] ; ebx = sump
38 mov [ebx], eax
39
40 pop ebx ; restaura ebx
41 leave
42 ret
sub5.asm
Por que la lnea 22 de sub5.asm es importante? Porque la convencion
de llamado de C requiere que el valor de EBX no se modique por la funcion
llamada. Si esto no se hace muy probable que el programa no trabajara cor-
rectamente.
La lnea 25 demuestra como trabaja el macro dump stack. Recuerde que
el primer parametro es solo una etiqueta numerica, y el segundo y tercero
determinan cuantas palabras dobles se muestran antes y despues de EBP
respectivamente. La Figura 4.13 muestra un ejemplo de la ejecucion de un
programa. Para este volcado, uno puede ver que la direccion de la palabra
doble para almacenar la suma es BB80 (en EBP + 12); el n umero a
sumar es 0000000A (en EBP + 8); la direccion de retorno para la rutina es
90 CAP
08048501 (en EBP + 4); el valor guardado de EBP es BFFFFB88 (en EBP);
el valor de la variable local es 0 en (EBP- 4); y nalmente el valor guardado
de EBX es 4010648C (en EBP- 8).
La funcion calc sum podra ser rescrita para devolver la suma como un
valor de retorno en lugar de usar un parametro apuntador. Ya que la suma
es un valor entero, la suma se podra dejar en el registro EAX. La lnea 11
del archivo main5.c debera ser cambiada por:
sum = calc sum(n);
Tambien, el prototipo de calc sum podra necesitar ser alterado. Abajo esta,
el codigo modicado en ensamblador.
sub6.asm
1 ; subroutina _calc_sum
2 ; halla la suma de los enteros de 1 hasta n
3 ; Parametros:
4 ; n - hasta donde se suma (en [ebp + 8])
5 ; Valor de retorno:
6 ; la suma
7 ; pseudocodigo en C:
8 ; int calc_sum( int n )
9 ; {
10 ; int i, sum = 0;
11 ; for( i=1; i <= n; i++ )
12 ; sum += i;
13 ; return sum;
14 ; }
15 segment .text
16 global _calc_sum
17 ;
18 ; local variable:
19 ; sum at [ebp-4]
20 _calc_sum:
21 enter 4,0 ; hace espacio en la pila para sum
22
23 mov dword [ebp-4],0 ; sum = 0
24 mov ecx, 1 ; ecx es i en el pseudocodigo
25 for_loop:
26 cmp ecx, [ebp+8] ; cmp i and n
27 jnle end_for ; si no i <= n, sale
28
29 add [ebp-4], ecx ; sum += i
30 inc ecx
4.8. SUBPROGRAMAS ENTRANTES Y RECURSIVOS 91
1 segment .data
2 format db "%d", 0
3
4 segment .text
5 ...
6 lea eax, [ebp-16]
7 push eax
8 push dword format
9 call _scanf
10 add esp, 8
11 ...
Figura 4.14: Llamando scanf desde ensamblador
32
33 end_for:
35
36 leave
37 ret
sub6.asm
4.7.8. Llamando funciones de C desde ensamblador
Una gran ventaja de interfasar C y ensamblador es que le permite al
codigo de ensamblador acceder a la gran biblioteca de C y usar funciones
escritas por el usuario. Por ejemplo, si usted desea llamar la funcion scanf
para leer un entero del teclado. La Figura 4.14 muestra el codigo que hace
esto. Un punto muy importante que recordar es que scanf sigue la conven-
cion de llamado de C normalizada. Esto signica que preserva los valores de
los registros EBX, ESI y EDI; sin embargo los registros EAX, ECX y EDX
se pueden modicar. De hecho EAX denitivamente sera cambiado, ya que
el contiene el valor de retorno del llamado a scanf. Para otros ejemplos del
uso de interfaces con C, vea el codigo en asm io.asm que fue usado para
crear asm io.obj.
4.8. Subprogramas entrantes y recursivos
Un programa reentrante debe satisfacer las siguientes propiedades:
92 CAP
No debe modicar ninguna instruccion. En un lenguaje de alto niv-
el esto podra ser difcil, pero en ensamblador no es difcil para un
programa intentar modicar su propio codigo. Por ejemplo:
mov word [cs:$+7], 5 ; copia 5 en la palabra 7 bytes adelante
add ax, 2 ; la instruccion anterio cambia 2 por 5
Este codigo trabajara en modo real, pero en sistemas operativos con
modo protegido el segmento de codigo esta marcado de solo lectura.
Cuando se ejecute la primera lnea, el programa se abortara en estos
sistemas. Esto es una mala forma de programar por muchas razones.
Es confuso, difcil de mantener y no permite compartir el codigo (vea
despues).
No debe modicar datos globales (tal como los datos que estan en el
segmento data y bss). Todas las variables son almacenadas en la pila.
Hay varias ventajas de escribir codigo reentrante:
Un subprograma reentrante se puede llamar recursivamente.
Un programa reentrante puede compartirse en m ultiples procesos. En
muchos sistemas operativos multitarea, si hay varias instancias de un
programa ejecutandose, solo una copia del codigo esta en memoria.
Las bibliotecas compartidas y DLL (Dinamic Link Libraries) usan
esta idea tambien.
Programas reentrantes trabajan mucho mejor en programas multihilo
5
Windows 9x/NT y la mayora de los sistemas operativos tipo UNIX
(Solaris, Linux, etc.) soportan programas multihilo.
4.8.1. Subprogramas recursivos
Estos tipos de subprogramas se invocan as mismos. La recursion puede
ser directa o indirecta. La recursion directa ocurre cuando un subprograma,
digamos foo se invoca as mismo dentro del cuerpo de foo. La recursion in-
directa ocurre cuando un subprograma no se llama as mismo directamente,
pero otro subprograma lo llama. Por ejemplo, el subprograma foo podra
llamar a bar y bar podra llamar a foo.
Los programas recursivos deben tener una condicion de terminacion.
Cuando esta condicion es verdadera, no se necesita hacer mas llamadas. Si
la rutina recursiva no tiene una condicion de terminacion o la condicion
nunca se vuelve verdadera, la recursion nunca termina (muy parecido a un
bucle innito).
1 ; finds n!
2 segment .text
3 global _fact
4 _fact:
5 enter 0,0
6
7 mov eax, [ebp+8] ; eax = n
8 cmp eax, 1
9 jbe term_cond ; si n <= 1, termina
10 dec eax
11 push eax
12 call _fact ; eax = fact(n-1)
13 pop ecx ; respuesta en eax
14 mul dword [ebp+8] ; edx:eax = eax * [ebp+8]
15 jmp short end_fact
16 term_cond:
17 mov eax, 1
18 end_fact:
19 leave
20 ret
Figura 4.15: Funcion factorial recursiva
.
n=3 frame
n=2 frame
n=1 frame
n(3)
Return address
Saved EBP
n(2)
Return address
Saved EBP
n(1)
Return address
Saved EBP
Figura 4.16: Marco de la pila para la funcion factorial
94 CAP
void f ( int x )
{
int i ;
for ( i =0; i < x; i ++ ) {
printf ( %d\n, i);
f ( i );
}
}
Figura 4.17: Otro ejemplo (version de C)
La Figura 4.15 muestra una funcion que calcula el factorial recursiva-
mente. Puede ser llamado desde C con:
x = fact (3); / nd 3! /
La Figura 4.16 muestra como se ve la pila en el punto mas profundo del
llamado de la funcion anterior.
Las Figuras 4.17 y 4.18 muestran otro ejemplo recursivo mas complica-
do en C y en ensamblador respectivamente. Cual es la salida para f(3)?
Observe que la instruccion ENTER crea un nuevo i en la pila para cada lla-
mado recursivo. As cada instancia recursiva de f tiene su propia variable
independiente i. Deniendo i como una palabra doble en el segmento data
no trabajara igual.
4.8.2. Revision de tipos de variables seg un su alcance en C
C suministra varios tipos de almacenamiento para las variables.
global Estas variables estan denidas fuera de cualquier funcion y estan
almacenadas en lugares jos de memoria (en los segmentos data o
bss) y existen desde el inicio hasta el nal del programa. Por defecto
ellas pueden ser accedidas por cualquier funcion en el programa; sin
embargo, si ellas estan declaradas como static, solo las funciones en
el mismo modulo pueden acceder a ellas (en terminos de ensamblador
la etiqueta es interna, no externa).
static Estas son variables locales de una funcion que son declaradas static
(desafortunadamente, C usa la palabra reservada static para dos
propositos diferentes). Estas variables se almacenan tambien en lu-
gares jos de memoria (en data bss), pero solo se pueden acceder
directamente en las funciones en donde ellas se denieron.
5
un programa multihilo tiene varios hilos de ejecucion. Esto es el programa en s mismo
es multitarea.
1 %define i ebp-4
2 %define x ebp+8 ; macros utiles
3 segment .data
4 format db "%d", 10, 0 ; 10 = \n
5 segment .text
6 global _f
7 extern _printf
8 _f:
9 enter 4,0 ; toma espacio en la pila para i
10
11 mov dword [i], 0 ; i = 0
12 lp:
13 mov eax, [i] ; es i < x?
14 cmp eax, [x]
15 jnl quit
16
17 push eax ; llama printf
18 push format
19 call _printf
20 add esp, 8
21
22 push dword [i] ; llama f
23 call _f
24 pop eax
25
26 inc dword [i] ; i++
27 jmp short lp
28 quit:
29 leave
30 ret
Figura 4.18: Otro ejemplo (version de ensamblador)
96 CAP
automatic Este es el tipo por defecto para una variable denida dentro de
una funcion. Estas variables son colocadas en la pila cuando la funcion
en la cual estan denidas se invocada y quitadas cuando la funcion
retorna. As, ellas no tienen un lugar jo en memoria.
register Esta palabra reservada le pregunta al compilador usar un registro
para el dato de esta variable. Esto es solo una solicitud. El compi-
lador no tiene que hacerlo. Si la direccion de la variable se usa en
cualquier parte del programa la variable no sera de este tipo (ya que
los registros no tienen direccion). Tambien, solo tipos enteros pueden
ser valores tipo register. Tipos estructurados no lo pueden ser, ellos
no caben en un registro! Los compiladores de C a menudo convertiran
variables normales automatic en variables register sin ning un aviso al
programador.
volatile Esta palabra clave le dice al compilador que el valor en la variable
puede cambiar en cualquier momento. Esto signica que el compi-
lador no puede hacer ninguna suposicion sobre cuando se modica la
variable. A menudo un compilador podra almacenar el valor de una
variable en un registro temporalmente y usar el registro en vez de la
variable en una parte del codigo. No se pueden hacer este tipo de opti-
mizaciones con variables volatile. Un ejemplo com un de una variable
volatile podra ser una que se alterara por dos hilos de un programa
multihilo. Considere el siguiente codigo:
x = 10;
y = 20;
z = x;
Si x pudiera ser alterada por otro hilo, es posible que otro hilo cambie
x entre las lneas 1 y 3 as que z podra no ser 10. Sin embargo, si x no
fue declarada volatile, el compilador podra asumir que x no cambia y
ja z a 10.
If x could be altered by another thread, it is possible that the other
thread changes x between lines 1 and 3 so that z would not be 10.
However, if the x was not declared volatile, the compiler might assume
that x is unchanged and set z to 10.
Otro uso de volatile es evitar que el compilador use un registro para
una variable.
Captulo 5
Arreglos
5.1. Introduccion
Un arreglo es un bloque contiguo de una lista de datos en la memoria.
Cada elemento de la lista debe ser del mismo tipo y usar exactamente el
mismo n umero de bytes de memria para almacenarlo. Por estas propiedade,
los arreglos permiten un acceso eciente de los datos por su posicion (o
ndice) en el arreglo. La direccion de cualquier elemento se puede calcular
conociendo tres factores:
La direccion del primer elemento del arreglo.
El n umero de bytes de cada elemento.
El ndice del elemento.
Es conveniente considerar el ndice del primer elemento como 0 (tal como
C). Es posible usar otros valores para el primer ndic, pero esto complica los
calculos.
5.1.1. Denir arreglos
Denir arreglos en los segmentos data y bss
Para denir un arreglo iniciado en el segmento data, use las directivas
normaleas: db, dw, etc. NASM tambien suministra la directiva llamada TIMES
que se puede usar para repetir una instruccion muchas veces sin tener que
duplicar las instrucciones a mano. La Figura 5.1 muestra varios ejemplos de
estos.
97
98 CAP
ITULO 5. ARREGLOS
1 segment .data
2 ; define un arreglo de 10 plabras dobles con valores
3 ; iniciales de 1,2,..,10
4 a1 dd 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
5 ; define un arreglo de 10 palabras inicadas todas con 0
6 a2 dw 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
7 ; lo mismo de antes usando TIMES
8 a3 times 10 dw 0
9 ; define un arreglo de bytes con ceros y luego 100 con unos
10 a4 times 200 db 0
11 times 100 db 1
12
13 segment .bss
14 ; define un arreglo de 10 palabras dobles sin valor inicial
15 a5 resd 10
16 ; define un arreglo de 100 palabras dobles sin valor inicial
17 a6 resw 100
Figura 5.1: Denir arreglos
Para denir un arreglo iniciado en el segmento bss, use las directivas
resb, resw, etc. Recuerde que estas directivas tienen un operando que es-
pera cuantas unidades de memoria reservar. La Figura 5.1 muestra tambien
ejemplos de este tipo de deniciones
Denir arreglos como variables locales en la pila
No hay una manera directa de denir una arreglo como variable local en
la pila. Como antes, uno calcula el el total de bytes necesarios para todas las
variables locales, incluidos los arreglos, y restar esto de ESP (o directamente
usando la instruccion ENTER). Por ejemplo, si una funcion necesita una vari-
able caracter, dos enteros y 50 elementos de un arreglo de palabras, uno
necesitara 1 + 2 + 50 = 109 bytes. Sin embargo, el n umero restado de ESP
debera ser un m ultiplo de cuatro (112 en este caso) para que ESP este en el
boundary de pna palabra doble. Uno podra formar las variables dentro de
los 10g bytes de varias maneras. La Figura 5.2 muestra dos maneras posi-
bles. La parte sin uso del primer orden para dejar las palabras dobles en
los lmites de palabras dobles para aumentar la velocidad del acceso a la
memoria.
5.1. INTRODUCCI
ON 99
EBP - 1 char
no usado
EBP - 8 dword 1
EBP - 12 dword 2 word
array
word
array EBP - 100
EBP - 104 dword 1
EBP - 108 dword 2
EBP - 109 char
EBP - 112 no usado
Figura 5.2: Disposicion de la pila
5.1.2. Acdeder a elementos de los arreglos
No hay operador [ ] en ensamblador como en C. Para acceder a un
elemento del arreglo, se debe calcular la direccion. Considere las dos deni-
ciones siguientes de arreglos:
array1 db 5, 4, 3, 2, 1 ; arreglo de bytes
array2 dw 5, 4, 3, 2, 1 ; arreglo de palabras
A continuacion algunos ejemplos usando estos arreglos.
1 mov al, [array1] ; al = array1[0]
2 mov al, [array1 + 1] ; al = array1[1]
3 mov [array1 + 3], al ; array1[3] = al
4 mov ax, [array2] ; ax = array2[0]
5 mov ax, [array2 + 2] ; ax = array2[1] (NO array2[2]!)
6 mov [array2 + 6], ax ; array2[3] = ax
7 mov ax, [array2 + 1] ; ax = ??
En la lnea 5, se referencia el elemento 1 del arreglo, no el segundo. Por que?
Las palabras son unidades de 2 bytes, para moverse al siguiente elemento
del arreglo uno se debe mover 2 bytes adelante, no uno. La lnea 7 leera un
byte del primer elemento y uno del segundo. En C, el compilador mira el
tipo de apuntador para determinar cuantos bytes mover en una expresion
aritmetica para que el programador no tenga que hacerla. Sin embargo el
ensamblador es el que calcula el tama no de los elementos del arreglo cuando
se mueve de elemento en elemento.
La Figura 5.3 muestra un fragmento de codigo que suma todos los ele-
mentos de array1 del ejemplo anterior. En la lnea 7, a AX se le suma DX.
Por que no AL? Primero, los dos operandos de la instruccion ADD deben
100 CAP
ITULO 5. ARREGLOS
1 mov ebx, array1 ; ebx = direccion de array1
2 mov dx, 0 ; dx almacenara sum
3 mov ah, 0 ; ?
4 mov ecx, 5
5 lp:
6 mov al, [ebx] ; al = *ebx
7 add dx, ax ; dx += ax (not al!)
8 inc ebx ; bx++
9 loop lp
Figura 5.3: Sumar elementos de un arreglo (Version 1)
3 mov ecx, 5
4 lp:
5 add dl, [ebx] ; dl += *ebx
6 jnc next ; if no hay carry vaya a next
7 inc dh ; inc dh
8 next:
9 inc ebx ; bx++
10 loop lp
ser del mismo tama no. Segundo, debera ser facil sumar bytes y llegar a un
resultado que no quepa en un byte. Usando DX, se permite una suma hasta
65.535. Sin embargo es importante ver que se esta sumando AH tambien.
Esta es la razon por la cual se ja AH a cero.
1
en la lnea 3.
also. This is why AH is set to zero
2
in line 3.
Las Figuras 5.4 y 5.5 muestran dos alternativas para calcular la suma.
Las lneas en italica reemplazan las lneas 6 y 7 de la Figura 5.3.
1
Fijando AH a cero se asume implcitamente que AL es un n umero sin signo. Si es con
signo, la accion apropiada sera insertar una instruccion CBW entre las lneas 6 y 7
2
Setting AH to zero is implicitly assuming that AL is an unsigned number. If it is
signed, the appropriate action would be to insert a CBW instruction between lines 6 and 7
5.1. INTRODUCCI
ON 101
3 mov ecx, 5
4 lp:
5 add dl, [ebx] ; dl += *ebx
6 adc dh, 0 ; dh += bandera de carry + 0
7 inc ebx ; bx++
8 loop lp
5.1.3. Direccionamiento indirecto mas avanzado
No es sorprendente que se use direccionamiento indirecto con arreglos.
La forma mas general de una referencia indirecta memoria es
[ reg base + factor *reg ndice + constante ]
donde:
reg base es uno de los registros EAX, EBX, ECX, EDX, EBP, ESP, ESI o
EDI.
factor es 1, 2, 4 o 8. (Si 1, el factor se omite)
index reg es uno de estos registros EAX, EBX, ECX, EDX, EBP, ESI,
EDI. (observe que ESP no esta en la lista.)
constant es una constante de 32 bits. La constante puede ser una etiqueta
(o expresion de etiqueta).
5.1.4. Ejemplo
Se presenta un ejemplo que usa un arreglo y se pasa a la funcion.
Usa el programa array1c.c (listado abajo) como driver y no el programa
driver.ci.
array1.asm
1 %define ARRAY_SIZE 100
2 %define NEW_LINE 10
3
4 segment .data
5 FirstMsg db "Primeros 10 elementos del arreglo", 0
6 Prompt db "Ingrese el ndice del elemento a mostrar: ", 0
102 CAP
ITULO 5. ARREGLOS
7 SecondMsg db "Elemento %d es %d", NEW_LINE, 0
8 ThirdMsg db "Elementos 20 hasta 29 del arreglo", 0
9 InputFormat db "%d", 0
10
11 segment .bss
12 array resd ARRAY_SIZE
13
14 segment .text
15 extern _puts, _printf, _scanf, _dump_line
16 global _asm_main
17 _asm_main:
18 enter 4,0 ; variable local en EBP - 4
19 push ebx
20 push esi
21
22 ; Se inicia el arreglo con 100, 99, 98, 97, ...
23
24 mov ecx, ARRAY_SIZE
25 mov ebx, array
26 init_loop:
27 mov [ebx], ecx
28 add ebx, 4
29 loop init_loop
30
31 push dword FirstMsg ; imprime FirstMsg
32 call _puts
33 pop ecx
34
35 push dword 10
36 push dword array
37 call _print_array ; imprime los 10 primeros elementos del arreglo
38 add esp, 8
39
40 ; Le pregunta al usuario el ndice del elemento
41 Prompt_loop:
42 push dword Prompt
43 call _printf
44 pop ecx
45
46 lea eax, [ebp-4] ; eax = direccion de la variable local
47 push eax
48 push dword InputFormat
5.1. INTRODUCCI
ON 103
49 call _scanf
50 add esp, 8
51 cmp eax, 1 ; eax = valor de retorno de scanf
52 je InputOK
53
54 call _dump_line ; dump rest of line and start over
55 jmp Prompt_loop ; si la entrada no es valida
56
57 InputOK:
58 mov esi, [ebp-4]
59 push dword [array + 4*esi]
60 push esi
61 push dword SecondMsg ; imprime el valor del elemento
62 call _printf
63 add esp, 12
64
65 push dword ThirdMsg ; imprime los elementos 20 a 29
66 call _puts
67 pop ecx
68
69 push dword 10
70 push dword array + 20*4 ; direccion de array[20]
71 call _print_array
72 add esp, 8
73
74 pop esi
75 pop ebx
77 leave
78 ret
79
80 ;
81 ; routine _print_array
82 ; Rutina llamable desde C que imprime elementos de arreglos de palabras
83 ; dobles como enteros con signo
84 ; Prototipo de C:
85 ; void print_array( const int * a, int n);
86 ; Parametros:
87 ; a - Apuntador al arreglo a imprimir (en ebp+8 en la pila)
88 ; n - n umero de enteros a imprimir (en ebp+12 en la pila)
89
90 segment .data
104 CAP
ITULO 5. ARREGLOS
91 OutputFormat db "%-5d %5d", NEW_LINE, 0
92
93 segment .text
94 global _print_array
95 _print_array:
96 enter 0,0
97 push esi
98 push ebx
99
100 xor esi, esi ; esi = 0
101 mov ecx, [ebp+12] ; ecx = n
102 mov ebx, [ebp+8] ; ebx = direccion del arreglo
103 print_loop:
104 push ecx ; <print podra cambiar ecx!
105
106 push dword [ebx + 4*esi] ; empuja array[esi]
107 push esi
108 push dword OutputFormat
109 call _printf
110 add esp, 12 ; quita los parametros (<deja ecx!)
111
112 inc esi
113 pop ecx
114 loop print_loop
115
116 pop ebx
117 pop esi
118 leave
119 ret
array1.asm
array1c.c
#include <stdio.h>
int asm main( void );
void dump line( void );
int main()
{
int ret status ;
ret status = asm main();
return ret status ;
5.1. INTRODUCCI
ON 105
}
/
ofuncin dump line
dumps all chars left in current line from input buer
/
void dump line()
{
int ch;
while( (ch = getchar()) != EOF && ch != \n)
/ cuerpo vacio/ ;
}
array1c.c
Revision de la instruccion LEA
La instruccion LEA se puede usar para otros propositos que solo calcular
direcciones. Un uso com un es para calculos rapidos. Considere lo siguiente:
lea ebx, [4*eax + eax]
Esto efectivamente almacena el valor de 5 EAX en EBX. Usando LEA para
hacer esto, es mas facil y rapido que usar MUL. Sin embargo, uno debe tener
en cuenta que la expresion dentro de los parentesis cuadrados debe ser una
direccion indirecta correcta. As por ejemplo, esta instruccion no se puede
usar para multiplicar por 6 rapidamente.
5.1.5. Arreglos multidimiensionales
Un arreglo multidimensional no es realmente muy diferente que los arreg-
los unidimensionales ya discutidos de hecho, estan representados en memoria
tal como un arreglo unidimensional.
Arreglos bidimensionales
No debe sorprender que el arreglo multidimiensional mas elemental es el
arreglo unidimensional ya discutido. Un arreglo multidimensional se presenta
a menudo como una malla de elementos. Cada elemento esta identicado por
un par de ndices. Por convencion, el primer ndice es identicado con la la
del elemento y el segundo ndice la columna.
Considere un arreglo con tres las y dos columnas denidas como:
106 CAP
ITULO 5. ARREGLOS
1 mov eax, [ebp - 44] ; ebp - 44 es el sitio de i
2 sal eax, 1 ; multiplica i por 2
3 add eax, [ebp - 48] ; add j
4 mov eax, [ebp + 4*eax - 40] ; ebp - 40 es la direccion a[0][0]
5 mov [ebp - 52], eax ; Almacena el resultado en ebp - 52
Figura 5.6: Ensamblador para x = a[ i ][ j ]
int a [3][2];
El compilador de C reservara espacio para un arreglo de 6 (= 23) enteros
y ordena los elementos como sigue:
Indice 0 1 2 3 4 5
Elemento a[0][0] a[0][1] a[1][0] a[1][1] a[2][0] a[2][1]
La tabla intenta mostrar como el elemento referenciado como a[0][0] es
almacenado en el comienzo de los 6 elementos de un arreglo unidimension-
al. El elemento a [0][l] se almacena en la siguiente posicion (ndice 1) y
as sucesivamente. Cada la del arreglo bidimensional se almacena contigua-
mente en memoria. El ultimo elemento de una la es seguido por el primer
elemento de la proxima la. Esto es conocido como la representacion row-
wise del arreglo y es como un compilador de C/C++ podra representar el
arreglo.
Como el compilador determina donde aparece a[i][j] en la repre-
sentacion rowwise? Una formula elemental calculara el ndice de i y j. La
formula en este caso es 2i +j. No es difcil ver como se deriva esta formula.
Cada la es de dos elementos; as, el primer elemento de la la i esta en la
posicion 2i . Entonces la posicion de la columna j se encuentra sumando j
a 2i. Este analisis tambien muestra como la formula se generaliza para un
arreglo con N columnas. N i + j. Observe que la formula no depende del
n umero de las.
Como un ejemplo, veamos como compila gcc el siguiente codigo (usando
el arreglo a denido antes):
x = a[ i ][ j ];
La Figura 5.6 muestra como el ensamblador trabaja esto, as, el compilador
esencialmente convierte el codigo a:
x = (&a[0][0] + 2i + j );
y de hecho, el programador podra escribir de esta manera con los mismos
resultados.
5.1. INTRODUCCI
ON 107
No hay nada magico sobre la escogencia de la representacion rowwise del
arreglo. Una representacion columnwise podra trabajar bien:
Index 0 1 2 3 4 5
Element a[0][0] a[1][0] a[2][0] a[0][1] a[1][1] a[2][1]
En la representacion columnwise, cada columna se almacena contigua. El
elemento [i][j] se almacenan en la posicion i +3j. Otros lenguajes (FOR-
TRAN, por ejemplo) usan la representacion columnwise. Esto es importante
cuando se interfaza el codigo con varios lenguajes.
Dimensiones mayores que dos
Para las dimensiones mayores de 2, se aplica la misma idea basica. Con-
sidere el arreglo tridimensional:
int b [4][3][2];
Este arreglo debera ser almacenado como si fueran cuatro arreglos bidi-
mensionales cada uno de tama no [3][2] consecutivamente en memoria. La
tabla de abajo muestra como comienza el:
Index 0 1 2 3 4 5
Element b[0][0][0] b[0][0][1] b[0][1][0] b[0][1][1] b[0][2][0] b[0][2][1]
Index 6 7 8 9 10 11
Element b[1][0][0] b[1][0][1] b[1][1][0] b[1][1][1] b[1][2][0] b[1][2][1]
La formula para calcular la posicion de b[i][j][k] es 6i + 2j + k. El 6
esta determinado por el tama no de los arreglos [3][2]. En general, para un
arreglo a[i][j][k] sera: M N i + N j + k. Observe que nuevamente
la primera dimension L no aparece en la formula.
Para dimensiones mayores, se generaliza el mismo proceso. Para un arreg-
lo n dimensional de dimensiones D
1
a D
n
, la posicion del elemento denotada
por los ndices i
1
a i
n
esta dada por la formula:
D
2
D
3
D
n
i
1
+ D
3
D
4
D
n
i
2
+ + D
n
i
n1
+ i
n
o puede ser escrito mas corto como:
n
j=1
k=j+1
D
k
i
j
La primera dimension D
1
no aparece en la formula: Aqu es donde puede de-
cirle al autor que fue un
mejor fsico (o fue la ref-
erencia a FORTRAN un
regalo?)
Por una representacion columnwise la formula general sera:
i
1
+D
1
i
2
+ +D
1
D
2
D
n2
i
n1
+D
1
D
2
D
n1
i
n
108 CAP
ITULO 5. ARREGLOS
En la notacion matematica griega de uber:
n
j=1
j1
k=1
D
k
i
j
En este caso, es la ultima dimension D
n
, la que no aparece en la formula.
Pasar arreglos multidimensionales como parametros en C
La representacion rowwise de arreglos multidimensionales tiene un efecto
directo en la programacion en C. Para arreglos unidimensionales, no no se
necesita el tama no del arreglo para calcular donde esta localizado un elemen-
to en memoria. Esto no es cierto para arreglos multidimensionales. Acceder
a los elementos de estos arreglos el compilador debe conocer todo menos la
primera dimension. Esto es aparente cuando consideramos el prototipo de la
funcion que toma un arreglo multidimensional como parametro. Lo siguiente
no compilara:
void f ( int a [ ][ ] ); / No hay oinformacin de la odimensin /
Sin embargo, lo siguiente compila:
void f ( int a [ ][2] );
Cualquier arreglo bidimensional con dos columnas puede ser pasado a esta
funcion. La primera dimension no se necesita.
3
No se confunda con una funcion con este prototipo:
void f ( int a [ ] );
Esto dene un arreglo unidimensional de apuntadores enteros (que inciden-
talmente puede ser usado para crear un arreglo de arreglos que se comporta
muy parecido a un arreglo bidimensional).
Para arreglos de dimensiones mayores, se debe especicar todo menos
la primera dimension. Por ejemplo, un arreglo de 4 dimensiones se podra
pasar como:
void f ( int a [ ][4][3][2] );
5.2. Instrucciones de arreglos/cadenas
La familia de procesadores 80X86 suministran varias instrucciones que
estan dise nadas para trabajar con arreglos. Estas instrucciones son llamadas
instrucciones de cadena. Ellas usan los registros de ndice (ESI y EDI) para
3
Se puede especicar un tama no all, pero sera ignorado por el compilador.
5.2. INSTRUCCIONES DE ARREGLOS/CADENAS 109
LODSB AL = [DS:ESI]
ESI = ESI 1
STOSB [ES:EDI] = AL
EDI = EDI 1
LODSW AX = [DS:ESI]
ESI = ESI 2
STOSW [ES:EDI] = AX
EDI = EDI 2
LODSD EAX = [DS:ESI]
ESI = ESI 4
STOSD [ES:EDI] = EAX
EDI = EDI 4
Figura 5.7: Instrucciones de cadena de lectura y escritura
realizar una operacion y entonces automaticamente incrementan o decre-
mentan uno o los dos registros de ndice. La bandera direccion (DF) en el
registro FLAGS determina donde los registros de ndice son incrementados
o decrementados. Hay dos instrucciones que modican la bandera direccion:
CLD Borra la bandera de direccion. En este estado, los registros de ndice
se incrementan.
STD Establece la bandera de direccion. En este estado los registros de
ndice se decrementan.
Un error muy com un en la programacion de 80X86 es olvidar colocar la ban-
dera de direccion en el estado correcto de manera explcita. Esto a menudo
hace que el codigo trabaje la mayor parte del tiempo (cuando sucede que
la bandera de direccion esta en el estado deseado) pero no trabaja todo el
tiempo.
5.2.1. Leer y escribir en la memoria
Las instrucciones mas elementales leen o escriben en memoria. Ellas
pueden leer o escribir un byte, palabra o palabra doble de una vez. La
Figura 5.7 muestra estas instrucciones con una corta descripcion en pseu-
docodigo que hace ella. Hay varios puntos para tener en cuenta. Primero,
ESI se usa para leer y EDI para escribir. Es facil recordar esto si uno tiene
en cuenta que SI signica Source Index y DI signica Destination Index.
Ahora observe que el registro que almacena el dato es jo (AL, AX o AEX).
Finalmente, observe que las instrucciones de almacenamiento usan ES para
determinar el segmento donde escribir, no DS. En la programacion en modo
protegido esto no es normalmente un problema, ya que hay solo un segmento
de datos y ES debera ser iniciado automaticamente para referenciarlo. (tal
como es DS). Sin embargo, en la programacion en modo real es muy impor-
tante para el programador iniciar ES con el valor de selector del segmento
correcto.
4
La Figura 5.8 muestra un ejemplo del uso de estas instrucciones
4
Otra complicacion es que uno no puede copiar el valor de DS en el registro de ES
directamente usando la instruccion MOV. En lugar de ello, el valor DS debe copiarse a un
110 CAP
ITULO 5. ARREGLOS
1 segment .data
2 array1 dd 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
3
4 segment .bss
5 array2 resd 10
6
7 segment .text
8 cld ; <No olvide esto!
9 mov esi, array1
10 mov edi, array2
11 mov ecx, 10
12 lp:
13 lodsd
14 stosd
15 loop lp
Figura 5.8: Ejemplo de carga y almacenamiento
que copia un arreglo en otro.
La combinacion de una instruccion LODSx y STOSx (en las lneas 13 y
14 de la Figura 5.8) es muy com un. De hecho, esta combinacion se puede
realizar con una sola instruccion para cadenas MOVSx. La Figura 5.9 describe
las operaciones que estas instrucciones realizan. Las lneas 13 y 14 de la
Figura 5.8 debera ser reemplazada con una sola instruccion MOVSD con el
mismo efecto. La unica diferencia sera que el registro EAX no sera usado
en el bucle.
5.2.2. El prejo de instruccion REP
La familia 80X86 suministra un prejo de instruccion especial
5
llamado
REP que se puede usar con las instrucciones anteriores Este prejo le dice a
la CPU que repita la proxima instruccion de cadena un n umero especicado
de veces. El registro ECX se usa para contar las iteraciones (tal como la
instruccion LOOP). Usando el prejo REP, el bucle en la Figura 5.8 (lneas 12
a 15) se podra reemplazar con una sola lnea:
rep movsd
registro de proposito general (como AX) y entonces copiado de este registro a ES usando
dos instrucciones MOV.
5
un prejo de instruccion no es una instruccion, es un byte especial que se coloca antes
de una instruccion de cadena que modica el comportamiento de la instruccion. Se usan
otros prejos para sobreescribir los segmentos por defecto de los accesos a memoria
MOVSB byte [ES:EDI] = byte [DS:ESI]
ESI = ESI 1
EDI = EDI 1
MOVSW word [ES:EDI] = word [DS:ESI]
ESI = ESI 2
EDI = EDI 2
MOVSD dword [ES:EDI] = dword [DS:ESI]
ESI = ESI 4
EDI = EDI 4
Figura 5.9: Instrucciones de cadena de movimiento de memoria
1 segment .bss
2 array resd 10
3
4 segment .text
5 cld ; <No olvide esto!
6 mov edi, array
7 mov ecx, 10
8 xor eax, eax
9 rep stosd
Figura 5.10: Ejemplo de arreglo cero
La Figura 5.10 muestra otro ejemplo que llena de ceros el contenido de un
arreglo.
5.2.3. Comparacion de las instrucciones de cadena
La Figura 5.11 muestra varias instrucciones de cadena nuevas que se
pueden usar para comparar memoria con otra memoria o un registro. Ellas
son utiles para comparar o buscar en arreglos. Ellas jan el registro FLAGS
tal como la instruccion CMP. Las instrucciones CMPSx comparan el lugar de
memoria correspondiente y SCASx comparan lugares de memoria en busca
de un valor especco.
La Figura 5.12 muestra una porcion de codigo que busca el n umero 12
en un arreglo de palabras dobles, la instruccion SCASD en la lnea 10 siempre
le suma 4 a EDI a un si el valor buscado se encuentra. As si uno desea
encontrar la direccion de donde esta el 12 es necesario sustraer 4 de EDI
(como lo hace la lnea 16).
112 CAP
ITULO 5. ARREGLOS
CMPSB compara el byte [DS:ESI] y el byte [ES:EDI]
ESI = ESI 1
EDI = EDI 1
CMPSW compara la palabra [DS:ESI] y la word
[ES:EDI]
ESI = ESI 2
EDI = EDI 2
CMPSD compara la dword [DS:ESI] y la dword
[ES:EDI]
ESI = ESI 4
EDI = EDI 4
SCASB compara AL y [ES:EDI]
EDI 1
SCASW compara AX y [ES:EDI]
EDI 2
SCASD compara EAX y [ES:EDI]
EDI 4
Figura 5.11: Comparacion de las instrucciones de cadena
5.2.4. Prejos de instruccion REPx
Hay varios prejos de instruccion del tipo REP que se pueden usar con
las instrucciones de comparacion de cadenas. La Figura 5.13 muestra los
dos nuevos prejos y describe su operacion. REPE y REPZ son sinonimos
para el mismo prejo (como RPNE y REPNZ) si la comparacion repetida de
la instruccion de cadena se detiene por el resultado de la comparacion, el
registro o registrosndice se incrementan y ECX se decrementa; Sin embargo,
el registro FLAGS almacenara el estado que termino la repeticion. Por que uno no solo ve
si ECX es cero despues de
repetir la comparacion?
As es posible usar la bandera Z para determinar si las comparaciones
repetidas pararon por una comparacion o porque ECX es cero.
La Figura 5.14 muestra una porcion codigo de ejemplo que determina si
dos bloques de memoria son iguales. El JE en la lnea 7 del ejemplo examina el
resultado de la instruccion anterior. Si la comparacion repetida para porque
encontro dos bytes diferentes, la bandera Z continuara borrada y no se hace
el salto; sin embargo, si las comparaciones paran porque se vuelve cero, la
bandera Z estara jada y el codigo salta a la etiqueta equal.
5.2.5. Ejemplo
Esta seccion contiene un archivo fuente en ensamblador con varias fun-
ciones que implementan operaciones con arreglos usando instrucciones de
cadena. Muchas de las funciones duplican las funciones de las bibliotecas
1 segment .bss
2 array resd 100
3
4 segment .text
5 cld
6 mov edi, array ; apuntador al inicio del arreglo
7 mov ecx, 100 ; numero de elementos
8 mov eax, 12 ; numero a buscar
9 lp:
10 scasd
11 je found
12 loop lp
13 ; codigo a ejecutar si no se encontro
14 jmp onward
15 found:
16 sub edi, 4 ; edi apunta ahora a 12 en array
17 ; codigo a ejecutar si se encontro
18 onward:
Figura 5.12: Ejemplo de b usqueda
REPE, REPZ repite la instruccionn mientras la bandera Z este ja o maxi-
mo ECX veces
REPNE, REPNZ repite la instruccion mientras la bandera Z este borrada o
maximo ECX veces
Figura 5.13: Prejos de instruccion REPx
conocidas de C.
memory.asm
1 global _asm_copy, _asm_find, _asm_strlen, _asm_strcpy
2
3 segment .text
4 ; funcion _asm_copy
5 ; copia un bloque de memoria
6 ; prototipo de C
7 ; void asm_copy( void * dest, const void * src, unsigned sz);
8 ; parametros:
9 ; dest - apuntador del bufer para copiar a
10 ; src - apuntador del bufer para copiar desde
11 ; sz - numero de bytes a copiar
114 CAP
ITULO 5. ARREGLOS
1 segment .text
2 cld
3 mov esi, block1 ; direccion del primer bloque
4 mov edi, block2 ; direccion del segundo bloque
5 mov ecx, size ; tama~no del bloque en bytes
6 repe cmpsb ; repita mientras la bandera Z este fija
7 je equal ; Si Z esta fija, los bloque son iguales
8 ; codigo para ejecutar si los bloques no son igual
9 jmp onward
10 equal:
11 ; codigo para ejecutar si los bloques son iguales
12 onward:
Figura 5.14: Comparando bloques de memoria
12
13 ; ahora, se definen algunos smbolos utiles
14
15 %define dest [ebp+8]
16 %define src [ebp+12]
17 %define sz [ebp+16]
18 _asm_copy:
19 enter 0, 0
20 push esi
21 push edi
22
23 mov esi, src ; esi = direccion del bufer para copiar desde
24 mov edi, dest ; edi = direccion del bufer para copia a
25 mov ecx, sz ; ecx = numero de bytes a copiar
26
27 cld ; borrar la bandera de direccion
28 rep movsb ; ejecute movsb ECX veces
29
30 pop edi
31 pop esi
32 leave
33 ret
34
35
36 ; function _asm_find
37 ; Busca en la memoria un byte dado
38 ; void * asm_find( const void * src, char target, unsigned sz);
39 ; parametros
40 ; src - apuntador al lugar donde buscar
41 ; target - valor del byte a buscar
42 ; sz - tama~no en bytes de donde se busca
43 ; valor de retorno
44 ; si target se encuentra, apunta a la primera ocurrencia de target
45 ;
46 ; si no
47 ; retorna NULL
48 ; OBSERVE: target es un valor de un byte, pero se empuja en la pila como
49 ; una palabra doble. El byte se almacena en los 8 bits inferiores.
50 ;
51 %define src [ebp+8]
52 %define target [ebp+12]
53 %define sz [ebp+16]
54
55 _asm_find:
56 enter 0,0
57 push edi
58
59 mov eax, target ; al tiene el valor a buscar
60 mov edi, src
61 mov ecx, sz
62 cld
63
64 repne scasb ; busca hasta que ECX == 0 or [ES:EDI] == AL
65
66 je found_it ; Si la bandera cero se fija, entonces se
67 ; encontro el valor
68 mov eax, 0 ; Si no se encontro, retorna un apuntador NULL
69 jmp short quit
70 found_it:
71 mov eax, edi
72 dec eax ; Si se encuentra retorna (DI - 1)
73 quit:
74 pop edi
75 leave
76 ret
77
78
116 CAP
ITULO 5. ARREGLOS
79 ; function _asm_strlen
80 ; retorna el tama~no de una cadena
81 ; unsigned asm_strlen( const char * );
82 ; parametro
83 ; src - apuntador a la cadena
84 ; valor de retorno:
85 ; numero de caracteres en la cadena (sin contar el 0 final) (en EAX)
86
87 %define src [ebp + 8]
88 _asm_strlen:
89 enter 0,0
90 push edi
91
92 mov edi, src ; edi = apuntador a la cadena
93 mov ecx, 0FFFFFFFFh ; usa el mayor valor posible en ECX
94 xor al,al ; al = 0
95 cld
96
97 repnz scasb ; busca un 0 para terminar
98
99 ;
100 ; repnz will go one step too far, so length is FFFFFFFE - ECX,
101 ; not FFFFFFFF - ECX
102 ;
103 mov eax,0FFFFFFFEh
104 sub eax, ecx ; length = 0FFFFFFFEh - ecx
105
106 pop edi
107 leave
108 ret
109
110 ; funcion _asm_strcpy
111 ; copia una cadena
112 ; void asm_strcpy( char * dest, const char * src);
113 ; parametros
114 ; dest - apuntador a la cadena de destion
115 ; src - apuntador a la cadena origen
116 ;
117 %define dest [ebp + 8]
118 %define src [ebp + 12]
119 _asm_strcpy:
120 enter 0,0
121 push esi
122 push edi
123
124 mov edi, dest
125 mov esi, src
126 cld
127 cpy_loop:
128 lodsb ; Caraga AL e inc si
129 stosb ; almacena AL e inc di
130 or al, al ; fija las banderas de condicion
131 jnz cpy_loop ; si no pasa terminando 0, continua
132
133 pop edi
134 pop esi
135 leave
136 ret
memory.asm
memex.c
#include <stdio.h>
#dene STR SIZE 30
/ prototipos /
void asm copy( void , const void , unsigned ) attribute ((cdecl ));
void asm nd( const void ,
char target , unsigned ) attribute ((cdecl ));
unsigned asm strlen( const char ) attribute ((cdecl ));
void asm strcpy( char , const char ) attribute ((cdecl ));
int main()
{
char st1[STR SIZE] = test string;
char st2[STR SIZE];
char st ;
char ch;
asm copy(st2, st1 , STR SIZE); / copia todos los 30 caracteres de la
cadena/
printf ( %s\n, st2);
printf (Digite un caracter : ); / busca un byte en la cadena /
118 CAP
ITULO 5. ARREGLOS
scanf( %c %[\n], &ch);
st = asm nd(st2 , ch, STR SIZE);
if ( st )
printf (Encontrado en : %s\n, st );
else
printf (No encontrado\n);
st1 [0] = 0;
printf (Digite una Cadena:);
scanf( %s, st1);
printf (len =%u\n, asm strlen(st1 ));
asm strcpy( st2 , st1 ); / copy meaningful data in string /
printf ( %s\n, st2 );
return 0;
}
memex.c
Captulo 6
Punto otante
6.1. Representacion de punto otante
6.1.1. N umeros binarios no enteros
Cuando se discutieron los sistemas numericos en el primer captulo, solo
se trataron los valores enteros. Obviamente, debe ser posible representar
n umeros no enteros en otras bases como en decimal. En decimal, los dgitos
a la derecha del punto decimal tienen asociados potencias de 10 negativas.
0,123 = 1 10
1
+ 2 10
2
+ 3 10
3
No es sorprendente que los n umeros binarios trabajen parecido.
0,101
2
= 1 2
1
+ 0 2
2
+ 1 2
3
= 0,625
Esta idea se puede combinar con los metodos para enteros del captulo 1
para convertir un n umero.
110,011
2
= 4 + 2 + 0,25 + 0,125 = 6,375
Convertir de decimal a binario no es muy difcil. En general divida el
n umero decimal en dos partes: entero y fraccion. Convierta la parte entera
usando a binario usando los metodos del captulo 1. La parte fraccionaria
se convierte usando el metodo descrito abajo:
Considere una fraccion binaria con los bits etiquetados como a, b, c, . . .
entonces el n umero se ve como:
0, abcdef . . .
Multiplique el n umero por dos. La representacion binaria del nuevo n umero
sera:
a, bcdef . . .
119
120 CAP
ITULO 6. PUNTO FLOTANTE

0,5625 2 = 1,125
0,125 2 = 0,25
0,25 2 = 0,5
0,5 2 = 1,0
rst bit = 1
second bit = 0
third bit = 0
fourth bit = 1
Figura 6.1: Convertir 0.5625 a binario
0,85 2 = 1,7
0,7 2 = 1,4
0,4 2 = 0,8
0,8 2 = 1,6
0,6 2 = 1,2
0,2 2 = 0,4
0,4 2 = 0,8
0,8 2 = 1,6
Figura 6.2: Convertir 0.85 a binario
Observe que el primer bit esta ahora en el lugar del uno. Reemplace a con
0 y obtiene:
0, bcdef . . .
y multiplique por dos otra vez para obtener:
b, cdef . . .
Ahora el segundo bit (b) esta en la posicion del uno. Este procedimiento se
puede repetir hasta los bits que se deseen encontrar. La Figura 6.1 muestra
un ejemplo real que convierte 0.5625 a binario. El metodo para cuando la
parte fraccionaria es cero.
Como otro ejemplo, considere convertir 23.85 a binario. Es facil conver-
tir la parte entera (23 = 10111
2
), pero Que pasa con la parte fraccionaria
(0,85)? La Figura 6.2 muestra el comienzo de este calculo. Si uno mira cuida-
dosamente los n umeros, se encuentra con un bucle innito. Esto signica que
6.1. REPRESENTACI
ON DE PUNTO FLOTANTE 121

0.85 en un binario periodico (opuesto a los decimales periodicos en base 10).
1
Hay un patron de los n umeros calculados. Mirando en el patron, uno puede
ver que 0,85 = 0,110110
2
. As 23,85 = 10111,110110
2
.
Una consecuencia importante del calculo anterior es que 23.85 no se
puede representar exactamente en binario usando un n umero nito de bits
(tal como
1
3
no se puede representar en decimal con un n umero nito de
dgitos). Como muestra este captulo, las variables float y double en C son
almacenados en binario. As, valores como 23.85 no se pueden almacenar
exactamente en estas variables. Solo se puede almacenar una aproximacion
a 23.85
Para simplicar el hardware, los n umeros de puntos otante se alma-
cenan con un formato consistente. Este formato usa la notacion cientca
(pero en binario, usando potencias de dos, no de diez). Por ejemplo 23.85 o
10111,11011001100110 . . .
2
se almacenara como:
1,011111011001100110 . . . 2
100
(Donde el exponente (100) esta en binario). Un n umero de punto otante
normalizado tiene la forma:
1, ssssssssssssssss 2
eeeeeee
Donde 1, sssssssssssss es la mantisa y eeeeeeee es el exponente.
6.1.2. Representacion IEEE de punto otante
El IEEE (Institute of Electerical and Electronic Engineer) es una or-
ganizacion internacional que ha dise nado formato binarios especcos para
almacenar n umeros de punto otante. Este formato se usa en la mayora
(pero no todos) los computadores hechos hoy da. A menudo es soportado
por el hardware de computador en s mismo. Por ejemplo el coprocesador
numerico (o matematico) de Intel (que esta empotrado en todas las CPU
desde el Pentium) lo usa. El IEEE dene dos formatos con precision difer-
entes: precision simple y doble, la precision simple es usada por las variables
float en C y la precision doble es usada por la variable double.
El coprocesador matematico de Intel utiliza un tercer nivel de mayor
precision llamado precision extendida. De hecho, todos los datos en el co-
procesador en s mismo estan en esta precision. Cuando se almacenan en
memoria desde el coprocesador se convierte a precision simple o doble au-
tomaticamente.
2
La precision extendida usa un formato general ligeramente
1
No debera sorprenderse de que un n umero pudiera repetirse en una base, pero no en
otra. Piense en
1
3
, es periodico en decimal, pero en ternario (base3) sera 0,134.
2
Algunos compiladores (como Borland) los tipos long double usa esta precision exten-
dida. Sin embargo, otros compiladores usan la precision doble para double y long double.
(Esto es permitido por ANSI C).
122 CAP

31 30 23 22 0
s e f
s bit de signo - 0 = positivo, 1 = negativo
e exponente polarizado (8-bits) = verdadero exponente + 7F (127 dec-
imal). Los valores 00 y FF tienen signicado especial (vea el texto).
f fraccion - los 23 primeros bits despues de 1. en la mantisa.
Figura 6.3: Precision simple de la IEEE
diferente que los formatos oat y double de la IEEE y no seran discutidos
aca.
Presicion simple IEEE
El punto otante de precision simple usa 32 bits para codicar el n umero.
Normalmente son exactos los primeros 7 dgitos decimales. Los n umeros de
punto otante son almacenados en una forma mucho mas complicada que los
enteros. La Figura 6.3 muestra la forma basica del formato de precision sim-
ple del IEEE. Hay varias peculiaridades del formato. Los n umeros de punto
otante no usan la representacion en complemento a 2 para los n umeros neg-
ativos. Ellos usan la representacion de magnitud y signo. El bit 31 determina
el signo del n umero como se muestra.
El exponente binario no se almacena directamente. En su lugar, se al-
macena la suma del exponente y 7F en los bits 23 al 30. Este exponente
polarizado siempre es no negativo.
La parte fraccionaria se asume que es normalizada (en la forma 1.sssssssss).
Ya que el primer bit es siempre uno, este uno no se almacena. Esto permite
el almacenamiento de un bit adicional al nal y as se incrementa un poco
la precision. Esta idea se conoce como la representacion oculta del uno.
Como se podra almacenar 23.85? Primero es positivo, as el bit de signo Uno debera tener en cuen-
ta que los bytes 41 BE CC
CD se pueden interpretar
de diferentes maneras de-
pendiendo que hace un pro-
grama con ellos. Como el
n umero de punto otante
de precision simple, ellos
representan, pero como un
entero, ellos representan.
La CPU no conoce cual es
la interpretacion correcta.
es 0, ahora el exponente verdadero es 4, as que el exponente es 7F + 4 =
83
16
. Finalmente la fraccion es (recuerde el uno de adelante esta oculto).
Colocando todo esto unido (para ayudar a aclarar las diferentes secciones del
formato del punto otante, el bit de signo y la fraccion han sido subrayados
y los bits se han agrupado en nibles):
0 100 0001 1 011 1110 1100 1100 1100 1100
2
= 41BECCCC
16
Esto no es exactamente 23.85 (ya que es un binario periodico). Si uno con-
vierte el n umero anterior a decimal, uno encuentra que es aproximadamente.
Este n umero es muy cercano a 23.85, pero no es exacto. Actualmente, en C,
23.85 no se puede representar exactamente como arriba. Ya que el bit del
6.1. REPRESENTACI
ON DE PUNTO FLOTANTE 123

e = 0 and f = 0 denota el n umero cero (que no puede ser nor-
malizado ) Observe que hay un +0 y -0.
e = 0 and f = 0 denotes un n umero sin normalizar. Estos se dis-
cuten en la proxima seccion.
e = FF and f = 0 denota innito (). Hay innitos positivo y
negativo.
e = FF and f = 0 denota un resultado indenido, Conocido como
NaN (Not a Number).
Cuadro 6.1: Valores especiales de f y e
extremo izquierdo mas signicativo que fue truncado de la representacion
exacta es 1. El ultimo bit se redondea a 1. As 23.85 podra ser representado
como 41 BE CC CD en hexadecimal usando precision simple. Convirtiendo
esto a decimal el resultado y que es una aproximacion ligeramente mejor de
23.85.
Como se podra representar -23.85? solo cambie el bit de signo: C1BECCCD
no tome el complemento a 2!
Ciertas combinaciones de e y f tienen signicado especial para los oat
IEEE. La Tabla 6.1 describe estos valores especiales. Un innito se produce
por un desborde o por una division por cero. Un resultado indenido se pro-
duce por una operacion no valida como tratar de encontrar la raz cuadrada
de un n umero negativo, sumar dos innitos, etc.
Los n umeros de precision simple estan en el rango de 1,0 2
126
(
1,1755 10
35
) to 1,11111 . . . 2
127
( 3,4028 10
35
).
N umeros sin normalizar
Los n umeros sin normalizar se pueden usar para representar n umeros
con magnitudes mas peque nas que los normalizados (menores a 1,02
126
).
Por ejemplo, considere el n umero 1,001
2
2
129
( 1,6530 10
39
). En la
forma normalizada dada, el exponente es muy peque no. Sin embargo, se
puede representar de una forma no normalizada como: 0,01001
2
2
127
.
Para almacenar este n umero, el exponente es jado a 0 (ver la tabla 6.1)
y la funcion de la mantisa completa del n umero escrito como un producto
con 2
127
(todos los bits son almacenados incluyendo el 1 a la izquierda del
punto decimal). La representacion de 1,001 2
129
es entonces:
0 000 0000 0 001 0010 0000 0000 0000 0000
124 CAP

63 62 52 51 0
s e f
Figura 6.4: Precision doble del IEEE
doble precision IEEE
La doble precision IEEE usa 64 bits para representar n umeros y nor-
malmente son exactos los 15 primeros dgitos decimales signicativos. Como
muestra la Figura 6.4, el formato basico es muy similar a la precision sim-
ple. Se usan mas bits para el exponente (ll) y la fraccion (52) que para la
precision simple.
El gran rango para el exponente tiene dos consecuencias. La primera es
que se calcula como la suma del exponente real y 3FF (1023) (no 7F como
para la precision simple). Segundo, se permite un gran rango de exponentes
verdaderos (y as usa un gran rango de magnitudes). Las magnitudes de
precision doble van de 10
308
hasta 10
308
aproximadamente.
En el campo de la fraccion el responsable del incremento en el n umero
de dgitos signicativos para los valores dobles.
Como un ejemplo, considere nuevamente 23.85 otra vez. El exponente
polarizado sera 4 + 3FF = 403 en hexadecimal. As la representacion doble
sera:
0 100 0000 0011 0111 1101 1001 1001 1001 1001 1001 1001 1001 1001 1001 1001 1010
O 40 37 D9 99 99 99 99 9A en hexadecimal. Si uno convierte esto a
decimal uno encuentra 23.8500000000000014 (hay 12 ceros!) que es una
aproximacion mucho mejor de 23.85.
La precision doble tiene los mismos valores especiales que la precision
simple.
3
Los n umeros no normalizados son muy similares tambien. La prin-
cipal diferencia es que los n umeros dobles sin normalizados usan 2
1023
en
lugar de 2
127
.
6.2. Aritmetica de punto otante
La aritmetica de punto otante en un computador diferente que en la
matematica continua. En la matematicas, todos los n umeros pueden ser con-
siderados exactos. Como se muestra en la seccion anterior, en un computador
muchos n umeros no se pueden representar exactamente con un n umero ni-
to de bits. Todos los calculos se realizan con una precision limitada. En los
3
La unica diferencia es que para los valores de innito e indenido, el exponente po-
larizado es 7FF y no FF.
6.2. ARITM
ETICA DE PUNTO FLOTANTE 125

ejemplos de esta seccion, se usaran n umeros con una mantisa de 8 bits por
simplicidad.
6.2.1. suma
Para sumar dos n umeros de punto otante, los exponentes deben ser
iguales. Si ellos, no son iguales, entonces ellos se deben hacer iguales, de-
splazando la mantisa del n umero con el exponente mas peque no. Por ejem-
plo, considere 10,375 + 6,34375 = 16,71875 o en binario:
1,0100110 2
3
+ 1,1001011 2
2
Estos dos n umeros no tienen el mismo exponente as que se desplaza la
mantisa para hacer iguales los exponentes y entonces sumar:
1,0100110 2
3
+ 0,1100110 2
3
10,0001100 2
3
Observe que el desplazamiento de 1,1001011 2
2
pierde el uno delantero y
luego de redondear el resultado se convierte en 0,1100110 2
3
. El resultado
de la suma, 10,00011002
3
(o 1,000011002
4
) es igual a 10000,110
2
o 16.75.
Esto no es igual a la respuesta exacta (16.71875) Es solo una aproximacion
debido al error del redondeo del proceso de la suma.
Es importante tener en cuenta que la aritmetica de punto otante en un
computador (o calculadora) es siempre una aproximacion. Las leyes de las
matematicas no siempre funcionan con n umeros de punto otante en un com-
putador. Las matematicas asumen una precision innita que un computador
no puede alcanzar. Por ejemplo, las matematicas ense nan que (a+b)b = a;
sin embargo, esto puede ser exactamente cierto en un computador.
6.2.2. Resta
La resta trabaja muy similar y tiene los mismos problemas que la suma.
Como un ejemplo considere 16,75 15,9375 = 0,8125:
Subtraction works very similarly and has the same problems as addition.
As an example, consider 16,75 15,9375 = 0,8125:
1,0000110 2
4
1,1111111 2
3
Desplazando 1,1111111 2
3
da (redondeando arriba) 1,0000000 2
4
1,0000110 2
4
1,0000000 2
4
0,0000110 2
4
126 CAP

0,0000110 2
4
= 0,11
2
= 0,75 que no es exacto.
6.2.3. Multiplicacion y division
Para la multiplicacion, las mantisas son multiplicadas y los exponentes
son sumados. Considere 10,375 2,5 = 25,9375:
1,0100110 2
3
1,0100000 2
1
10100110
+ 10100110
1,10011111000000 2
4
Claro esta, el resultado real podra ser redondeado a 8 bits para dar:
1,1010000 2
4
= 11010,000
2
= 26
La division es mas complicada, pero tiene problemas similares con errores
de redondeo.
6.2.4. Ramicaciones para programar
El principal punto de esta seccion es que los calculos de punto otante
no son exactos. El programador necesita tener cuidado con esto. Un error
com un que el programador hace con n umeros de punto otante es compara-
rlos asumiendo que el calculo es exacto. Por ejemplo considere una funcion
llamada f (x) que hace un calculo complejo y un programa esta tratando de
encontrar las races de la funcion.
4
. Uno podra intentar usar la siguiente
instruccion para mirar si x es una raz:
if ( f (x) == 0.0 )
Pero si f (x) retorna 1 10
30
? Esto probablemente signica que x es una
muy buena aproximacion a una raz verdadera; sin embargo, la igualdad
sera falsa. Puede no haber ning un valor de punto otante IEEE de x que
retorne cero exactamente, debido a los errores de redondeo en f (x).
Un metodo mucho mejor sera usar:
if ( fabs(f (x)) < EPS )
Donde EPS es un macro denido a ser un valor positivo muy peque no (co-
mo 1 10
10
). Esto es cierto si f (x) esta muy cercano a cero. En general,
comparar un valor de punto otante (digamos x) con otro (y) use:
if ( fabs(x y)/fabs(y) < EPS )
4
Una raz de una funcion es un valor x tal que f(x) = 0
6.3. EL COPROCESADOR NUM
ERICO 127
6.3. El coprocesador numerico
6.3.1. Hardware
Los primeros procesadores Intel no tenan soporte de hardware para las
operaciones de punto otante. Esto no signica que ellos no podan efectu-
ar operaciones de punto otante. Esto solo signica que ellas se realizaban
por procedimientos compuestos de muchas instrucciones que no son de punto
otante. Para estos primeros sistemas, Intel suministraba un circuito integra-
do adicional llamado coprocesador matematico. Un coprocesador matematico
tiene instrucciones de maquina que realizan instrucciones de punto otante
mucho mas rapido que usando procedimientos de software (en los primeros
procesadores se realizaban al menos 10 veces mas rapido). El coprocesador
para el 8086/8088 fue llamado 8087. Para el 80286 era el 80287 y para el
80386 un 80387. El procesador 80486DX integro el coprocesador matematico
en el 80486 en s mismo
5
. Desde el Pentium, todas las generaciones del 80X86
tienen un coprocesador matematico empotrado; sin embargo el todava se
programa como si fuera una unidad separada. A un los primeros sistemas
sin un coprocesador pueden instalar un software que emula el coprocesador
matematico. Estos emuladores se activan automaticamente cuando un pro-
grama ejecuta una instruccion del coprocesador y corre un procedimiento
que produce los mismos resultados que el coprocesador (mucho mas lento
claro esta).
El coprocesador numerico tiene ocho registros de punto otante. Cada
registro almacena 80 bits. Los n umeros de punto otante se almacenan en
estos registros siempre como n umeros de 80 bits de precision extendida.
Los registros se llaman STO, ST1, . . . ST7. Los registros de punto otante se
usan diferentes que los registros enteros en la CPU. Los registros de punto
otante estan organizados como una pila. Recuerde que una pila es una lista
LIFO (Last In Firist Out). STO siempre se reere al valoren el tope de la
pila. Todos los n umeros nuevos se a naden al tope de la pila. Los n umeros
existentes se empujan en la pila para dejarle espacio al nuevo n umero.
Hay tambien un registro de estado en el coprocesador numerico. Tiene
varias banderas. Solo las 4 banderas usadas en comparaciones seran estudi-
adas. C
0
, C
1
, C
2
and C
3
. El uso de ellas se discutira luego.
6.3.2. Instrucciones
Para distinguir facilmente las instrucciones normales de la CPU de las
del coprocesador, todos los nemonicos del coprocesador comienzan por F.
5
Sin embargo el 80486SX no tiene el un coprocesador integrado
128 CAP

Carga y almacenamiento
Hay varias instrucciones que cargan datos en el tope de la pila de registro
del coprocesador:
FLD source Carga un n umero de punto otante de la memoria en el tope
de la pila. La source puede ser un n umero de precision simple
doble o extendida o un registro del coprocesador
FILD source Lee un entero de memoria, lo convierte a punto otante y
almacena el resultado en el tope de la pila. source puede ser
una palabra, palabra doble o una palabra cuadruple.
FLD1 almacena un uno en el tope de la pila.
FLDZ almacena un cero en el tope de la pila.
Hay tambien varias instrucciones que almacenan datos de la pila en
memoria. Algunas de estas instrucciones tambien sacan el n umero de la pila.
FST dest Almacena el tope de la pila (ST0) en memoria. El destino
puede ser un n umero de precision simple o doble o un registro
de coprocesador.
FSTP dest Almacena el tope de la pila en la memoria tal como FST; sin
embargo luego de que se almacena el n umero, su valor se saca
de la pila. El destino puede ser un n umero de precision simple
o doble o un registro del coprocesador.
FIST dest Almacena el valor del tope de la pila convertido a entero en
memoria. El destino puede ser una palabra o palabra doble.
La pila no sufre ning un cambio. Como se convierte el n umero
de punto otante a entero depende de algunos bits de la pal-
abra de control del coprocesador. Este es un registro especial
(no de punto otante) que controla como trabaja el coproce-
sador. Por defecto, la palabra de control se inicia tal que
redondea al entero mas cercano cuando se convierte a entero.
Sin embargo las instrucciones FSTCW (Store Control Word) y
FDLCW (load control word) se pueden usar para cambiar este
comportamiento.
FISTP dest Lo mismo que FIST, excepto por dos cosas. El tope de la pila
se saca y el destino tambien puede ser una palabra cuadruple.
Hay otras dos instrucciones que pueden mover o quitar datos de la pila
en s misma.
FXCH STn intercambia los valores en ST0 y STn en la pila (donde n es
el n umero del registro de 1 a 7).
FFREE STn libera un registro en la pila, marcando el registro como no
usado o vaco.
ERICO 129
1 segment .bss
2 array resq SIZE
3 sum resq 1
4
5 segment .text
6 mov ecx, SIZE
7 mov esi, array
8 fldz ; ST0 = 0
9 lp:
10 fadd qword [esi] ; ST0 += *(esi)
11 add esi, 8 ; se mueve al proximo dobule
12 loop lp
13 fstp qword sum ; alamcena el resultado en sum
Figura 6.5: Ejemplo sumar arreglo
Suma y resta
Cada una de las instrucciones de suma calcula la suma de ST0 y otro
operando, el resultado siempre se almacena en un registro del coprocesador.
FADD src ST0 += src . src puede ser cualquier registro del co-
procesador o un n umero de precision simple o doble
en memoria.
FADD dest, ST0 dest += ST0. El destino puede ser cualquier registro
del coprocesador
FADDP dest o
FADDP dest, ST0
dest += ST0 entonces se saca de la pila. El destino
puede ser cualquier registro del coprocesador.
FIADD src ST0 += (float) src . suma un entero con ST0. src
debe ser una palabra o una palabra doble en memoria.
Hay el doble de instrucciones de resta que de suma porque el orden de
los operandos es importante. (a + b = b + a, pero a b = b a!). Por cada
instruccion, hay una alterna que resta en el orden inverso. Esas instrucciones
al reves todas culminan con R o RP. La Figura muestra un peque no codigo
que suma los elementos de un arreglo de dobles. En las lneas 10 y 13,
uno debe especicar el tama no del operando de memoria. De otra forma el
ensamblador no conocera si el operando de memoria era un oat (dword) o
double (qword).
130 CAP

FSUB src ST0 -= src . src puede ser cualquier registro del co-
procesador o un n umero de presicion doble o simple
en memoria.
FSUBR src ST0 = src - ST0. src puede ser cualquier registro
del coprocesador o un n umero de presicion doble o
simple en memoria.
FSUB dest, ST0 dest -= ST0. dest puede ser cualquier registro del
coprocesador.
FSUBR dest, ST0 dest = ST0 - dest . dest puede ser cualquier reg-
istro del coprocesador.
FSUBP dest o
FSUBP dest, STO
dest -= ST0 entonces sale de la pila. dest puede ser
cualquier registro del coprocesador.
FSUBRP dest o
FSUBRP dest, STO
dest = ST0 - dest entonces sale de la pila. dest
FISUB src ST0 -= (float) src . Resta un entero de ST0. src
debe ser una palabra o palabra doble en memoria.
FISUBR src ST0 = (float) src - ST0. Resta ST0 de un entero.
src debe ser una palabra o palabra doble en memoria.
Multiplicacion y division
La instruccion de multiplicacion son totalmente analogas a las instruc-
ciones de suma.
FMUL src ST0 *= src . src puede ser cualquier registro del co-
en memoria.
FMUL dest, ST0 dest *= ST0. dest puede ser cualquier registro del
coprocesador.
FMULP dest o
FMULP dest, STO
dest *= ST0 entonces sale de la pila. dest puede ser
FIMUL src ST0 *= (float) src . Multiplica un entero con ST0.
src debe ser una palabra o palabra doble en memoria.
No es sorprendente que las instrucciones de division son analogas a las
instrucciones de resta. La division por cero de un innito.
ERICO 131
FDIV src ST0 /= src . src puede ser cualquier registro del co-
en memoria.
FDIVR src ST0 = src / ST0. src puede ser cualquier registro
del coprocesador o una n umero de precision simple o
doble en memoria.
FDIV dest, ST0 dest /= ST0. dest puede ser cualquier registro del
coprocesador.
FDIVR dest, ST0 dest = ST0 / dest . dest puede ser cualquier reg-
istro del coprocesador.
FDIVP dest o
FDIVP dest, STO
dest /= ST0 entonces sale de la pila. dest puede ser
FDIVRP dest o
FDIVRP dest, STO
dest = ST0 / dest entonces sale de la pila. dest
FIDIV src ST0 /= (float) src . Divide ST0 por un entero. src
debe ser una palabra o palabra doble en memoria.
FIDIVR src ST0 = (float) src / ST0. Divide un entero por
ST0. src debe ser una palabra o palabra doble en
memoria.
Comparaciones
El coprocesador tambien realiza comparaciones de n umeros de punto
otante. La formula de instrucciones FCOM hacen esta operacion.
FCOM src compara ST0 y src . src puede ser un registro del coproce-
sador o un oat o double en memoria.
puede ser un FCOMP src compara ST0 y src , luego sale de la pila. src puede ser un
registro del coprocesador o un oat o double en memoria.
FCOMPP compara ST0 y ST1, entonces saca de la pila dos veces.
FICOM src compara ST0 y (float) src . src puede ser una palabra o
palabra dobel en memoria.
FICOMP src compara ST0 y (float)src , entonces saca de la pila. src
puede ser una palabra o palabra doble entera en memoria.
FTST compara ST0 and 0.
Estas instrucciones cambian los bits C
0
, C
1
, C
2
y C
3
del registro de
estado del coprocesador. Desafortunadamente no es posible que la CPU ac-
ceda a estos bits directamente. Las instrucciones de salto condicional usan
el registro FLAGS, no el registro de estado del coprocesador. Sin embargo
es relativamente facil transferir los bits de la palabra de estado a los bits
correspondientes del registro FLGS usando algunas instrucciones nuevas.
132 CAP

1 ; if ( x > y )
2 ;
3 fld qword [x] ; ST0 = x
4 fcomp qword [y] ; compara STO and y
5 fstsw ax ; mueve los bits C a FLAGS
6 sahf
7 jna else_part ; si x no es mayor que y,
8 ; vaya a else_part
9 then_part:
10 ; codigo para parte de entonces
11 jmp end_if
12 else_part:
13 ; codigo para parte si no
14 end_if:
Figura 6.6: Ejemplo de comparacion
FSTSW dest Almacena la palabra de estado del coprocesador in memoria
o en el registro AX.
SAHF Almacena el registro AH en el registro FLAGS.
LAHF Carga el registro AH con los bits del registro FLAGS.
La Figura 6.6 muestra un ejemplo cortico. Las lneas 5 y 6 transeren
los bits C
0
, C
1
, C
2
y C
3
de la palabra de estado del coprocesador al registro
FLAGS. Los bits son transferidos tal que ellos son analogos al resultado de
una comparacion de dos enteros sin signo. Este es el porque la lnea 7 usa
la instruccion JNA.
El Pentium Pro (y procesadores posteriores II y III) soportan 2 nuevos
operadores de comparacion que directamente modican el registro FLAGS
de la CPU.
FCOMI src compara ST0 y src . src debe ser un registro del coprocesador.
FCOMIP src compara ST0 y src , entonces se saca de la pila. src debse ser
un registro del coprocesador.
La Figura 6.7 muestra una subrutina de ejemplo que encuentran el maximo
de dos n umeros tipo double usando la instruccion FCOMIP. No confundan es-
ta instruccion con la funcion de comparacion de enteros (FICOMP y FICOM).
Instrucciones miscelaneas
Esta seccion cubre otras instrucciones que suministra el procesador:
ERICO 133
FCHS ST0 = - ST0 cambia el bit de signo de ST0
FABS ST0 = |ST0| Toma el valor absoluto de ST0
FSQRT ST0 =
STO Toma la raz cuadrada de ST0

FSCALE ST0 = ST0 2
ST1
multiplica ST0 por una potencia de dos
rapidamente. ST1 no se quita de la pila del coprocesador . La
Figure 6.8 muestra un ejemplo de como usar esta instruccion.
6.3.3. Ejemplos
6.3.4. Formula cuadratica
El primer ejemplo muestra como se puede programar la formula cuadratica
en ensamblador. Recuerde que la formula cuadratica calcula la solucion de
una ecuacion cuadraticai:
ax
2
+ bx + c = 0
La formula en s misma da dos soluciones para x: x
1
y x
2
.
x
1
, x
2
=
b
b
2
4ac
2a
La expresion dentro de la raz cuadrada (b
2
4ac) es llamada discriminante,
su valor es util para determinar las 3 posibilidades para la solucion:
1. Hay solo un real en la solucion degenerad. b
2
4ac = 0
2. Hay dos soluciones reale. b
2
4ac > 0
3. Hay dos soluciones complejas. b
2
4ac < 0
Este es un peque no programa en C que usa la subrutina en ensamblador.
quadt.c
#include <stdio.h>
int quadratic ( double, double, double, double , double );
int main()
{
double a,b,c , root1 , root2;
printf (Enter a, b, c : );
scanf( %lf %lf %lf , &a, &b, &c);
if ( quadratic ( a, b, c, &root1, &root2) )
134 CAP

printf (roots : %.10g %.10g\n, root1 , root2);
else
printf (No real roots\n);
return 0;
}
quadt.c
A continuacion esta la rutina en ensamblador.
quad.asm
1 ; funcion quadratic
2 ; Halla la solucion de la ecuacion cuadratica:
3 ; a*x^2 + b*x + c = 0
4 ; Prototipo de C:
5 ; int quadratic( double a, double b, double c,
6 ; double * root1, double *root2 )
7 ; Parametros:
8 ; a, b, c - Coeficientes de la ecuacion cuadratica (ver arriba)
9 ; root1 - Apuntador al double que almacena la primera raz
10 ; root2 - Apuntador al double que almacena la segunda raz
12 ; devuelve 1 si las races son reales si no 0
13
14 %define a qword [ebp+8]
15 %define b qword [ebp+16]
16 %define c qword [ebp+24]
17 %define root1 dword [ebp+32]
18 %define root2 dword [ebp+36]
19 %define disc qword [ebp-8]
20 %define one_over_2a qword [ebp-16]
21
22 segment .data
23 MinusFour dw -4
24
25 segment .text
26 global _quadratic
27 _quadratic:
28 push ebp
29 mov ebp, esp
30 sub esp, 16 ; asigna 2 doubles (disc & one_over_2a)
31 push ebx ; debe guardar el valor original de ebx
32
ERICO 135
33 fild word [MinusFour]; pila -4
34 fld a ; pila: a, -4
35 fld c ; pila: c, a, -4
36 fmulp st1 ; pila: a*c, -4
37 fmulp st1 ; pila: -4*a*c
38 fld b
39 fld b ; pila: b, b, -4*a*c
40 fmulp st1 ; pila: b*b, -4*a*c
41 faddp st1 ; pila: b*b - 4*a*c
42 ftst ; prueba con 0
43 fstsw ax
44 sahf
45 jb no_real_solutions ; if disc < 0, no hay soluciones reales
46 fsqrt ; pila: sqrt(b*b - 4*a*c)
47 fstp disc ; almacena y saca de la pila
48 fld1 ; pila: 1.0
49 fld a ; pila: a, 1.0
50 fscale ; pila: a * 2^(1.0) = 2*a, 1
51 fdivp st1 ; pila: 1/(2*a)
52 fst one_over_2a ; pila: 1/(2*a)
53 fld b ; pila: b, 1/(2*a)
54 fld disc ; pila: disc, b, 1/(2*a)
55 fsubrp st1 ; pila: disc - b, 1/(2*a)
56 fmulp st1 ; pila: (-b + disc)/(2*a)
57 mov ebx, root1
58 fstp qword [ebx] ; almacena en *root1
59 fld b ; pila: b
60 fld disc ; pila: disc, b
61 fchs ; pila: -disc, b
62 fsubrp st1 ; pila: -disc - b
63 fmul one_over_2a ; pila: (-b - disc)/(2*a)
64 mov ebx, root2
65 fstp qword [ebx] ; almacena en *root2
66 mov eax, 1 ; valor de retorno es 1
67 jmp short quit
68
69 no_real_solutions:
70 mov eax, 0 ; valor de retorno es 0
71
72 quit:
73 pop ebx
74 mov esp, ebp
136 CAP

75 pop ebp
76 ret
quad.asm
6.3.5. Leer arreglos de archivos
Este ejemplo, es una rutina en ensamblador que lee doubles de un archivo.
Sigue un peque no programa de prueba en C.
readt.c
/
Este programa prueba el procedimiento en ensamblador bit read doubles () .
Lee doubles de stdin . ( use la o redireccion para leer desde un archivo .)
/
#include <stdio.h>
extern int read doubles ( FILE , double , int );
#dene MAX 100
int main()
{
int i , n;
double a[MAX];
n = read doubles( stdin , a, MAX);
for ( i =0; i < n; i ++ )
printf ( %3d %g\n, i, a[i ]);
return 0;
}
readt.c
A continuacion la rutina en ensamblador
read.asm
1 segment .data
2 format db "%lf", 0 ; format for fscanf()
3
4 segment .text
5 global _read_doubles
6 extern _fscanf
7
8 %define SIZEOF_DOUBLE 8
ERICO 137
9 %define FP dword [ebp + 8]
10 %define ARRAYP dword [ebp + 12]
11 %define ARRAY_SIZE dword [ebp + 16]
12 %define TEMP_DOUBLE [ebp - 8]
13
14 ;
15 ; funcion _read_doubles
16 ; prototipo de C:
17 ; int read_doubles( FILE * fp, double * arrayp, int array_size );
18 ; Esta funcion lee dobles de un archivo de texto hasta EOF o hasta
19 ; que se llene el arreglo
20 ; Parametros:
21 ; fp - apuntador FILE pointer a leer desde (se debe abrir para entrada)
22 ; arrayp - apuntador a un arreglo de doubles para leer en el
23 ; array_size - numero de elementos en el arreglo
25 ; numero de doubles almacenado en el arreglo (en EAX)
26
27 _read_doubles:
28 push ebp
29 mov ebp,esp
30 sub esp, SIZEOF_DOUBLE ; define un double en la pila
31
32 push esi ; guarda esi
33 mov esi, ARRAYP ; esi = ARRAYP
34 xor edx, edx ; edx = ndice del arreglo (inicialmente en 0)
35
36 while_loop:
37 cmp edx, ARRAY_SIZE ; si edx < ARRAY_SIZE?
38 jnl short quit ; si no, salir del bucle
39 ;
40 ; llama a fscanf() para leer un double en TEMP_DOUBLE
41 ; fscanf() podra cambiar edx y as guardarlo
42 ;
43 push edx ; guarda edx
44 lea eax, TEMP_DOUBLE
45 push eax ; push &TEMP_DOUBLE
46 push dword format ; push &format
47 push FP ; push el apuntador al archivo
48 call _fscanf
49 add esp, 12
50 pop edx ; restaura edx
138 CAP

51 cmp eax, 1 ; fscanf retorno 1?
52 jne short quit ; si no, salir del bucle
53
54 ;
55 ; copia TEMP_DOUBLE en ARRAYP[edx]
56 ; (Los ocho bytes del dobule son copiados por las dos copias de 4 bytes)
57 ;
58 mov eax, [ebp - 8]
59 mov [esi + 8*edx], eax ; primero copia los 4 bytes inferiores
60 mov eax, [ebp - 4]
61 mov [esi + 8*edx + 4], eax ; ahora copia los 4 bytes superiores
62
63 inc edx
64 jmp while_loop
65
66 quit:
67 pop esi ; restaura esi
68
69 mov eax, edx ; almacena el valor de retorno en eax
70
71 mov esp, ebp
72 pop ebp
73 ret
read.asm
6.3.6. Hallar primos
Este ultimo ejemplo halla n umeros primos una vez mas. Esta imple-
mentacion es mas eciente que la anterior. Almacena los primos que ha
encontrado en un arreglo y solo divide por los primos que ha encontrado
antes, en lugar de cada n umero impar, para encontrar nuevos primos.
Otra diferencia es que calcula la raz cuadrada del n umero para buscar
el proximo primo a determinar en que punto parar la b usqueda de factores.
Altera la palabra de control de coprocesador tal que cuando almacena la
raz cuadrada como un entero, y la trunca en lugar de redondearla. Esto
es controlado por los bits 10 y 11 de la palabra de control. Estos bits se
llaman los bits RC (Raunding Control). Si ellos son ambos 0 (el defecto) el
coprocesador redondea cuando convierte a entero. Si ellos son ambos 1, el
coprocesador trunca las conversiones enteras. Observe que la rutina se cuida
de guardar la palabra de control original y restaurarla antes de retornar.
A continuacion el programa en C:
fprime.c
ERICO 139
#include <stdio.h>
#include <stdlib. h>
/
ofuncin nd primes
Halla los unmeros primos indicados
aParmetros:
a arreglo que almacena los primos
n acuntos primos encontrar
/
extern void nd primes ( int a, unsigned n );
int main()
{
int status ;
unsigned i;
unsigned max;
int a;
printf (aCuntos primos desea encontrar Ud.? );
scanf( %u, &max);
a = calloc ( sizeof (int ), max);
if ( a ) {
nd primes (a,max);
/ imprime los u 20 ltimos primos encontrados /
for( i = ( max > 20 ) ? max 20 : 0; i < max; i++ )
printf ( %3d %d\n, i+1, a[i]);
free (a);
status = 0;
}
else {
fprintf ( stderr , No se puede crera el arreglo de %u ints\n, max);
status = 1;
}
return status ;
}
140 CAP

fprime.c
A continuacion la rutina en ensamblador:
prime2.asm
1 segment .text
2 global _find_primes
3 ;
4 ; function find_primes
5 ; Encuentra el numero indicado de primos
6 ; Parametros:
7 ; array - arreglo que almacena los primos
8 ; n_find - cuantos primos encontrar
9 ; Prototipo de C
10 ;extern void find_primes( int * array, unsigned n_find )
11 ;
12 %define array ebp + 8
13 %define n_find ebp + 12
14 %define n ebp - 4 ; numero de primos a encontrar
15 %define isqrt ebp - 8 ; el piso de la raz cudrada de guess
16 %define orig_cntl_wd ebp - 10 ; palabra original de control
17 %define new_cntl_wd ebp - 12 ; nueva palabra de control
18
19 _find_primes:
20 enter 12,0 ; Hace espacio para las variables locales
21
22 push ebx ; guarda las posibles variables registro
23 push esi
24
25 fstcw word [orig_cntl_wd] ; toma la palabra de control actual
26 mov ax, [orig_cntl_wd]
27 or ax, 0C00h ; fija el redondeo de los bits a 11 (truncar)
28 mov [new_cntl_wd], ax
29 fldcw word [new_cntl_wd]
30
31 mov esi, [array] ; esi apunta a array
32 mov dword [esi], 2 ; array[0] = 2
33 mov dword [esi + 4], 3 ; array[1] = 3
34 mov ebx, 5 ; ebx = guess = 5
35 mov dword [n], 2 ; n = 2
36 ;
37 ; Este bucle externo encuentra un nuevo primo en cada iteracion,
38 ; que se a~nade al final del arreglo. A diferencia del primer programa de
ERICO 141
39 ; primos, esta funcion no determina los primos dividiendo por todos
40 ; los numeros impares. Solo divide por los numeros primos que ya se
41 ; han encontrado. (Esta es la razon por la cual ellos se han almacenado
42 ; en el arreglo)
43
44 while_limit:
45 mov eax, [n]
46 cmp eax, [n_find] ; while ( n < n_find )
47 jnb short quit_limit
48
49 mov ecx, 1 ; ecx se usa como ndice del arreglo
50 push ebx ; almacena guess en la pila
51 fild dword [esp] ; carga guess en la pila del coprocesador
52 pop ebx ; saca guess de la pila
53 fsqrt ; halla sqrt(guess)
54 fistp dword [isqrt] ; isqrt = floor(sqrt(quess))
55
56 ; Este b1ucle interno divide guess por los numeros primos ya encontrados
57 ; hasta que encuentre un factor primo de guess (que significa que guess
58 ; no es primo) o hasta que numero primo a dividir sea mas grande que
59 ; floor(sqrt(guess))
60 ;
61 while_factor:
62 mov eax, dword [esi + 4*ecx] ; eax = array[ecx]
63 cmp eax, [isqrt] ; while ( isqrt < array[ecx]
64 jnbe short quit_factor_prime
65 mov eax, ebx
66 xor edx, edx
67 div dword [esi + 4*ecx]
68 or edx, edx ; && guess % array[ecx] != 0 )
69 jz short quit_factor_not_prime
70 inc ecx ; intenta el proximo primo
71 jmp short while_factor
72
73 ;
74 ; found a new prime !
75 ;
76 quit_factor_prime:
77 mov eax, [n]
78 mov dword [esi + 4*eax], ebx ; suma al final de arreglo
79 inc eax
80 mov [n], eax ; inc n
142 CAP

81
82 quit_factor_not_prime:
83 add ebx, 2 ; intenta con el impar siguiente
84 jmp short while_limit
85
86 quit_limit:
87
88 fldcw word [orig_cntl_wd] ; restaura la palabra de control
89 pop esi ; restaura las variables de registro
90 pop ebx
91
92 leave
93 ret
prime2.asm
ERICO 143
1 global _dmax
2
3 segment .text
4 ; function _dmax
5 ; retorna el mayor de dos argumentos double
6 ; Prototipo de C
7 ; double dmax( double d1, double d2 )
8 ; Parametros:
9 ; d1 - primer double
10 ; d2 - segundo double
12 ; El mayor de d1 y d2 (en ST0)
13 %define d1 ebp+8
14 %define d2 ebp+16
15 _dmax:
16 enter 0, 0
17
18 fld qword [d2]
19 fld qword [d1] ; ST0 = d1, ST1 = d2
20 fcomip st1 ; ST0 = d2
21 jna short d2_bigger
22 fcomp st0 ; pop d2 de la pila
23 fld qword [d1] ; ST0 = d1
24 jmp short exit
25 d2_bigger: ; si d2 is max, no hace nada
26 exit:
27 leave
28 ret
Figura 6.7: Ejemplo de FCOMIP
144 CAP

1 segment .data
2 x dq 2.75 ; convertido a formato double
3 five dw 5
4
5 segment .text
6 fild dword [five] ; ST0 = 5
7 fld qword [x] ; ST0 = 2.75, ST1 = 5
8 fscale ; ST0 = 2.75 * 32, ST1 = 5
Figura 6.8: Ejemplo de FSCALE
Captulo 7
Estructuras y C++
7.1. Estructuras
7.1.1. Introduccion
Las estructuras se usan en C para agrupar datos relacionados en una
variable compuesta. Esta tecnica tiene varias ventajas:
1. Clarica el codigo mostrando que los datos denidos en la estructura
estan relacionados ntimamente.
2. Simplica el paso de datos a las funciones. En lugar de pasar muchas
variables separadas, ellas se pueden pasar como uno una variable.
3. Incrementar la localidad del codigo.
1
Desde el punto de vista del ensamblador una estructura se puede consid-
erar como un arreglo con elementos de diferente tama no. Los elementos de
los arreglos reales son siempre del mismo tipo y mismo tama no. Esta carac-
terstica es la que le permite a uno calcular la direccion de cualquier elemento
conociendo la direccion de inicio del arreglo, el tama no de los elementos y
el ndice del elemento que se desea.
A structures elements do not have to be the same size (and usually are
not). Because of this each element of a structure must be explicitly specied
and is given a tag (or name) instead of a numerical index.
En ensamblador los elementos de una estructura se accederan de una
manera parecida que los elementos de un arreglo. Para acceder a un elemento
uno debe conocer la direccion de inicio de la estructura y el desplazamiento
relativo desde el comienzo de la estructura, sin embargo, a diferencia de
1
vea la seccion de manejo de memoria virtual de cualquier libro de texto de sistemas
operativos para la discusion del termino.
145
146 CAP
ITULO 7. ESTRUCTURAS Y C++

Oset Element
0 x
2
y
6
z
Figura 7.1: Estructura S
los arreglos donde este desplazamiento se puede calcular por el ndice del
elemento de una estructura el compilador le asigna un desplazamiento.
Por ejemplo considere la siguiente estructura:
struct S {
short int x ; / entero de 2 bytes /
int y ; / entero de 4 bytes /
double z ; / oat de 8 bytes /
};
La Figura 7.1 muestra como una variable de tipo S podra verse en la
memoria del computador. La norma ANSI dicta que los elementos de una es-
tructura son colocados en memoria en el mismo orden que ellos son denidos
en la estructura. Tambien dicta que el primer elemento esta al comienzo
de la estructura (desplazamiento cero). Tambien dene otro macro util en
el archivo de cabecera stddef.h llamado offsetof(). Este macro calcula
y retorna el desplazamiento de cualquier elemento de una estructura. Este
macro toma dos parametros, el primero es el nombre de tipo de la estructura,
el segundo del nombre del elemento al cual encontrarle el desplazamiento.
As el resultado de offsetof(S,y) podra ser 2 seg un la Figura 7.1.
7.1.2. Alineamiento de la memoria
Si uno usa el macro offsetof para encontrar el desplazamiento de y
usando el compilador gcc uno encontrara que retorna 4 y no 2. Por que?
Porque gcc (y muchos otros compiladores) alinean por defecto las variables Recuerde que una direccion
esta en los lmites de una
palabra doble si es divisible
por cuatro.
a los lmites de palabras dobles. En el modo protegido de 32 bits, la CPU
lee la memoria mas rapido si el dato condensa en el lmite de una palabra
doble. La Figura 7.2 muestra como se ve realmente la estructura S usando
gcc. El compilador inserta dos bytes no usados en la estructura para alinear
y(y z) en un lmite de palabra doble. Esto muestra por que es buena idea
usar offsetof para calcular los desplazamientos en lugar de calcularlos uno
mismo. Cuando se usan estructuras denidas en C.
7.1. ESTRUCTURAS 147
Oset Element
0 x
2 unused
4
y
8
z
Figura 7.2: Estructura S
Claro esta, sin la estructura solo se usa en ensamblador el programador
puede determinar el desplazamiento el mismo. Sin embargo si uno esta in-
terfazando C y ensamblador muy importante que los dos codigos esten de
acuerdo en los desplazamientos de los elementos de la estructura. Una com-
plicacion es que diferentes compiladores de C tienen desplazamientos difer-
entes de los elementos. Por ejemplo, como se ha visto, el compilador gcc crea
una estructura S que se ve como la Figura 7.2; sin embargo, el compilador
de Borland podra crear una estructura como la de la Figura 7.1. Los compi-
ladores de C suministran maneras de especicar el alineamiento usado para
los datos. Sin embargo la norma ANSI C no especca como se hace esto y
as, cada compilador lo hara a su manera.
El compilador gcc tiene un metodo exible y complicado de especicar el
Alineamiento. El compilador le permite a uno especicar el alineamiento de
cualquier tipo usando una sintaxis especial. Por ejemplo, la siguiente lnea:
typedef short int unaligned int attribute (( aligned (1)));
Dene un nuevo tipo llamado unaligned int que se alinea en los lmites
de los bytes (s, el parentesis despues de attribute se necesitan). El
1 en el parametro de aligned se puede reemplazar con otras potencias de
dos para especicar otros alineamientos (2 para alineamiento de palabra, 4
para el alineamiento de palabras dobles). Si el elemento y de la estructura
fue cambiado para ser un tipo unaligned int, gcc podra colocar y en el
desplazamiento 2. Sin embargo z podra estar a una distancia de 8 ya que las
palabras dobles tienen un alineamiento de palabra por defecto. La denicion
del tipo de z tendra que ser cambiada para colocarlos una distancia de 6.
El compilador gcc tambien permite embalar una estructura. Esto le dice
al compilador que use el mnimo de espacio para la estructura. La Figura 7.3
muestra como se podra escribir S de esta manera. De esta forma S usara
el menor n umero de bytes posibles, 14.
Los compiladores de Borland y Microsoft, soportan el mismo metodo de
especicar el alineamiento usando la directiva #pragma.
148 CAP

struct S {
} attribute ((packed));
Figura 7.3: Estructura embalada usando gcc
#pragma pack(push) / guarda el estado de alineamiento /
#pragma pack(1) / establece el alieamiento de byte /
struct S {
};
#pragma pack(pop) / restaura el alineamiento original /
Figura 7.4: Estructura embalada usando Microsoft o Borland
#pragma pack(1)
La directiva anterior le dice al compilador que embale los elementos de es-
tructuras en los lmites de los bytes (sin relleno extra). El uno se puede reem-
plazar con dos, cuatro, ocho o diez y seis para especicar el alineamiento en
una palabra, palabra doble, palabra cuadruple y parrafo respectivamente.
Esta directiva tiene efecto hasta que se sobreescriba por otra directiva. Es-
to puede causar problemas ya que estas directivas se usan a menudo en
los archivos de encabezamiento. Si el archivo de encabezamiento se incluye
antes que otros archivos de encabezamiento con estructuras, esas estruc-
turas pueden estar diferente que las que tendran por defecto. Esto puede
conducir un error muy difcil de encontrar. Los modulos de un programa
podran desordenar los elementos de las estructuras de otros modulos.
Hay una manera de evitar este problema. Microsoft y Borland tienen
una manera de guardar el alineamiento y restaurarlo luego. La Figura 7.4
muestra como se hara esto.
7.1.3. Campos de bits
Los campos de bit le permiten a uno especicar miembros de una es-
tructura que usa un n umero especicado de bits. El tama no de los bits no
struct S {
unsigned f1 : 3; / campo de 3 bits /
};
Figura 7.5: Ejemplo campo de bits
tiene que ser m ultiplo de 8. Un campo de bits miembro esta denido co-
mo un unsigned int o un int con dos puntos y luego el tama no en bits. La
Figura 7.5 muestra un ejemplo. Esto dene una variable de 32 bits que se
descompone en las siguientes partes:
8 bits 11 bits 10 bits 3 bits
f4 f3 f2 f1
El primer campo esta asignado a los bits menos signicativos de esta palabra
doble.
2
Sin embargo, el formato no es tan simple, si uno mira como se almacenan
los bits en memoria. La dicultad ocurre cuando los campos de bits se salen
de los lmites del byte. Porque los bytes en un procesador little endian se
invertiran en memoria. Por ejemplo, los campos de la estructura S se veran
en memoria.
5 bits 3 bits 3 bits 5 bits 8 bits 8 bits
f2l f1 f3l f2m f3m f4
La etiqueta f2l se reere a los ultimos cinco bits (los 5 bits menos signica-
tivos) del campo f2. La etiqueta f2m se reere a los 5 bits mas signicativos
de f2. Las lneas verticales dobles muestran los lmites de los bytes. Si uno
invierte todos los bytes, las partes de los campos f2 y f3 se colocaran en el
lugar correcto.
La forma de la memoria fsica no es importante a menos que los datos
se transeran a o fuera de nuestro programa (lo cual es muy poco com un
con campos de bits). es com un para dispositivos de hardware usar n umeros
impares de bits donde los campos de bits son utiles para representarlos.
Un ejemplo es SCSI:
3
Una orden de lectura directa para un dispositivo
SCSI se especica enviando un mensaje de 6 bits al dispositivo con el for-
mato especicado en la Figura 7.6. La dicultad de representar esto usando
2
Actualmente, la norma ANSI/ISO C le da al compilador alguna exibilidad de como
se ordenan los bits exactamente. Sin embargo los compiladores populares (gcc, Microsoft
y Borland) usaran este orden en los campos.
3
Small Computer System Interface, es una norma de la industria para discos duros y
etc.
150 CAP

Byte \ Bit 7 6 5 4 3 2 1 0
0 Codigo de operacion (08h)
1 Unidad Logica # msb de LBA
2 mitad de la direccion del bloque logico
3 lsb de direccion del bloque logico
4 Longitud de transferencia
5 Control
Figura 7.6: Formato de la orden leer de SCSI
campos de bits es la direccion del bloque logico que abarca 3 bytes diferentes
en la orden. De la Figura 7.6 uno ve que el dato se almacena en el formato big
endian. La Figura 7.7 muestra una denicion que intenta trabajar con todos
los compiladores. Las dos primeras lneas denen un macro que retorna ver-
dadero si el codigo se compila con los compiladores de Borland o Microsoft.
La parte potencialmente confusa esta en las lneas 11 a 14. Primero uno
podra sorprenderse de Por que los bits lba mid y lba lsb estan denidos
separados y no en un solo campo de 16 bits? La razon es que el dato esta en
big endian. Un campo de 16 bits podra ser almacenado con el orden little
endian por el compilador. Ahora, los campos lba msb y logical unit parecen
invertidos; sin embargo esto no es el caso. Ellos tienen que colocarse en este
orden. La Figura 7.8 muestra como se colocan los campos en una entidad de
48 bits (los lmites del byte estan una vez mas marcados con lneas dobles).
Cuando esto se almacena en memoria en el orden little endian, los bits se
colocan en el orden deseado.(Figura 7.6)
Para complicar las cosas mas, la denicion para SCSI read cmd no tra-
baja correctamente en el compilador de Microsoft. Si se eval ua la expresion
sizeof (SCSI read cmpl), Microsoft C retornara 8 no 6. Esto es porque el com-
pilador de Microsoft usa el tipo de campo de datos para determinar como
colocar los bits. Ya que los bits estan denidos como de tipo unsigned, el
compilador rellena dos bytes al nal de la estructura para tener un m ultip-
lo de palabras dobles. Esto se puede solucionar haciendo todos los campos
unsigned short.
Ahora el compilador de Microsoft no necesita agregar ning un relleno ya
que los 6 bytes son un m ultiplo de una palabra
4
Los otros compiladores
tambien trabajaran correctamente con este cambio. La Figura 7.9 muestra
otra denicion que trabaja con los tres compiladores. Se evitan todos los
problemas usando campos de tipo unsigned char.
El lector no debera entristecerse si encuentra la division anterior con-
fusa. Es confusa! El autor a menudo encuentra menos confuso evitar los
4
Mezclar diferentes tipos de campos de bits produce un comportamiento muy confuso.
Se invita al lector a experimentar al respecto
#dene MS OR BORLAND (dened( BORLANDC ) \
|| dened( MSC VER))
#if MS OR BORLAND
# pragma pack(push)
# pragma pack(1)
#endif
struct SCSI read cmd {
unsigned opcode : 8;
unsigned lba msb : 5;
unsigned logical unit : 3;
unsigned lba mid : 8; / bits de la mitad /
unsigned lba lsb : 8;
unsigned transfer length : 8;
unsigned control : 8;
}
#if dened( GNUC )
attribute ((packed))
#endif
;
#if MS OR BORLAND
# pragma pack(pop)
#endif
Figura 7.7: Estructura del formato de la orden leer de SCSI
campos de bits y en su lugar usar las operaciones entre bits para examinar
y modicar los bits manualmente.
7.1.4. Usando estructuras en ensamblador
Como se discutio antes, acceder a una estructura en ensamblador es muy
parecido a acceder a un arreglo. Por ejemplo considere como uno podra
escribir una rutina en ensamblador que iniciara con cero el elemento y de
una estructura S. Asumiendo que el prototipo de la rutina sera:
void zero y ( S s p );
La rutina en ensamblador sera:
152 CAP

8 bits 8 bits 8 bits 8 bits 3 bits 5 bits 8 bits
control transfer length lba lsb lba mid logical unit lba msb opcode
Figura 7.8: Ordenamiento de los campos de SCSI read cmd
struct SCSI read cmd {
unsigned char opcode;
unsigned char lba msb : 5;
unsigned char logical unit : 3;
unsigned char lba mid; / bits de la mitad/
unsigned char lba lsb ;
unsigned char transfer length ;
unsigned char control ;
}
#if dened( GNUC )
attribute ((packed))
#endif
;
Figura 7.9: Estructura alterna del formato de la orden leer de SCSI
1 %define y_offset 4
2 _zero_y:
3 enter 0,0
4 mov eax, [ebp + 8] ; toma s_p (apuntador a la estructura)
5 ; de la pila
6 mov dword [eax + y_offset], 0
7 leave
8 ret
C le permite a uno pasar estructuras por valor a una funcion; sin embargo
esto la mayora de las veces es mala idea. Cuando se pasa por valor, todos
los datos de la estructura se deben copiar en la pila y luego trados por la
rutina. Es mucho mas eciente pasar un apuntador a una estructura.
C Tambien permite que un tipo de estructura se use como un valor de
retorno. Obviamente la estructura no se puede retornar en el registro EAX.
Cada compilador maneja la situacion diferente. Una solucion com un es que
el compilador usa esto para internamente reescribir la funcion para que tome
una estructura como parametro. El apuntador se usa para colocar el valor
de retorno en una estructura denida fuera de la rutina llamada.
La mayora de los ensambladores (incluido NASM) tiene un soporte em-
potrado para denir estructuras en su codigo de ensamblador. Consulte su
7.2. ENSAMBLADOR Y C++ 153
#include <stdio.h>
void f ( int x )
{
printf ( %d\n, x);
}
void f ( double x )
{
printf ( %g\n, x);
}
Figura 7.10: Dos funciones f()
documentacion para los detalles.
7.2. Ensamblador y C++
El lenguaje de programacion C++ es una extension del lenguaje C.
Muchas de las reglas basicas para interfazar C y ensamblador tambien son
validas para C++. Sin embargo algunas reglas necesitan ser modicadas.
Tambien algunas de las extensiones de C++ son faciles de entender con
conocimiento del lenguaje ensamblador. Esta seccion asume un conocimien-
to basico de C++.
7.2.1. Manipulacion de la sobrecarga de nombres
C++ permite que se denan diferentes funciones (y funciones miembro
de clases) con el mismo nombre. Cuando mas de una funcion comparte el
mismo nombre, se dice que la funcion esta sobrecargada. Si se denen dos
funciones con el mismo nombre en C, el encadenador producira un error
porque el encontrara dos deniciones para el mismo smbolo en los archivos
objeto que esta encadenando. Por ejemplo considere el codigo de la Figu-
ra 7.10. El codigo en ensamblador equivalente denira 2 etiquetas f que
obviamente sera un error.
C++ usa el mismo proceso de encademanmiento que C, pero evita este
error haciendo una manipulacion de nombres o modicando el smbolo us-
ado para etiquetar la funcion. De alguna manera C usa la manipulacion
de nombres tambien. A nade un guion bajo a la etiqueta de la funcion de
C cuando se crea la etiqueta para la funcion. Sin embargo C manipulara el
nombre de ambas funciones en la Figura 7.10 de la misma manera y produce
154 CAP

un error. C++ usa un proceso de manipulacion mas sosticado que produce
dos etiquetas diferentes para las funciones. Por ejemplo, a la primera funcion
de la Figura 7.10 le podra asignar DJGPP la etiqueta f Fi y a la segunda
funcion, f Fd. Esto evita errores de encadenamiento.
Desafortunadamente no esta normalizado como se manejan los nombres
en C++ y cada compilador trata los nombres a su manera. Por ejemplo
Borland C++ podra usar las etiquetas @f$qi y @f$qd para las dos funciones
de la Figura 7.10. Sin embargo, las reglas no son completamente arbitrarias.
El nombre manipulado codica la rma de la funcion. La rma de una
funcion esta denida por el orden y el tipo de sus parametros. Observe que
la funcion que toma un solo parametro int tiene una i al nal de la etiqueta
manipulada (para DJGPP y Borland) y la que toma un argumento double
tiene una d al nal de la etiqueta manipulada. Si tuviera una funcion llamada
f con el prototipo.
void f ( int x , int y , double z);
DJGPP podra manipular el nombre para ser f Fiid y Borland a @f$qiid.
El tipo de retorno de una funcion no hace parte de la rma de la fun-
cion y no se codica en el nombre manipulado. Este hecho explica una regla
de sobre carga en C++. Solo funciones cuya rma es unica se pueden so-
brecargar. Como uno puede ver, si dos funciones, con el mismo nombre y
rma, estan denidas en C++ ellas produciran el mismo nombre manipu-
lado y crearan un error de encadenamiento. Por defecto C++ manipula los
nombres de las funciones as no esten sobrecargadas. Cuando se compila un
archivo el compilador no tiene manera de saber si una funcion en particular
esta sobrecargada o no, as que manipula todos los nombres. De hecho tam-
bien manipula los nombres de las variables globales codicando el tipo de
variable de manera similar a la rma de las funciones. As uno puede denir
una variable global en un archivo como de cierto tipo y entonces intentar
usarla en otro archivo como de un tipo erroneo, se producira un error del
encadenador. Esta caracterstica de C++ es conocida como encadenamiento
seguro de tipos. Tambien se expone a otro tipo de error, prototipos incon-
sistentes. Esto ocurre cuando la denicion de una funcion en un modulo no
concuerda con el prototipo usado por otro modulo. En C esto puede ser
un problema muy difcil de depurar. C no atrapa este error. El programa
compilara y encadenara, pero tendra un comportamiento indenido cuando
se invoca el codigo colocando diferentes tipos de datos en la pila de los que
la funcion espera. En C++, esto producira un error de encadenado.
Cuando el compilador de C++ esta examinando la sintaxis un llamado
a funcion, el busca una funcion donde emparejen los tipos de los argumentos
pasados a la funcion.
5
Si se empareja entonces crea un CALL a la funcion
5
El emparejamiento no tiene que ser exacto, el compilador considerara las conversiones
correcta usando las reglas de manipulacion del compilador.
Ya que cada compilador usa sus reglas de manipulacion de nombres, el
codigo de C++ compilado con compiladores diferentes no es posible unirlo.
Este hecho es importante cuando se considera usar una biblioteca de C++
precompilada. Si uno desea escribir una funcion en ensamblador que sera us-
ada con codigo C++, debe conocer las reglas de manipulacion de nombres
del compilador (o usar la tecnica explicada abajo).
El estudiante astuto puede preguntar si el codigo de la Figura 7.10 tra-
bajara como se espera. Ya que C++ manipula los nombres de todas las
funciones, entonces la funcion printf sera manipulada y el compilador no
producira un CALL a la etiqueta printf. Esto es un valido, si el prototipo
para printf fue colocado simplemente al principio del archivo, esto podra
pasar. El prototipo es:
int printf ( const char , ...);
DJGPP podra manipular esto como printf FPCce (la F es por funcion, P
por apuntador, C por constante, c por char y e por elipsis). Esto podra no
llamar la funcion printf de la biblioteca de C. Claro esta, debe haber alguna
forma para el codigo de C++ llamar codigo de C. Esto es muy importante
ya que hay una gran cantidad de codigo de C util. Ademas permitirle a uno
llamar codigo de C heredado, C++ tambien le permite a uno llamar codigo
de ensamblador usando las convenciones normales de llamado.
C++ extiende la palabra clave extern para permitir especicar que la
funcion o variable global que modica usa las convenciones de llamado de
C. En la terminologa de C++, las variables y funciones globales usan el
encadenamiento de C. Por ejemplo para declarar que printf tenga el enca-
denamiento de C, use el prototipo:
extern C int printf ( const char , ... );
Esto le dice al compilador que no use las reglas de manipulacion de nombres
en esta funcion, pero en su lugar usar las reglas de C. Sin embargo, haciendo
esto, la funcion printf no se puede sobrecargar. Esto suministra una manera
facil de interfazar C++ y ensamblador , denir la funcion para que use el
encadenamiento de C y la convencion de llamado de C.
Por conveniencia C++ tambien permite el encadenamiento de un bloque
de funciones y variables globales a ser denidas. El bloque se enmarca por
las tpicas llaves:
extern C {
/ encadenamiento tipo C a variables globales y prototipos de funciones /
}
de tipos de los argumentos. Las reglas para este proceso estan mas alla del alcance de este
libro. Consulte un libro de C++ para los detalles.
156 CAP

void f ( int & x ) // el & denota una referencia
{ x++; }
int main()
{
int y = 5;
f (y ); // se pasa la referencia a y , obeserve que
// no hay & aac
printf ( %d\n, y); // imprime 6!
return 0;
}
Figura 7.11: Ejemplo de referencia
Si uno examina los archivos de encabezado de ANSI C que vienen con
los compiladores de C/C++ de hoy da, en ellos se encontra al principio de
cada archivo de cabecera:
#ifdef cplusplus
extern C {
#endif
Y una construccion parecida cerca del nal conteniendo el n de la llave.
Los compiladores de C++ denen el macro cplusplus (con dos guiones
bajos adelante). La porcion de codigo anterior encierra todo el archivo de
cabecera en un bloque extern C si el archivo de cabecera es compilado como
C++, pero no hace nada si es compilado como C (ya que el compilador de
C dara un error de sintaxis para extern C). Esta misma tecnica puede ser
usada por cualquier programador para crear un archivo de cabecera para las
rutinas de ensamblador que pueden ser usadas con C o C++.
7.2.2. Referencias
Las referencias son otra caracterstica nueva C++. Ellas le permiten a
uno pasar parametros a funciones sin usar apuntadores explcitamente. Por
ejemplo, considere el codigo de la Figura 7.11. Actualmente los parametros
por referencia son muy simples, ellos realmente son tan solo apuntadores.
El compilador solo le oculta esto al programador (tal como los compiladores
de Pascal implementan los parametros var como apuntadores). Cuando el
compilador genera el ensamblador para el llamado a la funcion en la lnea
7, pasa la direccion de y. Si uno escribio la funcion f en ensamblador, ella
se debera comportar como si el prototipo fuera
6
:
void f ( int xp);
Las referencias son solo una conveniencia que es especialmente util para
la sobrecarga de operadores. Esta es otra caracterstica de C++ que le per-
mite a uno denir el signicado para los operadores en tipos de estructuras
o clases. Por ejemplo, un uso com un es denir el operador mas (+) para unir
objetos tipo cadena. As, si a y b fueran cadenas, a + b debera retornar la
union de las cadenas a y b, C++ actualmente llama una funcion para hacer
esto (de hecho, esta expresion podra ser reescrita en la notacion de funcion
como operator +(a,b)). Por eciencia uno podra querer pasar la direccion
de los objetos cadena en lugar de pasarlos por valor. Sin referencias esto se
podra hacer como operator +(&a,&b), pero esto requerira escribir en la
sintaxis del operador como &a + &b. Esto sera muy complicado y confuso.
Sin embargo, usando referencias, uno puede escribir a + b que se ve muy
natural.
7.2.3. Funciones inline
Las funciones inline son otra caracterstica de C++
7
. Las funciones in-
line son hechas para reemplazar, los macros basados en el procesador que
toman parametros que son muy propensos a tener errores. Recuerde de C,
que escribir un macro que eleva al cuadrado un n umero podra verse como:
#dene SQR(x) ((x)(x))
Porque el preprocesador no entiende C hace simples sustituciones, se re-
quieren los parentesis para calcular la respuesta correcta en la mayora de
los casos. Sin embargo, a un esta version no dara la respuesta correcta para
SQR(X++).
Los macros se usan porque ellos eliminan el trabajo extra de hacer un lla-
mad a funcion para una funcion elemental. Como se demostro en el captulo
de subprogramas realizar un llamado a funcion involucra varios pasos. Por
cada funcion elemental, el tiempo que se toma en llamar la funcion puede
ser mayor que el tiempo necesario en realizar las operaciones en la funcion.
La funcion inline es una manera mucho mas amigable de escribir codigo que
se vea como una funcion normal, pero que no hace el bloque de codigo para
CALL. En lugar de ello los llamados a funciones inline son reemplazados por
el codigo que realiza la funcion. C++ le permite a una funcion ser inline
colocando la palabra inline clave al frente de la denicion de la funcion.
6
Claro esta ella podra esperar declarar la funcion con encadenamiento C para evitar
la manipulacion de nombres discutida en la seccion 7.2.1
7
Los compiladores de C a menudo soportan esta caracterstica como una extension de
ANSI C
158 CAP

inline int inline f ( int x )
{ return xx; }
int f ( int x )
{ return xx; }
int main()
{
int y , x = 5;
y = f(x);
y = inline f (x);
return 0;
}
Figura 7.12: ejemplo inline
Por ejemplo considere las funciones declaradas en la Figura 7.12. El llamado
a la funcion f en la lnea 10 hace un llamado normal a una funcion (en
ensamblador, asumiendo que x esta en la direccion ebp-8 y y esta en ebp-4:
1 push dword [ebp-8]
2 call _f
3 pop ecx
4 mov [ebp-4], eax
Sin embargo, el llamado a la funcion inline f de la lnea 11 podra verse
como:
1 mov eax, [ebp-8]
2 imul eax, eax
3 mov [ebp-4], eax
En este caso hay dos ventajas de las funciones inline. Primero la funcion
en lnea es rapida. No se colocan los parametros en la pila, no se crea el
macro de la pila ni se destruye, no se hace el salto. Segundo el llamado de
las funciones en lnea usa menos codigo. Este ultimo punto es verdad para
este ejemplo pero no siempre es cierto.
La principal desventaja de las funciones inline es que el codigo en lnea
no se encadena y as el codigo de una funcion en lnea debe estar disponible
en todos los archivos que la usen. El ejemplo anterior prueba esto. El llama-
do de una funcion normal solo requiere el conocimiento de los parametros,
class Simple {
public:
Simple (); // Construcctor por defecto
Simple (); // destructor
int get data () const; // funciones miembro
void set data ( int );
private:
int data; // datos miembro
};
Simple:: Simple()
{ data = 0; }
Simple::Simple()
{ / null body / }
int Simple:: get data () const
{ return data; }
void Simple:: set data ( int x )
{ data = x; }
Figura 7.13: Una clase simple de C++
el tipo de valor de retorno, la convencion de llamado y el nombre de la eti-
queta para la funcion. Toda esta informacion esta disponible en el prototipo
de la funcion. Sin embargo al usar funciones inline se requiere conocer todo
el codigo de la funcion. Esto signica que si cualquier parte de una funcion
en lnea se cambia, todos los archivos fuentes que usen la funcion deben
ser recompilados. Recuerde que para las funciones no inline, si el prototipo
cambia, a menudo los archivos que usan la funcion no necesitan ser recompi-
lados. Por todas estas razones, el codigo de las funciones en lnea se colocan
normalmente en los archivos de cabecera. Esta practica es contraria a la
regla normal dura y rapida de C que las instrucciones de codigo ejecutable
nunca se colocan en los archivos de cabecera.
7.2.4. Clases
Una clase en C++ describe un tipo de objeto. Un objeto tiene como
miembros a datos y funciones
8
. En otras palabras, es una estructura con
8
a menudo llamados en C++ funciones miembro o mas generalmente metodos.
160 CAP

void set data ( Simple object , int x )
{
object>data = x;
}
Figura 7.14: Version de C de Simple::set data()
1 _set_data__6Simplei: ; nombre manipulador
2 push ebp
3 mov ebp, esp
4
5 mov eax, [ebp + 8] ; eax = apuntador al objeto (this)
6 mov edx, [ebp + 12] ; edx = parametro entero
7 mov [eax], edx ; data tiene un desplazamiento de 0
8
9 leave
10 ret
Figura 7.15: Salida del compilador para Simple::set data( int )
datos y funciones asociadas a ella. Considere la clase denida en la Figu-
ra 7.13. Una variable de tipo Simple se podra ver tal como una estructura
normal en C con un solo int como miembro. Las funciones no son alma- Ahora, C++ usa la palabra
clave this para acceder al
apuntador de un objeto que
esta dentro de la funcion
miembro.
cenadas en la memoria asignada a la estructura. Sin embargo las funciones
miembro son diferentes de las otras funciones . Ellas son pasadas como un
parametro oculto. Este parametro es un apuntador al objeto al cual la
funcion pertenece.
Por ejemplo considere el metodo set data de la clase simple de la Figu-
ra 7.13. Si se escribio en C se vera como una funcion que fue pasada explcita-
mente un apuntador al objeto. Como muestra la Figura 7.14. La opcion -S
en el compilador DJGPP (y en los compiladores gcc y Borland tambien) le
dice al compilador producir un archivo ensamblador conteniendo el lengua-
je ensamblador equivalente para el codigo producido. Para DJGPP y gcc
el archivo ensamblador naliza con una extension o .s y desafortunada-
mente usa la sintaxis del lenguaje ensamblador AT&T que es diferente de
la sintaxis de NASM y MASM.
9
(Los compiladores de Borland y Microsoft
9
El sistema de compilador gcc incluye su propio ensamblador llamado gas. El
ensamblador gas usa la sintaxis AT&T y as el compilador produce el codigo
en el formato de gas. Hay varias paginas web que discuten las diferencias en-
tre los formatos INTEL y AT&T. Hay tambien un programa mnimo llamado a2i
(http://www.multimania.com/placr/a2i.html), que convierte del formato AT&T al for-
generan un archivo con extension .asm usando la sintaxis MASM). La Figu-
ra 7.15 muestra la salida de DJGPP convertida a la sintaxis de MASM con
comentarios a nadidos para claricar el proposito de las instrucciones. En
la primera lnea, observe que el metodo set data se le asigna la etiqueta
manipulada que codica el nombre del metodo, el nombre de la clase y los
parametros. El nombre de la clase se codica porque otras clases podran
tener un metodo llamado set data y los dos metodos deben tener etiqueta
diferente. Los parametros se codican tal que la clase pueda sobre cargar el
metodo set data para tomar otros parametros como es normal en las fun-
ciones C++. Sin embargo, tal como antes, cada compilador codicara esta
informacion diferente en la etiqueta manipulada.
Luego en las lneas 2 y 3, aparece el prologo tpico de la funcion. En la
lnea 5 se almacena el primer parametro de la pila en EAX. Este no es el
parametro X, es el parametro oculto.
10
que apunta al objeto sobre el cual
act ua. La lnea 6 almacena el parametro x en EDX y la lnea 7 almacena EDX
en la palabra doble a la que apunta EAX. Esto es el miembro data del objeto
Simple sobre el cual act ua, que es el unico dato en la clase, se almacena con
un desplazamiento cero en la estructura Simple.
Ejemplo
Esta seccion usa las ideas del captulo para crear una clase de C++ que
representa un entero sin signo de tama no arbitrario. Ya que el entero puede
ser de cualquier tama no, sera almacenado en un arreglo de enteros sin signo
(palabras dobles). Se puede hacer de cualquier tama no usando memoria
dinamica. Las palabras dobles se almacenan en orden inverso.
11
(la palabra
doble menos signicativa es la palabra doble que esta en la posicion 0).
La Figura 7.16 muestra la denicion de la clase Big int.
12
. El tama no
de un Big int se mide por el tama no del arreglo sin signo que es usado
para almacenar este dato. El dato miembro size de la clase se le asigna un
desplazamiento de cero y el miembro number se le asigna un desplazamiento
de 4.
Para simplicar este ejemplo, solo instancias objeto con el mismo tama no
se pueden sumar o restar la una de la otra.
La clase tiene tres constructores: El primero (lnea 9) inicia la instancia
de la clase usando un entero sin signo normal; el segundo (lnea 18) inicia
la instancia usando una cadena que contiene un valor en hexadecimal. El
mato NASM
10
Como es normal nada esta oculto en el codigo ensamblador
11
Por que? Porque las operaciones de adicion siempre se comenzaran a procesar al
inicio del arreglo y se movera hacia adelante.
12
Vea el codigo fuente example para el codigo completo de este ejemplo. El texto solo
se referira a alguna parte del codigo.
162 CAP

class Big int {
public:
/
aParmetros:
size ntamao del entero expresado como el unmero de
unsigned int normales
initial value valor inicial de Big int como un
unsigned int normal
/
explicit Big int ( size t size ,
unsigned initial value = 0);
/
aParmetros
size ntamao del entero expresado como el unmero de
unsigned int normales
initial value valor inicial de Big int como la cadena que
almacena la o representacin hexadecimal del valor .
/
Big int ( size t size ,
const char initial value );
Big int ( const Big int & big int to copy );
Big int ();
// retorna el ntamao de Big int (en etrminos de unsigned int )
size t size () const;
const Big int & operator = ( const Big int & big int to copy );
friend Big int operator + ( const Big int & op1,
const Big int & op2 );
friend Big int operator ( const Big int & op1,
const Big int & op2);
friend bool operator == ( const Big int & op1,
const Big int & op2 );
friend bool operator < ( const Big int & op1,
friend ostream & operator << ( ostream & os,
const Big int & op );
private:
size t size ; // ntamao del arreglo sin signo
unsigned number ; // apuntador al arreglo sin singno que
// almacena el valor
};
Figura 7.16: Denicion de la clase Big int
// Prototipos para las rutinas en ensamblador
extern C {
int add big ints ( Big int & res ,
const Big int & op1,
int sub big ints ( Big int & res ,
const Big int & op1,
}
inline Big int operator + ( const Big int & op1, const Big int & op2)
{
Big int result (op1. size ());
int res = add big ints ( result , op1, op2);
if ( res == 1)
throw Big int :: Overow();
if ( res == 2)
throw Big int :: Size mismatch();
return result ;
}
inline Big int operator ( const Big int & op1, const Big int & op2)
{
Big int result (op1. size ());
int res = sub big ints ( result , op1, op2);
if ( res == 1)
throw Big int :: Overow();
if ( res == 2)
throw Big int :: Size mismatch();
return result ;
}
Figura 7.17: Codigo de la aritmetica de la clase Big int
164 CAP

tercer constructor (lnea 21) es el constructor copia.
Esta discusion se enfoca en como trabajan los operadores de la suma y de
la resta ya que es all donde se usa el lenguaje ensamblador. La Figura 7.17
muestra las partes relevantes del archivo de encabezado para estos oper-
adores. Ellas muestran como los operadores se usab para llamar las rutinas
en ensamblador. Ya que cada compilador usa sus reglas de manipulacion
de nombres radicalmente diferentes para las funciones de los operadores,
las funciones en lnea de los operadores se usan para establecer el encade-
namiento de rutinas en ensamblador. Esto hace relativamente facil portar
a diferentes compiladores y es tan rapido como los llamados directos. Esta
tecnica tambien elimina la necesidad de lanzar una excepcion desde ensam-
blador.
Por que se usa el ensamblador aca despues de todo? Recuerde que realiza
aritmetica de precision m ultiple, el carry se debe mover de una palabra
doble para sumar la siguiente palabra doble. C++ (y C) no le permiten al
programador acceder a la bandera de carry de la CPU. Realizar la suma
podra solo hacerlo recalculando la bandera de carry y condicionalmente
sumar esto a la siguiente palabra doble. Es mucho mas eciente escribir
el codigo en ensamblador donde se puede acceder a la bandera de carry y
usando la instruccion ADC que automaticamente suma la bandera de carry.
Por brevedad, solo se discutira aca la rutina de ensamblador add big ints.
Sigue el codigo de esta rutina (de big math.asm):
big math.asm
1 segment .text
2 global add_big_ints, sub_big_ints
3 %define size_offset 0
4 %define number_offset 4
5
6 %define EXIT_OK 0
7 %define EXIT_OVERFLOW 1
8 %define EXIT_SIZE_MISMATCH 2
9
10 ; Parametros para las rutinas add y sub
11 %define res ebp+8
12 %define op1 ebp+12
13 %define op2 ebp+16
14
15 add_big_ints:
16 push ebp
17 mov ebp, esp
18 push ebx
19 push esi
20 push edi
21 ;
22 ; primero esi se~nala a op1
23 ; edi se~nala a op2
24 ; ebx se~nala a res
25 mov esi, [op1]
26 mov edi, [op2]
27 mov ebx, [res]
28 ;
29 ; Asegurarse que todos los 3 Big_Int tienen el mismo tama~no
30 ;
31 mov eax, [esi + size_offset]
32 cmp eax, [edi + size_offset]
33 jne sizes_not_equal ; op1.size_ != op2.size_
34 cmp eax, [ebx + size_offset]
35 jne sizes_not_equal ; op1.size_ != res.size_
36
37 mov ecx, eax ; ecx = size of Big_ints
38 ;
39 ; ahora, los registrosse~nalan a sus respectivos arreglos
40 ; esi = op1.number_
41 ; edi = op2.number_
42 ; ebx = res.number_
43 ;
44 mov ebx, [ebx + number_offset]
45 mov esi, [esi + number_offset]
46 mov edi, [edi + number_offset]
47
48 clc ; borra bandera de carry
49 xor edx, edx ; edx = 0
50 ;
51 ; addition loop
52 add_loop:
53 mov eax, [edi+4*edx]
54 adc eax, [esi+4*edx]
55 mov [ebx + 4*edx], eax
56 inc edx ; no altera la bandera de carry
57 loop add_loop
58
59 jc overflow
60 ok_done:
61 xor eax, eax ; valor de retorno = EXIT_OK
166 CAP

62 jmp done
63 overflow:
64 mov eax, EXIT_OVERFLOW
65 jmp done
66 sizes_not_equal:
67 mov eax, EXIT_SIZE_MISMATCH
68 done:
69 pop edi
70 pop esi
71 pop ebx
72 leave
73 ret
big math.asm
Con la esperanza que la mayora del codigo fuera claro al lector por
ahora. Las lneas 25 a 27 almacenan los apuntadores a los objetos Big int
pasados a la funcion en registro. Recuerde que las referencias realmente
son solo apuntadores. Las lneas 31 a 35 aseguran que los tama nos de los 3
objetos de los arreglos sean iguales (Observe que el desplazamiento de size
se a nade al apuntador para acceder al dato miembro). Las lneas 44 a 46
ajustan los registros para apuntar al arreglo usado por los objetos respectivos
en lugar de los objetos en s mismos. (Una vez mas, el desplazamiento de
number se a nade al apuntador del objeto).
El bucle en las lneas 52 a 57 suma los enteros almacenados en los arreglos
sumando primero la palabra doble menos signicativa, luego la siguiente
palabra doble y as sucesivamente. La suma se realiza en esta secuencia
para la aritmetica de precision extendida (vea la Seccion 2.1.5). La lnea
59mexamina el desborde, si hay desborde la bandera de carry se debera
jar con la ultima suma de la palabra doble mas signicativa. Ya que las
palabras dobles en el arreglo se almacenan en el orden de little endian, el
bucle comienza en el inicio del arreglo y se mueve adelante hasta el nal.
La Figura 7.18 muestra un corto ejemplo del uso de la clase Big int. Ob-
serve que las constantes Big int se deben declarar explcitamente como en
la lnea 16. Esto es necesario por dos razones. Primero, no hay un construc-
ctor de conversion que convierta un unsigned int en un Big int. Segundo,
solo Big Int del mismo tama no se pueden sumar, esto hace la conversion
problematica ya que podra ser difcil conocer que tama no convertir a. Una
implementacion mas sosticada de la clase debera permitir sumar objetos
de cualquier tama no. El autor no desea complicar este ejemplo implemen-
tandolo aca. (sin embargo exhorta al lector a hacer esto).
7.2.5. Herencia y polimorsmo
La herencia le permite a una clase heredar los datos y metodos de otra.
#include big int.hpp
#include <iostream>
using namespace std;
int main()
{
try {
Big int b(5,8000000000000a00b);
Big int a(5,80000000000010230);
Big int c = a + b;
cout << a << + << b << = << c << endl;
for ( int i =0; i < 2; i ++ ) {
c = c + a;
cout << c = << c << endl;
}
cout << c1 = << c Big int(5,1) << endl;
Big int d(5, 12345678);
cout << d = << d << endl;
cout << c == d << (c == d) << endl;
cout << c > d << (c > d) << endl;
}
catch( const char str ) {
cerr << Caught: << str << endl;
}
catch( Big int :: Overow ) {
cerr << Overow << endl;
}
catch( Big int :: Size mismatch ) {
cerr << Size mismatch << endl;
}
return 0;
}
Figura 7.18: Uso simple de Big int
168 CAP

#include <cstddef>
#include <iostream>
using namespace std;
class A {
public:
void cdecl m() { cout << A::m() << endl; }
int ad;
};
class B : public A {
public:
void cdecl m() { cout << B::m() << endl; }
int bd;
};
void f ( A p )
{
p>ad = 5;
pem();
}
int main()
{
A a;
B b;
cout << nTamao de a: << sizeof(a)
<< Desplazamiento de ad: << osetof(A,ad) << endl;
cout << nTamao de b: << sizeof(b)
<< Desplazamiento de ad: << osetof(B,ad)
<< Desplazamiento de bd: << osetof(B,bd) << endl;
f(&a);
f(&b);
return 0;
}
Figura 7.19: Herencia simple
1 _f__FP1A: ; nombre de la funcion manipulador
2 push ebp
3 mov ebp, esp
4 mov eax, [ebp+8] ; eax apunta al objeto
5 mov dword [eax], 5 ; usar desplazamiento 0 para ad
6 mov eax, [ebp+8] ; pasar la direccion del objeto a A::m()
7 push eax
8 call _m__1A ; nombre del metodo manipulado para A::m()
9 add esp, 4
10 leave
11 ret
Figura 7.20: Codigo en ensamblador para la herencia simple
class A {
public:
virtual void cdecl m() { cout << A::m() << endl; }
int ad;
};
class B : public A {
public:
virtual void cdecl m() { cout << B::m() << endl; }
int bd;
};
Figura 7.21: Herencia polimorca
Por ejemplo consider el codigo de la Figura 7.19. Ella muestra dos clases A
y B, donde la clase B hereda de A. La salida del programa es:
Tama~no de a: 4 Desplazamiento de ad: 0
Tama~no de b: 8 Desplazamiento de ad: 0 Desplazamiento de bd: 4
A::m()
A::m()
Observe que los miembros ad de ambas clases (B hereda de A) estan en el
mismo desplazamiento. Esto es importante ya que la funcion f puede ser
pasada como un apuntador, a un objeto A de cualquier tipo derivado de A.
La Figura 7.20 muestra el codigo asm (editado) para la funcion (generada
por gcc).
Observe que en la salida del metodo m de A fue llamado por los objetos
170 CAP

1 ?f@@YAXPAVA@@@Z:
2 push ebp
3 mov ebp, esp
4
5 mov eax, [ebp+8]
6 mov dword [eax+4], 5 ; p->ad = 5;
7
8 mov ecx, [ebp + 8] ; ecx = p
9 mov edx, [ecx] ; edx = apuntador a vtable
10 mov eax, [ebp + 8] ; eax = p
11 push eax ; empuja apuntador "this"
12 call dword [edx] ; llama primera funcion en vtable
13 add esp, 4 ; limpia la pila
14
15 pop ebp
16 ret
Figura 7.22: Codigo en ensamblador para la funcion f()
a y b. Desde ensamblador, uno puede ver que la llamada a A::m() esta em-
potrado en la funcion. Para programacion realmente orientada a objetos, el
metodo llamado dependera de que tipo de objeto se pasa a la funcion. Es-
to es conocido como polimorfismo. C++ tiene esta caracterstica apagada
por defecto. Uno usa la palabra clave virtual para i habilitarla. La Figu-
ra 7.21 muestra como las dos clases seran cambiadas. Nada del otro codi-
go necesita ser cambiado. El polimorsmo puede implementarse de muchas
maneras. Desafortunadamente la implementacion de gcc esta en transicion
al momento de escribir esto y es signicativamente mas complicada que la
implementacion inicial. Interesado en simplicar esta discusion, el autor so-
lo cubrira la implementacion del polimorsmo que usan los compiladores
de Windows, Microsoft y Borland. Esta implementacion no ha cambiado en
muchos a nos y probablemente no cambie en el futuro cercano.
Con estos cambios, la salida del programa cambia:
Tama~no de a: 8 Desplazamiento de ad: 4
Tama~no de b: 12 Desplazamiento de ad: 4 Desplazamiento de bd: 8
A::m()
B::m()
Ahora la segunda llamada a f llama el metodo B::m() porque es pasado
a un objeto B. Esto no es lo unico que cambia. El tama no de A es ahora
8 (y B es 12). Tambien el desplazamiento de ad es 4 no es 0. Que es un
class A {
public:
virtual void cdecl m1() { cout << A::m1() << endl; }
virtual void cdecl m2() { cout << A::m2() << endl; }
int ad;
};
class B : public A { // B hereda de A m2()
public:
virtual void cdecl m1() { cout << B::m1() << endl; }
int bd;
};
/ imprime la vtable de un objeto dado /
void print vtable ( A pa )
{
// p ve a pa como un arreglo de palabras dobles
unsigned p = reinterpret cast<unsigned >(pa);
// vt ve la vtable como un arreglo de apuntadores
void vt = reinterpret cast<void >(p[0]);
cout << hex << oDireccin de la vtable = << vt << endl;
for ( int i =0; i < 2; i ++ )
cout << dword << i << : << vt[i] << endl;
// llamado a funciones virtuales de una manera
// EXTREMADAMENTE no portable
void (m1func pointer)(A ); // function pointer variable
m1func pointer = reinterpret cast<void ()(A)>(vt[0]);
m1func pointer(pa); // Llama al emtodo m1 a etravs de un
// apuntador a una ofuncin
void (m2func pointer)(A ); // function pointer variable
m2func pointer = reinterpret cast<void ()(A)>(vt[1]);
m2func pointer(pa); // llamado al emtodo m2 a etravs de
// un apuntador a ofuncin
}
int main()
{
A a; B b1; B b2;
cout << a: << endl; print vtable (&a);
cout << b1: << endl; print vtable (&b);
cout << b2: << endl; print vtable (&b2);
return 0;
}
Figura 7.23: Un ejemplo mas complicado
172 CAP

s -
bd
b1
0
4
8
4 ad
&B::m1()
&A::m2()
vtable
vtablep
0
Figura 7.24: Representacion interna de b1
desplazamiento de cero? La respuesta a esta pregunta esta relacionada con
la implementacion del polimorsmo.
Una clase C++ que tiene cualquier metodo virtual se le da un campo
oculto extra que es un apuntador a un arreglo de apuntadores a metodos.
13
.
Esta tabla se llama a menudo vtable. Para las clases A y B este apuntador se
almacena con un desplazamiento 0. Los compiladores de Windows siempre
colocan este apuntador al inicio de la clase, en el tope del arbol de herencia.
Mirando en el codigo ensamblador (Figura 7.22) generado para la funcion f
(de la Figura 7.19) para el metodo virtual del programa, uno puede ver que
la llamada al metodo m no es a una etiqueta. La lnea 9 encuentra la direccion
de la vtable de objeto. La direccion del objeto se empuja en la pila en la lnea
11. La lnea 12 llama al metodo virtual ramicandose en la primera direccion
en la vtable.
14
. Esta llamada no usa una etiqueta, salta a la direccion de
codigo apuntada por EDX. Este tipo de llamadas es un ejemplo de vnculo
tardo . El vnculo tardo retraza la decision de que metodo llamar hasta
que el codigo se este ejecutando. Esto le permite al codigo llamar el metodo
apropiado para el objeto. El caso normal (Figura 7.20) ja una llamada a
cierto metodo es llamado primer vnculo ya que aqu el metodo esta atado
en el tiempo de compilacion. El lector atento se sorprendera por que los
metodos de la clase en la Figura 7.21 estan declarados explcitamente para
usar la convecion de llamado de usando la plabra clave cdecl. Por defecto
Microsoft usa una convecion de llamado diferente a la convencion normal de
C para los metodos de las clases de C++.

El pasa un apuntador al objeto
sobre el que act ua el metodo en el registro ECX en lugar de usar la pila.
La pila se sigue usando para los otros parametros explcitos del metodo. El
13
Para las clases sin metodos virtuales los compiladores de C++ siempre hacen la clase
compatible con una estructura normal de C con los mismos miembros.
14
Claro esta, este valor ya esta en el registro ECX el fue colocado en la lnea 8 y la lnea
10 poda ser quitado y la proxima lnea cambiada para empujar ECX. El codigo no es muy
eciente porque se genera sin tener activadas las optimizaciones del compilador.
a:
vtable address = 004120E8
dword 0: 00401320
dword 1: 00401350
A::m1()
A::m2()
b1:
vtable address = 004120F0
dword 0: 004013A0
dword 1: 00401350
B::m1()
A::m2()
b2:
vtable address = 004120F0
dword 0: 004013A0
dword 1: 00401350
B::m1()
A::m2()
Figura 7.25: Salida del programa de la Figura 7.23
modicador cdecl le dice usar la convencion de llamado estandar de C.
Borland C++ usa la convencion de llamado de C por defecto.
Ahora miraremos un ejemplo un poco mas complicado (Figura 7.23).
En el, las clases A y B cada una tiene dos metodos m1 y m2.Recuerde que
ya que la clase B no dene su propio metodo m2, hereda el metodo de la
clase A. La Figura 7.24 muestra como un objeto b se ve en memoria. La
Figura 7.25 muestra la salida del programa. Primero observe la direccion de
vtable para cada objeto. Las dos direcciones de los objetos B son iguales y
as, ellas compartan la misma vtable. Una vtable es una propiedad de la clase
no un objeto (como un miembro static). Ahora mire en las direcciones en
las vtables. Mirando la salida en ensamblador uno puede determinar que el
apuntador al metodo m1 es un desplazamiento cero (o palabra doble 0) y m2
es un desplazamiento de 4 (palabra doble 1). Los apuntadores al metodo m2
son los mismos vtables de las clases A y B porque la clase B hereda el metodo
m2 de la clase A.
Las lneas 25 a 32 muestran como uno podra llamar a una funcion virtual
leyendo su direccion de la vtable para el objeto.
15
. La direccion del metodo
se almacena en un apuntador a funcion de tipo C con un apuntador explcito
15
Recuerde que este codigo solo trabaja con los compiladores de Borland y MS, no para
gcc.
174 CAP

this. De la salida en la Figura 7.25, uno puede ver que trabaja. Sin embargo,
por favor no escriba codigo como este. Es solo para ilustrar como los metodos
virtuales usan la vtable.
Hay algunas lecciones practicas para aprender de esto. Un hecho impor-
tante es que uno tendra que tener mucho cuidado cuando lee y escribe vari-
ables de una clase a un archivo binario. Uno no puede soo usar una lectura
o escritura binaria en un objeto completo ya que esto podra leer o escribir
la apuntador vtable al archivo. Este es un apuntador a donde la vtable re-
side en la memoria del programa y variara de programa a programa. Este
mismo problema puede ocurrir con estructuras, pero en C, las estructuras
solo tienen apuntadores en ellas si el programador las coloca explcitamente
en ellas. No hay apuntadores obvios denidos en las clases A o B.
Otra vez, es importante tener en cuenta que cada compilador implemen-
ta los metodos virtuales a su manera. En Windows, los objetos de las clases
COM (Component Object Model) usan las vtables para implementar in-
terfaces COM
16
. Solo los compiladores que implementan metodos virtuales
como Microsoft pueden crear clases COM. Esta es la razon por la cual Bor-
land usa la misma implementacion que Microsoft y una de las principales
razones por las cuales gcc no se puede usar para crear clases COM.
El codigo para el metodo virtual parece exactamente como un metodo
no virtual. Solo el codigo que llama es diferente. Si el compilador puede estar
absolutamente seguro de que metodo virtual sera llamado, puede ignorar la
vtabley llamar el metodo directamente, (usando el primer vnculo).
7.2.6. Otras caractersticas de C++
Las otras caractersticas de C++ (informacion en tiempo de ejecucion,
manejo de excepciones y herencia m ultiple) estan mas alla del alcance de
este texto. Si el lector desea avanzar mas, un buen punto de partida es The
Annotated C++ Reference Manual por Ellis and Stroustrup y The Design
and Evolution of C++ por Stroustrup.
16
Las clases COM tambien usan la convencion de llamado code stdcall no la normal
de C.
Apendice A
Instrucciones del 80x86
A.1. Instrucciones para enteros
Esta seccion lista y describe las acciones y formatos de las instrucciones
para enteros de la familia de Intel 80x86
Los formatos usan las siguientes abreviaturas:
R registro general
R8 registro de 8 bits
SR registro de segmento
M memoria
M8 byte
M16 palabra
M32 palabra doble
I valor inmediato
Estas se pueden combinar para las instrucciones con varios operandos. Por
ejemplo el formato R,R signica que la instruccion toma dos operandos de
registro. Muchas de las instrucciones con dos operandos permiten los mismos
operandos. La abreviacion 02 se usa para representar estos operandos: R,R
R,M R,I M,R M,I. Si se puede usar como operando un registro de 8 bits o
la memoria, se usa la abreviacion R/M8
La tabla tambien muestra como se afectan varias de las banderas del
registro FLAGS. Si la columna esta en blanco, el bit correspondiente no se
afecta. Si el bit siempre cambia a alg un valore en particular, se muestra un 1
o un 0 en la columna. Si el bit cambia a un valor que depende del operando
de la instruccion se coloca un C en la columna. Finalmente, si el bit es
modicado de alguna manera no denida se coloca un ? en la columna. Ya
175
176 AP
ENDICE A. INSTRUCCIONES DEL 80X86

que las unicas instrucciones que cambian las banderas de direccion son CLD
y STD, no se listan bajo la columna de FLAGS.
Banderas
Nombre Descripcion Formatos O S Z A P C
ADC Suma con carry O2 C C C C C C
ADD Suma enteros O2 C C C C C C
AND AND entre bits O2 0 C C ? C 0
BSWAP Byte Swap R32
CALL Llamado a rutina R M I
CBW Convierta byte a pal-
abra
CDQ Convierte Dword a
Qword
CLC Borra el Carry 0
CLD borra la bandera de di-
reccion
CMC Complementa el carry C
CMP Compara enteros O2 C C C C C C
CMPSB Compara Bytes C C C C C C
CMPSW Compara Words C C C C C C
CMPSD Compara Dwords C C C C C C
CWD Convierte Word a
Dword en DX:AX
CWDE Convierte Word a
Dword en EAX
DEC Decrementa entero R M C C C C C
DIV Division sin signo R M ? ? ? ? ? ?
ENTER Hace el marco de la pi-
la
I,0
IDIV Division con signo R M ? ? ? ? ? ?
IMUL Multiplicacion con sig-
no
R M
R16,R/M16
R32,R/M32
R16,I
R32,I
R16,R/M16,I
R32,R/M32,I
C ? ? ? ? C
INC Incremento entero R M C C C C C
INT Genera una interrup-
cion
I
JA Salta si esta sobre I
A.1. INSTRUCCIONES PARA ENTEROS 177
Banderas
JAE Salta si esta sobre o es
igual
I
JB Salta si esta bajo I
JBE Salta si esta bajo o es
igual
I
JC Salta si hay carry I
JCXZ Salta si CX = 0 I
JE Salta si es igual I
JG Salta si es mayor I
JGE Salta si es mayor o
igual
I
JL Salta si es menor I
JLE Salta si es menor o
igual
I
JMP Salto incondicional R M I
JNA Salta si no esta sobre I
JNAE Salta si no esta sobre o
es igual
I
JNB Salta si no esta bajo i
JNBE Salta si no esta bajo o
es igual
I
JNC Salta si no hay carry I
JNE Salta si no es igual I
JNG Salta si no es mayor I
JNGE Salta si no es mayor o
es igual
I
JNL Salta si no es menor I
JNLE Salta si no es menor o
igual
I
JNO Salta si no hay desbor-
de
I
JNS Salta si es positivo I
JNZ Salta si no es cero I
JO Salta si hay desborde I
JPE Salta si hay paridad
par
I
JPO Salta si hay paridad
impar
I
JS Salta si hay signo I
JZ Salta si hay cero I
178 AP

Banderas
LAHF Carga FLAGS en AH
LEA Carga direccion efecti-
va
R32,M
LEAVE Abandona el marco de
la pila
LODSB Carga byte
LODSW Carga palabra
LODSD Carga palabra doble
LOOP bocle I
LOOPE/LOOPZ Bucle si es igual I
LOOPNE/LOOPNZ Bucle si no es igual I
MOV Mueve datos O2
SR,R/M16
R/M16,SR
MOVSB Mueve byte
MOVSW Mueve palabra
MOVSD Mueve palabra doble
MOVSX Mueve con signo R16,R/M8
R32,R/M8
R32,R/M16
MOVZX Mueve sin signo R16,R/M8
R32,R/M8
R32,R/M16
MUL Multiplicacion sin sig-
no
R M C ? ? ? ? C
NEG Negacion R M C C C C C C
NOP No Opera
NOT Complemento a 1 R M
OR OR entre bits O2 0 C C ? C 0
POP Saca de la pila R/M16
R/M32
POPA Saca todo de la pila
POPF Saca FLAGS C C C C C C
PUSH Empuja en la pila R/M16
R/M32 I
PUSHA Empuja todo en la pila
PUSHF Empuja FLAGS
RCL Rota a la izquierda con
carry
R/M,I
R/M,CL
C C
A.1. INSTRUCCIONES PARA ENTEROS 179
Banderas
RCR Rota a la derecha con
carry
R/M,I
R/M,CL
C C
REP Repite
REPE/REPZ Repite si es igual
REPNE/REPNZ Repite si no es igual
RET Retorno
ROL Rota a la izquierda R/M,I
R/M,CL
C C
ROR Rota a la derecha R/M,I
R/M,CL
C C
SAHF Copia AH en FLAGS C C C C C
SAL Dezplazamiento a la
izquierda
R/M,I
R/M, CL
C
SBB Resta con prestamo O2 C C C C C C
SCASB busca un Byte C C C C C C
SCASW Busca una palabra C C C C C C
SCASD Busca una palabra
doble
C C C C C C
SETA ja sobre R/M8
SETAE ja sobre o igual R/M8
SETB ja bajo R/M8
SETBE ja bajo o igual R/M8
SETC ja el carry R/M8
SETE ja igual R/M8
SETG ja mayor R/M8
SETGE ja mayor o igual R/M8
SETL ja menor R/M8
SETLE ja menor o igual R/M8
SETNA ja no sobre R/M8
SETNAE ja no sobre o igual R/M8
SETNB ja no bajo R/M8
SETNBE ja no bajo o igual R/M8
SETNC ja no carry R/M8
SETNE ja no igual R/M8
SETNG ja no mayor R/M8
SETNGE ja no mayor o igual R/M8
SETNL ja no menor R/M8
SETNLE jan no menor o igual R/M8
SETNO ja no desborde R/M8
SETNS ja no signo R/M8
180 AP

Banderas
SETNZ ja no cero R/M8
SETO ja desborde R/M8
SETPE ja paridad par R/M8
SETPO ja paridad impar R/M8
SETS ja signo R/M8
SETZ ja cero R/M8
SAR Desplazamiento ar-
itmetico a la derecha
R/M,I
R/M, CL
C
SHR Desplazamiento logico
a la derecha
R/M,I
R/M, CL
C
SHL Desplazamiento logico
a la izquierda
R/M,I
R/M, CL
C
STC ja el carry 1
STD ja la bandera de di-
reccion
STOSB almacena byte
STOSW almacena palabra
STOSD almacena palabra
doble
SUB resta O2 C C C C C C
TEST comparacion logica R/M,R
R/M,I
0 C C ? C 0
XCHG Intercambio R/M,R
R,R/M
XOR XOR entre bits O2 0 C C ? C 0
A.2. INSTRUCCIONES DE PUNTO FLOTANTE 181
A.2. Instrucciones de punto otante
En esta seccion, se describen muchas de las instrucciones del coproce-
sador matematico del 80x86. La seccion de descripcion describe brevemente
la operacion de la instruccion. Para ahorrar espacio, la informacion sobre si
la instruccion saca de la pila no se da en la descripcion.
La columna de formato muestra que tipo de operandos se pueden suar
con cada instruccion. Se usan las siguientes abreviaturas
STn Un registro del coprocesador
F n umero de precision simple en memoria
D n umero de precision doble en memoria
E n umero de precision extendida en memoria
I16 palabra entera en memoria
I32 palabra doble entera en memoria
I64 palabra cuadruple entera en memoria
Las instrucciones que requieren un Pentium Pro o posterior estan mar-
cadas con un asterisco (
*
).
Instruccion Descripcion Formato
FABS ST0 = |ST0|
FADD src ST0 += src STn F D
FADD dest, ST0 dest += STO STn
FADDP dest [,ST0] dest += ST0 STn
FCHS ST0 = ST0
FCOM src Compara ST0 y src STn F D
FCOMP src Compara ST0 y src STn F D
FCOMPP src Compara ST0 y ST1
FCOMI
*
src Compara en FLAGS STn
FCOMIP
*
src Compara en FLAGS STn
FDIV src ST0 /= src STn F D
FDIV dest, ST0 dest /= STO STn
FDIVP dest [,ST0] dest /= ST0 STn
FDIVR src ST0 = src /ST0 STn F D
FDIVR dest, ST0 dest = ST0/dest STn
FDIVRP dest [,ST0] dest = ST0/dest STn
FFREE dest Marca como vaco STn
FIADD src ST0 += src I16 I32
FICOM src Compara ST0 y src I16 I32
FICOMP src Compara ST0 y src I16 I32
FIDIV src STO /= src I16 I32
FIDIVR src STO = src /ST0 I16 I32
182 AP

Instruccion Descripcion Formato
FILD src Push src on Stack I16 I32 I64
FIMUL src ST0 *= src I16 I32
FINIT Inicia el coprocesador
FIST dest almacena ST0 I16 I32
FISTP dest almacena ST0 I16 I32 I64
FISUB src ST0 -= src I16 I32
FISUBR src ST0 = src - ST0 I16 I32
FLD src empuja src en la pila STn F D E
FLD1 empuja 1.0 en la pila
FLDCW src Load Control Word Register I16
FLDPI empuja en la pila
FLDZ empuja 0.0 en la pila
FMUL src ST0 *= src STn F D
FMUL dest, ST0 dest *= STO STn
FMULP dest [,ST0] dest *= ST0 STn
FRNDINT Redondea ST0
FSCALE ST0 = ST0 2
ST1
FSQRT ST0 =
STO
FST dest almacena ST0 STn F D
FSTP dest almacena ST0 STn F D E
FSTCW dest Store Control Word Register I16
FSTSW dest Store Status Word Register I16 AX
FSUB src ST0 -= src STn F D
FSUB dest, ST0 dest -= STO STn
FSUBP dest [,ST0] dest -= ST0 STn
FSUBR src ST0 = src -ST0 STn F D
FSUBR dest, ST0 dest = ST0-dest STn
FSUBP dest [,ST0] dest = ST0-dest STn
FTST Compare ST0 with 0.0
FXCH dest Intercambia ST0 y dest STn
Indice alfabetico
, 12
tipos de almacenamiento
automatic, 96
register, 96
volatile, 96
ADC, 39, 56
ADD, 13, 39
AND, 52
archivo de listado, 2526
archivo esqueleto, 26
Aritmetica de complemento a dos,
35
array1.asm, 101105
arreglos, 97118
acceso, 99105
deninir
estatico, 97
variable local, 98
denir, 9798
multidimensional, 108
dos dimensiones, 105107
parametros, 108
multidimensionales, 105
bandera de paridad, 41
binario, 12
suma, 2
BSWAP, 62
bucle do while, 45
bucle while, 45
byte, 4
C driver, 19
C++, 153174
clases, 159174
ejemplo Big int, 161166
encadenamiento seguro de tipos,
154
extern C , 155156
funciones inline, 157159
funciones miembro, vease meto-
dos
herencia, 166174
manipulacion de nombres, 153
156
polimorsmo, 169174
primer vnculo, 172
referencias, 156157
vnculo tardo, 172
vtable, 172174
CALL, 7172
CBW, 33
CDQ, 33
CLC, 39
CLD, 109
CMP, 40
CMPSB, 111, 112
CMPSD, 111, 112
CMPSW, 111, 112
codigo de operacion, 11
COM, 174
Compilador
Watcom, 86
compilador, 5, 12
Borland, 23, 24
DJGPP, 23, 24
gcc, 23
attibute , 86
183
184

INDICE ALFAB
ETICO
attribute , 147, 148, 152
Microsoft, 23
embalado pragma, 147
pragma pack, 148, 152
compiler
gcc
attribute , 151
Microsoft
pragma pack, 151
complemento a dos, 3032
aritmetica, 39
constructor copia, 164
contando bits, 6266
metodo dos, 6365
metodo tres, 6566
metodo uno, 6263
convencion de llamado, 80, 8687
cdecl, 87
stdcall, 87
C, 22, 74, 8387
etiquetas, 85
etiquetas , 84
parametros, 85
parametros, 85
registros, 84
retorno de valores, 86
valores de retorno, 86
llamado estandar, 87
Pascal, 74
registro, 87
stdcall, 87, 174
convenciones de llamado, 67, 72
stdcall, 74
coprocesador de punto otante, 127
142
carga y almacenamiento de datos,
128
cargar y almacenar datos, 128
comparaciones, 131132
hardware, 127
multiplicacion and division, 130
131
suma y resta, 129130
CPU, 57
80x86, 6
CWDE, 33
decimal, 1
depuracion, 1819
direccionamiento indirecto, 6768
arreglos, 101105
directiva, 1416
%dene, 14
DX, 97
datos, 1516
equ, 14
extern, 80
global, 22, 83
RESX, 98
TIMES, 97
directive
global, 81
DIV, 36, 50
ejecucion especulativa, 56
encadenando, 24
encadenar, 24
endianess, hyperpage60, 26 62
invert endian, 62
ensamblador, 12
enteros, 2940
bit de signo, 29, 33
comparaciones, 40
con signo, 2932, 40
division, 3637
extension de signo, 35
extension del signo, 32
multiplicacion, 3536
precision extendida, 39
representacion, 2935
complemento a dos, 30
magnitud y signo, 29
representacion de complemen-
to a uno, 30
INDICE ALFAB
ETICO 185
representacion en complemen-
to a dos, 32
sin signo, 29, 40
estructuras, 145153
alineamiento, 146148
campos de bit, 151
campos de bits, 148
osetof(), 146
etiqueta, 16
FABS, 133
FADD, 129
FADDP, 129
FCHS, 133
FCOM, 131
FCOMI, 132
FCOMIP, 132, 143
FCOMP, 131
FCOMPP, 131
FDIV, 131
FDIVP, 131
FDIVR, 131
FDIVRP, 131
FFREE, 128
FIADD, 129
FICOM, 131
FICOMP, 131
FIDIV, 131
FIDIVR, 131
FILD, 128
FIST, 128
FISUB, 130
FISUBR, 130
FLD, 128
FLD1, 128
FLDCW, 128
FLDZ, 128
FMUL, 130
FMULP, 130
FSCALE, 133, 144
FSQRT, 133
FST, 128
FSTCW, 128
FSTP, 128
FSTSW, 132
FSUB, 130
FSUBP, 130
FSUBR, 130
FSUBRP, 130
FTST, 131
FXCH, 128
gas, 160
GHz, 6
hexadecimal, 34
I/O, 1719
asm io library, 1719
dump math, 18
dump mem, 18
dump regs, 18
dump stack, 18
print char, 17
print int, 17
print nl, 17
print string, 17
read char, 17
read int, 17
IDIV, 37
immediato, 13
IMUL, 3536
instruccion if, 44
instruccion if , 45
instrucciones de cadena, 108118
Interfazando con C, 83
interfazando con C, 91
interrupcion, 10
JC, 42
JE, 43
JG, 43
JGE, 43
JL, 43
JLE, 43
JMP, 4041
JNC, 42
186

INDICE ALFAB
ETICO
JNE, 43
JNG, 43
JNGE, 43
JNL, 43
JNLE, 43
JNO, 42
JNP, 42
JNS, 42
JNZ, 42
JO, 42
JP, 42
JS, 42
JZ, 42
LAHF, 132
LEA, 8586, 105
lenguaje de maquina, 5, 11
lenguaje ensamblador, 1213
localidad, 145
LODSB, 109
LODSD, 109
LODSW, 109
LOOP, 44
LOOPE, 44
LOOPNE, 44
LOOPNZ, 44
LOOPZ, 44
metodos, 159
MASM, 12
math.asm, 3739
memoria, 45
paginas, 10
segmento, 10
segmentos, 9
virtual, 10
memoria:segmentos, 9
memory.asm, 113118
modo protegido
16 bits, 10
16-bits, 9
32-bits, 10
modo real, 89
MOV, 13
MOVSB, 111
MOVSD, 111
MOVSW, 111
MOVSX, 33
MOVZX, 33
MUL, 3536, 50, 105
NASM, 12
NEG, 58
nibble, 4
NOT, 54
Operaciones con bits
desplazamientos, 49
desplazamientos logicos, 49
operaciones con bits
AND, 52
C, 5860
desplazamientos, 52
desplazamiento logicos, 50
desplazamientos aritmeticos,
5051
rotaciones, 51
ensamblador, 5455
OR, 53
XOR, 53
operciones con bits
NOT, 53
OR, 53
pila, 7080
parametros, 72
variables locales, 7880, 8586
prediccion de ramicaciones, 56
prediccioon de ramicaciones, 55
prime.asm, 4648
prime2.asm, 138142
programas multimodulo, 8083
punto otante, 119142
aritmetica, 124126
representacion, 119124
desnormalizada, 123
INDICE ALFAB
ETICO 187
desnormalizado, 123
IEEE, 121124
precision doble, 124
precision simple, 123
presicion simple, 122
uno oculto, 122
representacioon
precision doble, 124
quad.asm, 133136
RCL, 51
RCR, 51
read.asm, 136138
recursion, 9194
registro, 5, 78
ndice, 7
32-bit, 8
apuntador a la pila, 7, 8
apuntador base, 7, 8
EDI, 109
EDX:EAX, 36, 37, 39, 86
EFLAGS, 8
EIP, 8
ESI, 109
FLAGS, 8, 40
CF, 40
DF, 109
OF, 40
SF, 40
ZF, 40
IP, 8
segmento, 7, 8, 109
registros
FLAGS
PF, 41
registrp
IP, 8
reloj, 6
REP, 110111
REPE, 112, 113
REPNE, 112, 113
REPNZ, vease REPNE, 112
REPZ, vease REPE, 112
RET, 7172, 74
ROL, 51
ROR, 51
SAHF, 132
SAL, 50
salto condicional, 4143
SAR, 50
SBB, 39
SCASB, 111, 112
SCASD, 111, 112
SCASW, 111, 112
SCSI, 149150
segmento bss, 22
segmento de codigo, 22
segmento de datos, 22
segmento text, vease segmento code
SETxx, 56
SETG, 57
SHL, 49
SHR, 49
stack
parameters, 75
STD, 109
STOSB, 109
STOSD, 109
SUB, 13, 39
subprograma, 6896
llamado, 7180
reentrante, 9192
subrutina, vease subprograma
TASM, 12
TCP/IP, 61
TEST, 54
tipos de alamcenamiento
global, 94
tipos de almacenamiento
static, 94
UNICODE, 61
virtual, 170
188

INDICE ALFAB
ETICO
word, 8
XCHG, 62
XOR, 53

Lenguaje Ensamblador para PC

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Lenguaje Ensamblador para PC

Uploaded by

Copyright:

Available Formats

Lenguaje Ensamblador para PC

ITULO 2. LENGUAJE ENSAMBLADOR B

ITULO 2. LENGUAJE ENSAMBLADOR B

ITULO 2. LENGUAJE ENSAMBLADOR B

ITULO 2. LENGUAJE ENSAMBLADOR B

ITULO 2. LENGUAJE ENSAMBLADOR B

ITULO 2. LENGUAJE ENSAMBLADOR B

ITULO 2. LENGUAJE ENSAMBLADOR B

ITULO 2. LENGUAJE ENSAMBLADOR B

ITULO 2. LENGUAJE ENSAMBLADOR B

ITULO 2. LENGUAJE ENSAMBLADOR B

ITULO 3. OPERACIONES CON BITS

ITULO 3. OPERACIONES CON BITS

ITULO 3. OPERACIONES CON BITS

ITULO 3. OPERACIONES CON BITS

ITULO 3. OPERACIONES CON BITS

ITULO 3. OPERACIONES CON BITS

ITULO 3. OPERACIONES CON BITS

ITULO 3. OPERACIONES CON BITS

ITULO 3. OPERACIONES CON BITS

ITULO 6. PUNTO FLOTANTE

ON DE PUNTO FLOTANTE 121

ITULO 6. PUNTO FLOTANTE

ON DE PUNTO FLOTANTE 123

ITULO 6. PUNTO FLOTANTE

ETICA DE PUNTO FLOTANTE 125

ITULO 6. PUNTO FLOTANTE

ITULO 6. PUNTO FLOTANTE

ITULO 6. PUNTO FLOTANTE

ITULO 6. PUNTO FLOTANTE

STO Toma la raz cuadrada de ST0

ITULO 6. PUNTO FLOTANTE

ITULO 6. PUNTO FLOTANTE

ITULO 6. PUNTO FLOTANTE

ITULO 6. PUNTO FLOTANTE

ITULO 6. PUNTO FLOTANTE

ITULO 6. PUNTO FLOTANTE

ITULO 7. ESTRUCTURAS Y C++

ITULO 7. ESTRUCTURAS Y C++

ITULO 7. ESTRUCTURAS Y C++

ITULO 7. ESTRUCTURAS Y C++

ITULO 7. ESTRUCTURAS Y C++

ITULO 7. ESTRUCTURAS Y C++

ITULO 7. ESTRUCTURAS Y C++

ITULO 7. ESTRUCTURAS Y C++

ITULO 7. ESTRUCTURAS Y C++

ITULO 7. ESTRUCTURAS Y C++

ITULO 7. ESTRUCTURAS Y C++

ITULO 7. ESTRUCTURAS Y C++

ITULO 7. ESTRUCTURAS Y C++

ITULO 7. ESTRUCTURAS Y C++

ITULO 7. ESTRUCTURAS Y C++

ENDICE A. INSTRUCCIONES DEL 80X86

ENDICE A. INSTRUCCIONES DEL 80X86

ENDICE A. INSTRUCCIONES DEL 80X86

ENDICE A. INSTRUCCIONES DEL 80X86

You might also like