Professional Documents
Culture Documents
Ing. en Electrnica
Ctedra:
INFORMTICA I
Ciclo lectivo: 2011
REPRESENTACIN DE LA INFORMACIN
Introduccin
Los seres humanos recibimos informacin a travs de nuestros sentidos. Todos ellos nos
permiten captar informacin e incluso transmitirla, pero cuando pretendemos plasmar la informacin
de una forma ms o menos permanente, necesitamos recurrir a algn soporte fsico que la pueda
contener. Existe una variedad de soportes fsicos y algunos muy modernos, pero un medio que sigue
en plena vigencia es la escritura. Los mtodos han evolucionado (buril y losa de piedra, luego con
punzn y tablilla encerada, y despus con papel y tinta), pero el fundamento sigue siendo el mismo:
poner en la secuencia conveniente una serie de smbolos escogidos dentro de un conjunto
predefinido. De este modo, la informacin se representa en base a cadenas de smbolos.
En base a un alfabeto convencional cualquiera, siempre que exista un acuerdo cultural de entendimiento entre el que escribe y el que lee, podemos representar cualquier informacin compuesta
de palabras y cantidades numricas. Un alfabeto es un conjunto fijado, por acuerdo cultural, de smbolos elementales en base a los cuales se representa la informacin. Cualquier alfabeto se fija
arbitrariamente, y esto es muy importante, porque si la Informtica ha logrado el tratamiento automtico de la informacin con computadoras, ha sido gracias a este concepto.
No es necesario que el alfabeto que usa una computadora en su interior sea el mismo que utiliza el hombre que la ha construido y la maneja. Basta con que la transformacin de los smbolos
internos a los externos o viceversa se efecte de una manera sencilla, de ser posible automticamente por la propia computadora.
Como podemos ver, entonces, uno de los aspectos ms importantes que se presentan en informtica, relacionados con la informacin, es cmo representarla.
1. Sistemas de numeracin
Un sistema de numeracin es un conjunto de smbolos y reglas que permiten representar
datos numricos. Los sistemas de numeracin actuales son sistemas posicionales, que se
caracterizan porque un smbolo tiene distinto valor segn la posicin que ocupa en la cifra.
Los nmeros pueden representarse en diversos sistemas de numeracin, que se diferencian
por su base. La base de un sistema de numeracin es la cantidad de smbolos distintos utilizados para
la representacin de los valores en dicho sistema.
El sistema de numeracin que utilizamos habitualmente es el sistema decimal, cuya base es
10, por poseer diez smbolos distintos: 0-1-2-3-4-5-6-7-8-9. El sistema de numeracin utilizado en la
implementacin de los sistemas digitales es el sistema binario, de base 2, en el cual existen solamente
dos smbolos: 0-1.
Representacin posicional de los nmeros. Notacin expandida
En un sistema de base b un nmero N cualquiera se puede representar mediante una suma de
potencias de la base ponderadas por el valor del smbolo que le corresponde.
n
n-1
N = an b + an-1 b
en donde:
Ej.
n-2
+ an-2 b
-1
-m
-1
-2
87,54)10 = 8 x 10 + 7 x 10 + 5 x 10 + 4 x 10
2
-1
101,1)2 = 1 x 2 + 0 x 2 + 1 x 2 + 1 x 10
Pg. 1
Informtica I
a) Sistema decimal
El sistema de numeracin que utilizamos habitualmente es el decimal, que se compone de
diez smbolos o dgitos (0, 1, 2, 3, 4, 5, 6, 7, 8 y 9) a los que otorga un valor dependiendo de la
posicin que ocupen en la cifra: unidades, decenas, centenas, etc.
Como en todo sistema de numeracin posicional, podemos expresar un nmero con su representacin expandida en donde el valor de cada dgito est asociado al de una potencia de base
10, nmero que coincide con la cantidad de smbolos o dgitos del sistema decimal, y un exponente
igual a la posicin que ocupa el dgito menos uno, contando desde la derecha.
Ej. 528 = 5 centenas + 2 decenas + 8 unidades, es decir:
= 500 + 20 + 8
2
= 5 x 10 + 2 x 10 + 8 x 10
En el caso de nmeros con decimales, la situacin es anloga aunque, en este caso, algunos
exponentes de las potencias sern negativos, concretamente el de los dgitos colocados a la derecha
del separador decimal.
Ej. 528,36 = 5 centenas + 2 decenas + 8 unidades + 3 dcimos + 6 cntimos
= 500 + 20 + 8 + 0,3 + 0,06
2
-1
-2
= 5 x 10 + 2 x 10 + 8 x 10 + 3 x.10 + 6 x 10
b) Sistema binario
Este sistema utiliza solamente 2 smbolos diferentes: 0 y 1 que reciben el nombre de bit (binary
digit). Tambin es un sistema posicional. Resolviendo la notacin expandida de un nmero binario se
obtiene su representacin en decimal.
Binario
Decimal
Binario
Decimal
0000
0001
0010
0011
0100
0101
0110
0111
0
1
2
3
4
5
6
7
1000
1001
1010
1011
1100
1101
1110
1111
8
9
10
11
12
13
14
15
Como regla general, con n dgitos binarios pueden representarse un mximo de 2 , nmeros.
n
El nmero ms grande que puede escribirse con n dgitos es una unidad menos, es decir, 2 1. Con
4
cuatro bits, por ejemplo, podemos representar un total de 16 nmeros (porque 2 = 16), es decir, de 0
n
a 15, que es 2 1.
c) Sistema octal
Es un sistema de numeracin posicional en el que existen 8 smbolos diferentes:
01234567
Representacin de la informacin
Pg. 2
Informtica I
Octal
Binario
Decimal
Octal
Binario
Decimal
0
1
2
3
000
001
010
011
0
1
2
3
4
5
6
7
100
101
110
111
4
5
6
7
d) Sistema hexadecimal
Tambin es un sistema de numeracin posicional que tiene 16 smbolos diferentes:
0123456789ABCDEF
Hexadecimal
Binario
Decimal
Hexadecimal
Binario
Decimal
0
1
2
3
4
5
6
7
0000
0001
0010
0011
0100
0101
0110
0111
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
1000
1001
1010
1011
1100
1101
1110
1111
8
9
10
11
12
13
14
15
-1
101,1)2 = 1 x 2 + 0 x 2 + 1 x 2 + 1 x 2 = 5,5)10
1
-1
23,1)8 = 2 x 8 + 3 x 8 + 1 x 8
2
= 19,125)10
-1
1A3,B)8 = 1 x 16 + 10 x 16 + 3 x 16 + 11 x 16 = 419,6875)10
b) De decimal a representacin en base b
Para convertir un nmero decimal a su representacin en un sistema de numeracin de base b
es necesario separar al nmero en dos partes:
Parte entera:
Divida la parte entera del nmero N y cada cociente sucesivo por b hasta obtener
un cociente 0. La sucesin de residuos en orden inverso da la representacin en
base b del nmero N.
Parte fraccionaria:
Ej. 26,25)10
Representacin de la informacin
Pg. 3
Informtica I
Parte decimal
Resultado
Parte Entera
0,25 x 2
0,50
0,50 x 2
1,00
0,00 x 2
0,00
26,25)10 = 11010,010)2
10011,0101)2 =
3 ,
4)8
111011,00101)2 = 3
B , 2
8)16
Representacin de la informacin
Pg. 4
Informtica I
Nmero decimal
Signo
Valor absoluto
Signo y magnitud
-342
342
000000101010110
1000000101010110
342
342
000000101010110
0000000101010110
-23
23
000000000010111
1000000000010111
Si utilizamos una codificacin de nmeros enteros mediante signo y magnitud de n bits, slo
n-1
n-1
podremos representan los enteros comprendidos en el intervalo [-2 -1,2 -1]. Esta expresin se
deriva de que el mayor nmero posible es aquel que comienza por un cero seguido de unos y que
n-1
corresponde precisamente al valor 2 -1. Anlogamente, el menor nmero representado es el que
tiene todos los dgitos a 1 y corresponde con el anterior lmite, pero negativo. As, con 8 bits podemos
representar los nmeros entre -127 (11111111) y 127 (01111111).
Analicemos ahora cmo se representa el 0 que es un nmero que no tiene signo, y por tanto
la representacin formada por slo ceros y la formada por ceros con un uno a la izquierda deberan
ser equivalentes. Esto quiere decir que un mismo elemento se representa por dos combinaciones de
bits distintas, con lo que se est desperdiciando la codificacin de un nmero adicional. Existe una
codificacin alternativa que no tiene esta anomala y se denomina complemento a dos.
n
En el sistema binario, el complemento a la base menos 1 o complemento a uno se obtiene invirtiendo el estado de todas sus cifras, incluyendo los ceros a la izquierda hasta completar la
capacidad del bloque.
Ej.:
La conversin de un nmero N expresado como complemento a uno con n bits a su representacin en base 10 se realiza mediante las siguientes reglas:
ABS ( N ) (2 n ) + 1
donde ABS(N) representa el nmero en base 10 que se obtiene al interpretar los bits en N como
un nmero natural.
Por ejemplo, considrese el clculo del valor en base 10 del nmero en complemento a uno
de ocho bits 11101100. Como el bit de ms peso es 1, el nmero es negativo. Su valor en base 10
es, por tanto:
Representacin de la informacin
Pg. 5
Informtica I
n
ABS ( N ) (2 n )
donde ABS(N) representa el nmero en base 10 que se obtiene al interpretar los bits en N como
un nmero natural.
Por ejemplo, considrese el clculo del valor en base 10 del nmero en complemento a uno
de ocho bits 11101101. Como el bit de ms peso es 1, el nmero es negativo. Su valor en base 10
es, por tanto:
n
Pg. 6
Informtica I
De esta forma podemos expresar nmeros muy grandes o nmeros muy pequeos como un
nmero multiplicado por una potencia de la base.
4
-2
A = M x 10
donde el punto decimal aparece directamente en frente del primer dgito no nulo en M. A esto
se le llama forma exponencial normalizada de A. Al nmero M se le llama "mantisa" de A y al
exponente n se le llama "exponente" de A.
Ej.
567 = 0,567 x 10
De la misma forma, los nmeros binarios, se pueden expresar en forma exponencial usando
potencias de dos en lugar de potencias de diez.
Cada nmero binario no nulo tiene una nica forma exponencial normalizada, en la cual la
coma aparece antes del primer bit 1. Esto da una nica mantisa M y un nico entero n que representa
el exponente de dos. Cualquiera de estos nmeros puede ser positivo o negativo y el exponente n
tambin puede ser 0. Por ejemplo:
11011,011 = 1101,1011 * 2
2
110,11011 * 2
3
11,011011 * 2
4
1,1011011 * 2
5
0,11011011 * 2
Los nmeros reales, por tanto, se representan de forma tal que su primera cifra significativa
en la mantisa sea aquella que est a la derecha de la coma y se multiplica por la potencia pertinente
de la base. La codificacin de los nmeros reales en base 2 consta de dos partes:
Signo
Exponente
Mantisa
1 bit
8 bits
23 bits
Signo: representa el signo del nmero a representar (el signo de la mantisa) y mantenemos la
misma convencin que en el caso de la codificacin de enteros como signo y magnitud: el signo
positivo se representa como 0 y el negativo como 1.
Mantisa: representa la parte decimal del nmero. Debe comenzar con un 1 en su primer bit (de lo
contrario no estara normalizado) y se rellena con ceros a la derecha en caso de ser necesario para
completar los 23 bits.
Exponente: el exponente representa la potencia de dos a la que est elevada la base correspondiente (2) y es un nmero entero, por tanto se puede utilizar cualquiera de las tcnicas de
codificacin presentadas anteriormente. La ms comn es complemento a 2.
Por ejemplo, para representar el nmero decimal 27,25 utilizando esta tcnica de representacin,
obtendramos:
27,25)10 = 10011,01)2
Normalizamos este nmero obtenemos:
5
0,1001101 * 2
El exponente es 5 = 00000101) 2
El complemento a la base es 11111010) 2 + 1) 2 = 11111011) 2
Signo
Exponente
Mantisa
11111011
10011010000000000000000
Representacin de la informacin
Pg. 7
Informtica I
Esta tcnica de representacin tiene un lmite para expresar los nmeros reales. Debido a la
cantidad de dgitos utilizados para su representacin, existe un nmero mnimo y un nmero mximo
posibles de ser almacenados. Estos nmeros son:
Para el exponente, como utilizamos complemento a 2 con 8 bits, las cotas -128 y 127.
Si en cambio representamos el exponente como signo y magnitud, al utilizar 7 bits, las cotas
son 0 y 127 pero si consideramos el bit del signo, las cotas reales seran -127 y 127.
Con respecto a la mantisa, valen las mismas consideraciones mencionadas anteriormente.
No podremos expresar nmeros que requieran ms de 23 dgitos binarios para su representacin.
25
Por ejemplo, si queremos expresar 2 1 (que no es un nmero tan grande), se nos presentar el
inconveniente de no poder colocar todos los bits necesarios en el espacio reservado para la mantisa.
(Los lenguajes de programacin resuelven estas situaciones de diversas formas).
5. Aritmtica binaria
Las operaciones aritmticas con nmeros que no estn representados en el sistema decimal
se pueden realizar convirtiendo los operandos a este sistema, realizando las operaciones aritmticas
deseadas, y reconvirtiendo los resultados a nmeros de la base original. Este procedimiento no se
recomienda para operaciones aritmticas binarias, que son sumamente simples, pero puede ser
conveniente para operaciones hexadecimales complicadas.
Las reglas de la aritmtica son las mismas en todos los sistemas de numeracin posicional.
Por ello, basta slo recordar las reglas correspondientes de la aritmtica decimal para poder efectuar
operaciones aritmticas con nmeros de cualquier otra base.
a) Suma binaria: Es similar a la suma decimal excepto que se manejan slo dos dgitos (0 y 1). Las
sumas bsicas son:
0+0=0
0+1=1
1+0 =1
1 + 1 = 10
Ej.
100110101 + 11010101
.
Se comienza a sumar desde la izquierda, en el ejemplo, 1 + 1 = 10, entonces escribimos 0 y
llevamos" 1. Se suma este 1 a la siguiente columna: 1 + 0 + 0 = 1, y seguimos hasta terminar todas
la columnas (de la misma forma que lo hacemos en el sistema decimal).
b) Resta binaria: Es semejante a la decimal excepto que se utilizan dos dgitos y teniendo en cuenta
que se realizan las restas parciales entre dos dgitos de idnticas posiciones, uno del minuendo y otro
del sustraendo, si el segundo excede al primero, se pide y resta una unidad al dgito que est a la
izquierda en el minuendo (si existe y vale 1), convirtindose este ltimo en 0 y equivaliendo la unidad
extrada a 10 en el minuendo de resta parcial que estamos realizando. Si es 0 el dgito siguiente a la
izquierda, se busca en los sucesivos dgitos hasta encontrar un dgito que valga 1.
Las restas bsicas son:
0-0=0
0 - 1 = No se puede realizar.
1-0=1
1-1=0
Representacin de la informacin
Pg. 8
Informtica I
Ej. Realicemos primero una resta en el sistema decimal y luego hagamos lo mismo en el sistema
binario.
c) Multiplicacin binaria: La multiplicacin se realiza igual que en el sistema decimal. Para realizar
la multiplicacin binaria debemos tener en cuenta que:
0*0=0
0*1=0
1*0=0
1*1=1
Ejemplo: 10110 * 1001 =
d) Divisin binaria: La divisin se realiza en forma semejante al decimal, con la salvedad que las
multiplicaciones y restas internas del proceso de la divisin se realizan en binario. Debemos tener en
cuenta que:
0 / 0 = indeterminado
0/1=0
1 / 0 = infinito
1/1=1
Pg. 9
Informtica I
1000111 10010
bien como el complemento a la base
de 0010010 es 1101101 + 1 = 1101110
6. Lgica binaria
Como ya sabemos, una de las funciones de la Unidad Aritmtico Lgica (ALU), situada en el
ncleo del procesador es la de realizar las operaciones lgicas con los datos contenidos en una
instruccin de un programa.
La lgica binaria trabaja con variables binarias y operaciones lgicas. De esta forma, las variables slo pueden tomar dos valores discretos: V (verdadero) y F (falso); aunque tambin se pueden
denotar como s y no, 1 y 0 respectivamente.
Una operacin lgica asigna un valor (V F) a la combinacin de condiciones (V F) de una
o ms variables. Y el resultado de una operacin lgica puede ser, tan slo, V F.
Los resultados de una operacin lgica, para cada uno de los valores posibles de las variables, se fijan en una tabla denominada Tabla de Verdad.
Para que un procesador pueda ejecutar las operaciones lgicas, es preciso asignar un valor
binario a cada una de las condiciones posibles. Se suele asignar un UNO (1) al valor VERDADERO y
un CERO (0) al valor FALSO, con el criterio denominado lgica positiva.
Las operaciones lgicas fundamentales son: AND, OR y NOT
a) AND
La funcin AND equivale a la conjuncin copulativa Y: El resultado R de aplicar la funcin lgica AND, sobre dos variables a y b es el siguiente: R es V si a es V (1) y si b es V (1)
Cuando se aplica una operacin lgica sobre 2 variables caben 4 combinaciones posibles.
Los resultados de la operacin lgica AND, en las cuatro combinaciones posibles de valores de dos
variables, se muestran en la siguiente tabla de verdad:
Representacin de la informacin
a AND b
Pg. 10
Informtica I
Una aplicacin de la operacin lgica AND, sera el sistema de control de los pasajeros en un
aeropuerto. Cada pasajero debe pasar por tres controles: Tiene tarjeta de embarque? Tiene pasaporte en regla? No lleva objetos metlicos peligrosos? Una empleada del aeropuerto comprueba
que tiene un billete vlido y le da una tarjeta de embarque; a continuacin, un agente de polica
verifica que su pasaporte est en regla y no est en la lista de personas reclamadas y, finalmente, un
grupo de agentes comprueban su equipaje de mano con un escner y un arco detector de metales.
Un pasajero slo puede embarcar en el avin (1) si tiene tarjeta de embarque (1), su pasaporte est
en regla (1) y no lleva consigo objetos peligrosos (1). En los dems casos no puede embarcar (0).
b) OR
La funcin OR equivale a la conjuncin disyuntiva O. El resultado R de aplicar la funcin lgica OR, sobre dos variables a y b es el siguiente: R es V si a es V (1) O si b es V (1)
Los resultados de la operacin lgica OR, en las cuatro combinaciones posibles de valores de
dos variables, se muestran en la siguiente tabla de verdad
a
a OR b
Una aplicacin prctica de la operacin lgica OR, sera el circuito de sealizacin instalado
en un comercio, en el que se puede entrar por dos puertas distintas, que avisa al encargado que
entr un cliente por cualquiera de las dos puertas del establecimiento. Si un cliente entra por la puerta
a (1) O si un cliente entra por la puerta b (1), el timbre suena (1). Si no entra ningn cliente por ninguna de las puertas a (0) ni b (0), el timbre NO suena (0).
c) NOT
El resultado R de aplicar la funcin lgica NOT, sobre una variable a es: Si a es V (1), R es F
(0) y si a es F (0), R es V (1).
Los resultados de esta operacin se muestran en la siguiente tabla de verdad:
a
NOT a
Esta operacin tambin se conoce tambin como funcin negacin: R equivale a la variable a
negada.
Un ejemplo sencillo de aplicacin prctica de esta funcin lgica sera el circuito que controla
el acceso a una oficina bancaria, a travs de una puerta automtica equipada con un detector de
metales que cierra un interruptor. Si el detector de metales SI nota que el cliente lleva objetos metlicos (1), la puerta NO se abre (0); en cambio, si el cliente NO lleva objetos metlicos (0), la puerta SI
se abre (1).
d) OR EXCLUSIVA (XOR)
El resultado R de aplicar la funcin lgica OR EXCLUSIVA, sobre dos variables a y b es el siguiente: R es V (1) slo si a es V (1) si b es V (1), pero no si ambas variables son V (1) al mismo
tiempo
Representacin de la informacin
Pg. 11
Informtica I
a XOR b
7. Representacin de textos
Las computadoras no slo necesitan representar y manipular nmeros, tambin necesitar representar texto.
Normalmente, se le proporciona informacin a la computadora en la forma que usualmente la
escribimos. Es necesario traducir toda la informacin suministrada a una combinacin de ceros y
unos, por lo tanto, es necesario codificarla estableciendo una correspondencia entre el conjunto de
todos los smbolos y el conjunto binario. Es necesario representar los elementos de un conjunto
mediante los de otro de forma tal que a cada elemento del primer conjunto le corresponda un nico
elemento (o combinacin de elementos) del segundo conjunto.
Estos cdigos de transformacin se denominan cdigos de Entrada/Salida.
Si consideramos que un texto es una secuencia de smbolos, la definicin de una codificacin
de un texto (conjunto de smbolos) requiere de tres datos:
el conjunto de smbolos,
el nmero de bits a utilizar en la codificacin,
la correspondencia entre cada smbolo del conjunto y la secuencia de bits que lo representa.
n
Representacin de la informacin
Pg. 12
Informtica I
Tabla ASCII:
Valor
Smbolo
Valor
Smbolo
Valor
Smbolo
Valor
Smbolo
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
NUL
SOH
STX
ETX
EOT
ENQ
ACK
BEL
BS
TAB
LF
VT
FF
CR
SO
SI
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
DLE
DC1
DC2
DC3
DC4
NAK
SYN
ETB
CAN
EM
SUB
ESC
FS
GS
RS
US
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
(espacio)
!
"
#
$
%
&
'
(
)
*
+
,
.
/
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
0
1
2
3
4
5
6
7
8
9
:
;
<
=
>
?
Valor
Smbolo
Valor
Smbolo
Valor
Smbolo
Valor
Smbolo
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
@
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
P
Q
R
S
T
U
V
W
X
Y
Z
[
\
]
^
_
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
`
a
b
c
d
e
f
g
h
i
j
k
l
m
n
o
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
p
q
r
s
t
u
v
w
x
y
z
{
|
}
~
Smbolo
Valor
Smbolo
Valor
Smbolo
Valor
Smbolo
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
Representacin de la informacin
Pg. 13
Informtica I
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
b) Unicode
Unicode es un estndar industrial cuyo objetivo es proporcionar el medio por el cual un texto
en cualquier forma e idioma pueda ser codificado para el uso informtico. El establecimiento de
Unicode ha involucrado un ambicioso proyecto para reemplazar los esquemas de codificacin de
caracteres existentes, muchos de los cuales estn muy limitados en tamao y son incompatibles con
entornos multilinges.
Esta codificacin permite representar mucha ms cantidad de smbolos que el cdigo ASCII.
Los primeros 256 cdigos son idnticos al contenido del ISO 8859-1, para facilitar la conversin del
texto occidental existente. Unicode ha sufrido varias modificaciones, o mejor dicho, ampliaciones, que
le permiten representar smbolos de casi todos los alfabetos e idiomas existentes al da de hoy. Tiene
smbolos rabes, cirlicos, griegos, coreanos, japoneses, chinos, mongoles, tailandeses, y hasta
braille. Tambin se est estudiando la posibilidad de incluir caracteres que ya no se utilizan, solo para
fines histricos, como smbolos cuneiformes, fenicios, sumerios, rnicos, etc.
El Consorcio Unicode, con sede en California (EE.UU.), public la primera versin del Estndar Unicode en 1991, y sigue desarrollando estndares basados en el original. Fue desarrollado
conjuntamente con la Organizacin Internacional para la Estandarizacin (ISO) en la norma ISO/IEC
10646.
Unicode define dos mtodos de "mapeo" o de localizacin de caracteres: la codificacin UTF
(Unicode Transformation Format) Formato de Transformacin Unicode, que en es de longitud variable; y la codificacin UCS (Universal Character Set) Juego de Caracteres Universal, que es de
longitud fija. Los sistemas operativos Windows posteriores al Windows 3.1 utilizan Unicode, en su
codificacin UCS-2. Esto significa que utilizan 2 bytes por cada cdigo, con lo cual pueden representar 65535 smbolos diferentes. Los sistemas operativos derivados del Unix (como Linux) utilizan
Unicode, en su codificacin UTF-8 (aunque puede cambiarse). Esto significa que utiliza comnmente
1, 2 3 bytes (pero podra utilizar hasta 6), y para la mayora de los textos con alfabeto latino (espaol, ingls, francs, portugus, etc.) basta con 1 byte por cdigo.
Representacin de la informacin
Pg. 14