Television Analogia y Digital

POLITEXT
EDICIONS UPC
Francesc Tarrs Ruiz
Sistemas audiovisuales
1 - Televisin analgica y digital
Primera edicin: junio de 2000
Diseo de la cubierta: Manuel Andreu
Francesc Tarrs, 2000
Edicions UPC, 2000
Edicions de la Universitat Politcnica de Catalunya, SL
Jordi Girona Salgado 31, 08034 Barcelona
Tel.: 934 016 883 Fax: 934 015 885
Edicions Virtuals: www.edicionsupc.es
E-mail: edicions-upc@upc.es
Produccin: CPET (Centre de Publicacions del Campus Nord)
La Cup. Gran Capit s/n, 08034 Barcelona
Depsito legal: B-30.958-2000
ISBN: 84-8301-393-2
ISBN Obra completa: 84-8301-401-7
Quedan rigurosamente prohibidas, sin la autorizacin escrita de los titulares del copyright, bajo las san-
ciones establecidas en las leyes, la reproduccin total o parcial de esta obra por cualquier medio o pro-
cedimiento, comprendidos la reprografa y el tratamiento informtico, y la distribucin de ejemplares de
ella mediante alquiler o prstamo pblicos.
Presentacin 7

Presentacin
Los sistemas de comunicacin audiovisual han experimentado, desde los inicios de la televisin en
blanco y negro, una constante evolucin tecnolgica encaminada a mejorar tanto la calidad como la
cantidad de los servicios. No obstante, debe tenerse en cuenta que el elevado nmero de usuarios y el
coste de los equipos terminales suponen una considerable inercia comercial que plantea serias
dificultades a la introduccin de nuevos sistemas. Por ello, la evolucin tecnolgica casi siempre se
realiza de forma progresiva, manteniendo cierto grado de compatibilidad con los sistemas precedentes
e introduciendo de forma paulatina mejoras y servicios adicionales. La introduccin de informacin de
color compatible con los sistemas en blanco y negro o la adicin de canales de audio estereofnico
constituyen claros ejemplos de esta evolucin progresiva. Ms recientemente, la rpida implantacin
de la televisin digital por va satlite se ha obtenido sin que ello suponga un coste excesivo para el
usuario, decodificando la seal digital en el extremo receptor y convirtindola a los formatos
analgicos convencionales, para los que ya estaban preparados los equipos reproductores. Tambin de
forma progresiva, se estn introduciendo nuevos receptores que admiten tanto entradas analgicas
como digitales.

Esto significa que, al menos durante cierto tiempo, coexistirn los formatos analgicos y los digitales
a los que, seguramente, se incorporaran nuevas caractersticas como la alta definicin, los canales de
retorno para interactuar con el usuario, el acceso a servicios audiovisuales o multimedia a travs de
internet, etc. Aunque en un futuro prximo es probable que dejen de transmitirse seales de televisin
analgicas, los receptores debern seguir manteniendo stos formatos para proporcionar cierto grado
de compatibilidad con los reproductores de VHS, cmaras de vdeo y otros equipos que actualmente
se disponen y que el usuario desear mantener.

Este texto pretende proporcionar una perspectiva general de los principios tecnolgicos en los que se
basan los sistemas de comunicacin audiovisual, teniendo en cuenta los principales formatos
analgicos y digitales que actualmente comparten el mercado de equipos y sistemas no profesionales.
Debido a la extensin y complejidad de algunos temas, hemos considerado oportuno dividir los
contenidos en dos volmenes que pueden seguirse de forma totalmente autnoma e independiente. En
ste primer volumen se tratarn nicamente los aspectos relacionados con la captura, el tratamiento y
la transmisin de las imgenes, centrndonos principalmente en los sistemas de televisin analgica y
digital y en las cmaras de vdeo. En un segundo volumen se desarrollarn los sistemas de audio y las
comunicaciones audiovisuales en sistemas o redes informticas. Aunque los contenidos se agrupan,
principalmente, en torno a las aplicaciones de televisin (audio y vdeo) y la codificacin de vdeo en
sistemas informticos, los conceptos expuestos son vlidos y generalizables a otros formatos
Los autores, 2000; Edicions UPC, 2000.
8 Sistemas audiovisuales I. Televisin analgica y digital
audiovisuales domsticos como el DVD (Digital Versatile Disc), el Minidisc, los reproductores MP3,
los sistemas de videoconferencia por internet o RDSI, etc. En cualquier caso, en todo momento se
proporcionar informacin detallada de los aspectos comunes y las diferencias ms significativas entre
los formatos ms conocidos.

El primer captulo es una introduccin general a los sistemas de comunicacin visual en la que se
desglosan las etapas necesarias para convertir una escena real en una seal que represente la
informacin contenida en esa escena. Para ello, se describen las principales caractersticas del sistema
visual humano, que nos permiten discernir aquellos parmetros fsicos que realmente contribuyen en
la percepcin de la escena de los que no aportan informacin significativa. Todos los elementos
desarrollados en este primer tema pueden considerarse bsicos y se aplican tanto a los sistemas
analgicos como a los digitales. Se examinan con detalle aspectos diversos como la descomposicin
en componentes de color RGB, la transmisin de la informacin mediante componentes de luminancia
y seales diferencia de color, el nmero de imgenes por segundo, los sistemas entrelazados y no
entrelazados, las relaciones de aspecto de la pantalla, el nmero de lneas, el ancho de banda de las
seales y los principios de la televisin analgica y digital. Se incluyen numerosas referencias
histricas y tecnolgicas con el objetivo de justificar la procedencia de los parmetros ms habituales
en los sistemas de televisin.

Los sistemas de televisin analgicos se desarrollan en los dos captulos siguientes. El primero se
dedica a los sistemas en blanco y negro, prestando especial atencin a las seales de sincronismo y a
los principios de representacin de imgenes mediante tubos de rayos catdicos. Tambin se analizan,
a nivel de diagrama de bloques, los subsistemas del receptor dedicados a recuperar la informacin de
sincronismo a partir de la seal de vdeo compuesto. El estudio de los sistemas de color compatibles
se centra en la descripcin del NTSC y el PAL. En ambos casos se presentan abundantes
justificaciones analticas que pueden obviarse sin que se produzca una prdida de continuidad en la
comprensin de los aspectos ms tecnolgicos.

La televisin digital y los principios de compresin de imgenes se describen en el captulo 4. El
lector interesado exclusivamente en los sistemas digitales puede abordar directamente este tema, en el
que slo se utilizan los elementos y conceptos desarrollados en el primer captulo. El estudio incluye
un anlisis exhaustivo de las diferentes alternativas para la compresin de imgenes con prdidas y sin
prdidas. Se describen las peculiaridades del estndar JPEG para la compresin de imgenes
estacionarias y se profundiza en los estndares MPEG-1 y MPEG-2 para las secuencias de imgenes
en movimiento. La parte final se dedica al estndar DVB, que define la transmisin de televisin en
formato digital.

El ltimo captulo se dedica a las cmaras de vdeo. Se proporcionan los elementos de ptica
geomtrica necesarios para comprender los conceptos de enfoque, zoom y las relaciones entre iris,
obturador y profundidad de campo. Tambin se describen las principales unidades fotomtricas y se
presentan los principios fsicos de los sensores CCD para la captura de imgenes.

Barcelona, abril de 2000

ndice 9

ndice
1 Elementos bsicos de los sistemas de comunicacin visual
1.1 Introduccin................................................................................................................. 15
1.2 Cadena bsica de un sistema de comunicacin visual .................................................... 16
1.3 De la escena a la seal de televisin.............................................................................. 19
1.4 Componentes de color RGB......................................................................................... 21
1.4.1 La luz y el color.............................................................................................. 21
1.4.2 Percepcin del color en el sistema visual humano............................................ 24
1.4.3 El ojo humano ................................................................................................ 25
1.4.4 Clulas sensibles: conos y bastones................................................................. 26
1.4.5 Estmulos de los fotorreceptores: sensacin de color........................................ 31
1.4.6 Tradas RGB en displays de TV...................................................................... 32
1.4.7 Sistemas de coordenadas para la representacin del color:
principios de colorimetra............................................................................. 33
1.4.8 Normalizacin de las coordenadas de color: coeficientes triestmulo................ 35
1.4.9 Cambio de sistemas de coordenadas................................................................ 35
1.4.10 Sistema de coordenadas con primarios monocromticos.................................. 36
1.4.11 Sistema de coordenadas basado en los fsforos del receptor NTSC.................. 37
1.4.12 Tringulo de Maxwell y diagrama cromtico................................................... 39
1.4.13 Representacin grfica de la mezcla de colores ............................................... 41
1.4.14 Situacin de los colores en el tringulo de Maxwell y en
el diagrama de cromaticidad......................................................................... 43
1.4.15 Algunos comentarios sobre la representacin grfica de los colores ................. 48
1.4.16 La seal de luminancia ................................................................................... 50
1.4.17 Sistemas de coordenadas XYZ......................................................................... 52
1.4.18 Obtencin de las componentes do color: filtros dicroicos................................. 55
1.4.19 Transmisin de la informacin de color: seales diferencia de color ................ 57
1.5 Proyeccin de las escenas en el plano de imagen........................................................... 64
1.5.1 Sistemas para la representacin de imgenes 3D ............................................. 65
1.5.2 Mecanismos de visin tridimensional.............................................................. 66
1.5.3 Sistemas estereoscpicos ................................................................................ 70
1.5.4 Sistemas autoestereoscpicos.......................................................................... 77
1.5.5 Displays volumtricos .................................................................................... 82
1.5.6 Hologramas y displays hologrficos................................................................ 85
1.6 Limitacin de la imagen: tamao del sensor y relacin de aspecto................................. 89
1.7 Muestreo temporal de las imgenes .............................................................................. 98
1.7.1 Un poco de historia: del Phenakistoscope al Cinmatographe..................... 100
1.7.2 La persistencia, el parpadeo y el fenmeno phi ........................................... 102
1.7.3 Frecuencia de imagen................................................................................. 104
1.7.4 Aliasing temporal en las imgenes.............................................................. 102
1.8 Muestreo espacial de las imgenes: filas ..................................................................... 108
1.8.1 Antecedentes de la televisin...................................................................... 112
1.8.2 Nmero de lneas ....................................................................................... 116
1.8.3 Agudeza visual .......................................................................................... 117
1.8.4 Distancia de visionado ............................................................................... 119
1.8.5 Nmero mnimo de lneas .......................................................................... 120
1.8.6 Seleccin del nmero de lneas................................................................... 121
1.8.7 Nmero de lneas en los sistemas de alta definicin .................................... 123
1.8.8 Entrelazado de las imgenes....................................................................... 123
1.8.9 Problemas derivados del entrelazado de las imgenes ................................. 127
1.8.10 Insercin de seales de sincronismo en la seal de televisin ...................... 127
1.8.11 Exploracin entrelazada de las imgenes en la cmara ................................ 129
1.8.12 Receptores de 100 Hz................................................................................. 130
1.8.12 Ancho de banda aproximado de la seal de televisin ................................. 132
1.8.14 Resolucin y factor de resolucin en un sistema de televisin ..................... 137
1.8.15 Insercin de la informacin de color........................................................... 140
1.8.16 Sistemas de vdeo en componentes ............................................................. 141
1.8.17 Sistemas de vdeo compuesto ..................................................................... 143
1.9 Muestreo espacial de las imgenes: filas y columnas................................................... 145
1.9.1 Conceptos bsicos...................................................................................... 145
1.9.2 Sistemas de adquisicin.............................................................................. 149
1.9.3 Formatos de televisin digital ..................................................................... 150

2 La seal de televisin en blanco y negro
2.1 Introduccin............................................................................................................... 159
2.2 Principios de funcionamiento del tubo de rayos catdicos ........................................... 160
2.2.1 Ctodo, filamento y rejilla.......................................................................... 160
2.2.2 Rejillas de aceleracin y enfoque................................................................ 161
2.2.3 Deflexin del haz....................................................................................... 161
2.2.4 Pantalla...................................................................................................... 162
2.2.5 Forma del raster ........................................................................................ 162
2.2.6 Modulacin del haz mediante la seal de luminancia .................................. 162
2.2.7 Principio de funcionamiento de los tubos de color ...................................... 164
2.3 Correccin gamma ..................................................................................................... 167
2.4 Seales de deflexin del haz....................................................................................... 170
2.4.1 Caso ideal .................................................................................................. 170
2.4.2 Seales de deflexin del haz: aproximacin al caso real .............................. 171
2.5 Sincronismo de lnea.................................................................................................. 173
ndice 11
2.6 Sincronismo de campo ............................................................................................... 180
2.6.1 Sincronizacin de los generadores de barrido vertical ................................. 188
2.7 Espectro de la seal de televisin en blanco y negro.................................................... 190

3 La seal de televisin en color: sistemas compatibles
3.1 Introduccin............................................................................................................... 197
3.2 Las seales de color en los sistemas NTSC y PAL...................................................... 198
3.2.1 Seales diferencia de color en el NTSC y PAL ........................................... 199
3.2.2 Modulacin de las seales diferencia de color en los sistemas
NTSC y PAL............................................................................................. 207
3.3 El sistema NTSC........................................................................................................ 209
3.3.1 Seleccin de la frecuencia portadora de la seal de croma........................... 209
3.3.2 Patrones de interferencia en el sistema NTSC............................................. 213
3.3.3 Modificacin de la frecuencia de imagen.................................................... 219
3.3.4 Demodulacin de las componentes I y Q: caso ideal ................................... 222
3.3.5 Demodulacin con errores de fase .............................................................. 224
3.3.6 Insercin de la salva de la portadora de color .............................................. 225
3.3.7 Demodulacin de las componentes de color: banda lateral superior
vestigial ..................................................................................................... 228
3.3.8 Demodulacin directa de las componentes U y V........................................ 233
3.3.9 Diagrama de bloques de un codificador NTSC............................................ 235
3.3.10 Diagrama de bloques del decodificador NTSC............................................ 238
3.3.11 Separacin de las seales de luminancia y croma........................................ 239
3.3.12 Regeneracin de la portadora de color ........................................................ 246
3.3.13 Problemas del sistema NTSC ..................................................................... 247
3.4 El sistema PAL.......................................................................................................... 250
3.4.1 Correccin de la fase mediante la inversin de una de las
componentes de croma............................................................................... 250
3.4.2 Diagrama de bloques de un decodificador de croma en PAL-S.................... 252
3.4.3 Diagrama de bloques de un decodificador de croma en PAL-D................... 253
3.4.4 Seleccin de la frecuencia portadora de color.............................................. 258
3.4.5 Espectro de la seal PAL............................................................................ 262
3.4.6 Generacin de sincronismos en el sistema PAL .......................................... 264
3.4.7 La seal de salva en el sistema PAL ........................................................... 265
3.4.8 Diagramas de bloques de un codificador y un decodificador PAL ............... 267
3.5 Normas utilizadas en la transmisin de seales de TV analgicas en color................... 268

4 Televisin digital
4.1 Introduccin............................................................................................................... 273
4.2 Compresin de imgenes: necesidad y conceptos bsicos............................................ 276
4.3 Medida de la informacin de una fuente ..................................................................... 284
4.3.1 Entropa de una fuente de mensajes ............................................................ 286
4.4 Cdigos de longitud variable ...................................................................................... 287
4.4.1 Cdigos de Huffman................................................................................... 288
4.4.2 Modificaciones del cdigo de Huffman....................................................... 291
4.5 Otros tipos de cdigos................................................................................................ 293
4.5.1 Codificacin por longitud de series (Run Length Encoding-RLE)................ 293
4.5.2 Codificacin LZW..................................................................................... 294
4.5.3 Codificacin aritmtica .............................................................................. 295
4.6 Codificacin y predictores.......................................................................................... 296
4.7 La transformada coseno discreta................................................................................. 298
4.7.1 Definicin de la transformada coseno unidimensional................................. 301
4.7.2 Extensin de la transformada coseno a dos dimensiones ............................. 305
4.7.3 Codificacin por zonas............................................................................... 311
4.7.4 Codificacin por umbral............................................................................. 313
4.8 Codificacin de imgenes estacionarias: el estndar JPEG.......................................... 314
4.8.1 JPEG: modo secuencial base (baseline) ...................................................... 316
4.8.2 Codificacin de imgenes con mltiples componentes ................................ 324
4.8.3 Modo progresivo........................................................................................ 325
4.8.4 Calidades subjetivas obtenidas con el JPEG................................................ 327
4.9 Codificacin de secuencias de vdeo: MPEG.............................................................. 329
4.9.1 Uso de la redundancia temporal para la compresin de vdeo...................... 332
4.9.2 Compensacin de movimiento.................................................................... 335
4.9.3 Algoritmos para la estimacin de los vectores de movimiento..................... 340
4.9.4 Tipos de imgenes en el MPEG.................................................................. 347
4.9.5 Orden de transmisin de las imgenes ........................................................ 349
4.9.6 Algunos ejemplos con secuencias y codificadores ideales ........................... 351
4.9.7 Diagramas generales del proceso de codificacin y
decodificacin de imgenes........................................................................ 352
4.9.8 Estructura jerrquica de la trama MPEG..................................................... 354
4.9.9 Algunos detalles sobre la codificacin de las imgenes del tipo I................. 355
4.9.10 Algunos detalles sobre la codificacin de las imgenes del tipo P................ 357
4.9.11 Detalles sobre la codificacin de las imgenes del tipo B............................ 359
4.9.12 Control de la tasa de bits ............................................................................ 361
4.9.13 Tratamiento de imgenes entrelazadas en el MPEG-2................................. 362
4.9.14 Restriccin de parmetros, niveles y perfiles............................................... 366
4.10 Multiplexacin de sucuencias MPEG.......................................................................... 369
4.10.1 Estructura del paquete bsico (Packetized Elementary Stream) ................... 370
4.10.2 La trama de programa (Program Stream).................................................... 372
4.10.3 La trama de transporte................................................................................ 372
4.10.4 Informacin especfica de programas
(Program Specific Information PSI) ........................................................ 375
4.10.5 Multiplexado de paquetes elementales en la trama de transporte.................. 376
4.11 Principios del DVB.................................................................................................... 378
4.11.1 Estndar DVB-S ........................................................................................ 379
4.11.2 Estndar DVB-C........................................................................................ 380
4.11.3 Estndar DVB-T........................................................................................ 380

ndice 13

5 Cmaras
5.1 Introduccin............................................................................................................... 381
5.2 Diagrama de bloques de una cmara........................................................................... 382
5.3 Principios de ptica geomtrica y formacin de imgenes........................................... 386
5.3.1 Lentes, grupo ptico y lente ideal ............................................................... 387
5.3.2 Formacin de imgenes con lentes ideales .................................................. 391
5.3.3 Angulo de visin........................................................................................ 394
5.3.4 Regulacin de la cantidad de luz: diafragma y obturador............................. 397
5.3.5 Profundidad de campo................................................................................ 402
5.4 Fotometra ................................................................................................................. 408
5.4.1 Intensidad luminosa: la candela .................................................................. 409
5.4.2 El flujo luminoso: lumen............................................................................ 413
5.4.3 La iluminancia: lux .................................................................................... 414
5.5 Sensores de imagen de estado slido........................................................................... 416
5.5.1 Sensores CCD matriciales .......................................................................... 420
5.5.2 Sensores CCD de transferencia de cuadro (Frame Transfer CCD)............... 421
5.5.3 Sensores CCD de transferencia de cuadro divididos
(Split Frame Transfer CCD)....................................................................... 422
5.5.4 Sensores CCD de transferencia interlnea (Interline Transfer)..................... 423
5.5.5 Dispositivos de inyeccin de carga (Charge Injection Devices CID) ........... 425
5.5.6 Sensores de pxel activo ............................................................................. 426
5.5.7 Captura de imgenes en color con un nico sensor...................................... 427
5.6 Sistemas automticos de control de la seal de vdeo .................................................. 429
5.6.1 Zoom ptico y zoom digital........................................................................ 429
5.6.2 Mecanismos de estabilizacin de imagen.................................................... 429
5.6.3 Sistemas de autoenfoque ............................................................................ 430
5.6.4 Ajuste del balance de blancos..................................................................... 434
5.6.5 Modos de exposicin y efectos................................................................... 435
5.7 Tipos de cmaras........................................................................................................ 436
5.7.1 Cmaras de estudio .................................................................................... 436
5.7.2 Cmaras de campo (Electronic News Gathering Eng) .............................. 437
5.7.3 Cmaras de circuito cerrado de TV o de vdeo vigilancia ............................ 437
5.7.4 Cmaras industriales y de visin artificial ................................................... 437
5.7.5 Cmaras de vdeo domsticas..................................................................... 439
5.7.6 Cmaras para aplicaciones mdicas y cientficas......................................... 439
5.7.7 WebCams................................................................................................... 439

Bibliografa ............................................................................................................... 441
ndice alfabtico........................................................................................................ 443
Bibliografa 441

Bibliografa
ABRAMSON, A. The story of television: 1880 to 1941. Ed. McFarland.

BENOIT, H. Televisin digital. Madrid. Paraninfo. 1998.

BRUCH, W. The PAL colour TV system basic principles of modulation and demodulation. NTZ
Communications Journal 3, pp 255-268. 1964.

GIBSON, J; BERGER, T. Digital compression for multimedia. Principles and Standards. Morgan
Kaufmann. 1998.

GONZALEZ, R; WOODS, J. Digital Image Processing. 2 Ed. Addison-Wesley. 1992

HILL, R. A first course in coding theory. Oxford. Clarendon Press. 1986.

ISO 10918. Digital compression and coding of continuous tone still images (JPEG). ISO/IEC.

ISO 11172-1, 11172-2, 11172-3. Coding of moving pictures and associated audio for digital storage
media up to about 1.5 Mbps. (MPEG-1 video, audio, system). ISO/IEC.

ISO 13818-1, 13818-2, 13818-3. Coding of moving pictures and associated audio (MPEG-2 video,
audio, system). ISO/IEC.

JACKSON, K.J; TOWNSEND, G.B. Television and video engineers reference book. London.
Butterworth-Heinemann. 1991.

NETRAVALI, A., HASKELL, B. Digital Pictures. Representation, compression and standards. New
Jersey. 2 Ed. Plenum Press. 1995.

RAO, K.R; HWANG, J.J. Techniques and Standards for image, video and audio coding. Prentice
Hall. 1996.

RUIU, D., et al. Testing digital video. Amsterdam. Hewlett-Packard. 1997.

SAWYER, PRONK. Cmaras digitales. Madrid. Editorial Paraninfo.
SINCLAIR, I. Birth of the box: the story of television. Sigma Press. 1995.

SOLARI, S.J. Digital video and audio compression. McGraw-Hill. 1997.

TAYLOR, J. DVD Demystified. McGraw-Hill. 1998.

TORRES, L; CASAS, J.R; LLEIDA, E. Sistemas analgicos y digitales de televisin. Barcelona.
Coleccin Politex. Edicions UPC.

UMBAUGH, S. Computer Vision and Image Processing. Prentice Hall. 1998.

ndice alfabtico 443

ndice alfabtico
100 Hz, receptores, 130
4:2:0, 154
4:2:2, 150
4:4:4, 150
64-QAM, 380

A
Aberracin, 389
cromtica, 389
de coma, 389
de curvatura, 389
esfrica, 389
Acceso condicional, 18, 275
Acomodacin, 68
Advanced Photo System, 395
Agudeza visual, 117
Aliasing temporal, 107
Alta definicin, 96
formatos digitales, 157
Anaglyph, 70
Anlisis de umbral, 313
Anamrficas, lentes, 93
Ancho de banda, 132
calidad subjetiva, 137
seal TV, 132
ngulo
de observacin, 123
de visin, 90, 394
slido, 409
vertical de observacin, 120
nodo, 161
Antena. 18
Apertura numrica, 399
Aproximaciones sucesivas, 325
APS, 395
Arj, 277
Armat, Thomas, 102
Arrastre de lnea, 131, 127
ASA, 408
Astigmatismo, 29, 389
ATM, 329
Audio
estreo, 273
multicanal, 273
Autoenfoque, 430
por CCD lineal, 432
por infrarrojos, 430
por ultrasonidos, 430
AVI, 155, 334

B
Baird, J,116
Balance de blancos, 434
Banda IV, 271
Banda lateral superior PAL, 264
Banda V, 271
Banda visible, 22
Barkaunsen, 173
Barras de color, 201
Barrido
horizontal, 170
vertical, 170
Baseline, JPEG, 316
Bastones, 26
BBC, 95
Betacam, 141
Bidireccionales, 347
Binario natural, 293
Bits, 285
Black-matrix, 166
Block matching, 341
Blooming, 425
Bloque de imagen, 325, 341, 355
Bobinas de deflexin, 170
Borrado de campo, 180
Braun, 114
Brillo, 24
Bruch, 250
Bsqueda
en tres etapas, 344
jerrquica, 344, 346
logartmica, 344

C
C de Landolt, 117
C.I.E, 36
Cable, televisin, 18, 198
Calidad broadcasting, 329
Calidades subjetivas, JPEG, 327
Cmara, 381
Cmara
reflex, 385
diagrama de bloques, 382
exploracin entrelazada, 129
de campo, 437
de estudio, 436
industrial, 437
lineal, 438
progresiva, 129, 438
Camcorders, 439
Camera Control Unit (CCU), 436
Canal en espera, 132
Canales
gua, 273
temticos, 273
Candela, 409, 410
Can electrnico, 114
Caones
en delta, 165
en lnea, 165
Capa
de bloque, 355
de grupo de imgenes, 355
de imagen, 355
de macrobloque, 355
de secuencia, 354
de slice, 355
Capacidades conmutadas, 253, 257
Carey, G.R, 112
CAT, 375
Ctodo, 160
Ctodos de estado slido, 160
CATV, 18, 19
CCD, 149, 253, 257, 381, 416
de lnea, 419
de transferencia interlnea, 423
de tres fases, 416
matriciales, 420
CCTV, 384
CCU, 436
CD-ROM, 277, 329, 347
Charge Coupled Device, 381, 416
Charge Injection Devices, CID, 425
Chlorolabe, 30
CIE, 412
CIF, 156, 331
Cinemascope, 93
Cinmatographe, 101
Cinepack, 334
Cinerama, 93
Circuito separador de sincronismos, 183
Closed GOP, 350
Codecs, 335
Codificacin
aritmtica, 293, 295
con prdidas, 281
de canal, 274
de fuente, 274
de imgenes, 314, 357
diferencial, 279, 283
por umbral, 313
por zonas, 311
RLE, 293
secuencial, JPEG, 316
Codificador PAL, 267
Cdigo
externo, 379
Gray, 293
interno, 379
de encriptacin, 275
ndice alfabtico 445
de Huffman, 288
de Huffman de desplazamiento, 292
de longitud variable, 287
proteccin errores, 275
truncados, 291
Coeficiente de correlacin, 296
Coeficientes
AC, 317
cromticos, 40
DC, 317
de alterna, 317
de prediccin, 279
transformados, 307
triestmulo, 35
COFDM, 380
Colores monocromticos, 22
Commission Internationale de LEclaire, 36
Common Intermediate Format, 156
Compact disc, 273
Compactacin de la energa, 300
Compatibilidad, 57
directa, 197
indirecta, 58, 197
Compatible, 197
Compensacin de movimiento, 335
Compensacin de movimiento bidireccional, 348
Componentes de color, 21
Compresin
con prdidas, 277
intra-trama, 338
sin prdidas, 277
Configuracin FIFO, 419
Conos, 26
Contraste, 147
Coordenadas XYZ, 50, 52
Crnea, 25
Coroide, 26
Correccin gamma, 167
Correlacin cruzada, 341
Corriente de oscuridad, 424
Cristalino, 26
Cromaticidad uniforme, 55
Crominancia, 197
PAL, 199
Cruce de color, 257

D
d.p.i., 149
D1, 141
D2, 141
D2-MAC, 116, 141
Daguerre, Louis Jacques Mand, 100
Daltonismo, 32
DCT, 300
Bidimensional, 317
De France, H, 250
Decodificador PAL, 267
Decodificadores de satlite, 198
Deflexin, 161, 165, 170
Horizontal, 170
Della Porta, Giovanni Battista, 68
Delta frames, 334
Demultiplexacin, 331
Desplazamientos fraccionales, 343
Deteccin del sincronismo, 176
DFT, 304
Diafragma, 397
Diagrama cromtico, 39
Dickson. W.K.L, 101
Diferencia de color, 197
Digital 8, 384, 439
Digital Scan, 131
Digital Still Cameras, 385
Digital Versatile Disc, 329
Digital Video Broadcasting, 274, 329, 378
Digital Video Interactive, 154
Direccin del gradiente conjugado, 344
Disparo controlado, 179
Disparo directo, 179
Displays hologrficos, 85
Displays volumtricos, 82
Dispositivos de acoplamiento de carga, 416
Distancia de visionado, 119
Distancia focal, 387, 392
Distorsin de cojn, 162
Distorsin geomtrica, 389
Doble cortinilla, 402
DTS, 371
DVB, 116, 274, 329, 378
DVB-C, 380
DVB-S, 379
DVB-T, 380
DVCam, 141
DVCPro, 141
DVD, 116, 350
DVD-Video, 329, 347
DVI, 154

E
Eastman, George, 100
EBU, 38
EDTV, 20, 331
Efecto
Hannover, 253
Kell, 127, 135
EIT, 376
Electronic News Gathering, 437
Elementary stream, 369
Elipses de Mac-Adam, 54
Enfoque pasivo, 431
ENG cameras, 437
Enhanced definition TV, 20
Ensamblaje de bloques, 341
Entrelazado de las imgenes, 123
Entropa, 286
de la fuente, 286
EOB, 322
Error
absoluto, 341
cuadrtico, 341
de fase, 251
Erythrolabe, 30
ES audio, 369
ES data, 369
ES, MPEG, 369
Espectador
activo, 80
pasivo, 80
Espectro PAL, 262
Espectro seal de televisin, 190
Estabilizacin de imagen, 429
Estereorradianes, 409
Estereoscopio de Brewster, 70
Estroboscopio, 107
Estructuras de prediccin, 297
Euclides de Alejandra, 68
Euroconector, 19, 143, 198
Exploracin
en zigzag, 320
entrelazada, 129
progresiva, 331
Exposmetro, 408

F
Factor
de Kell, 136
de resolucin, 137
de zoom, 429
Fatiga ocular, 81
Fenmeno phi, 98, 102, 103
FFT, 300
Filamento, 160
Filtro
digital, 132
predictor, 279
Filtros
de color, 427
dicroicos, 55
Flicker, 102, 330
Flujo luminoso, 413
Fly-wheel, 189
Foco, 387
Formato 4:2:0, 154
Formato
de la Academia93
panormico, 96
SIF, 330
Cinematogrficos, 93
Fsforos, 165
en delta, 33
Fotografa
35 mm, 395
digital, 385
electrnica, 149
de miniatura, 35 mm, 386
Fotogramas
clave, 334
diferencia, 334
Fotometra, 408
Fotmetro, 408
Fourier, 298
Fourney, 379
Fvea, 28
Fraccin de Weber, 147
ndice alfabtico 447
Frame
differencing, 334
transfer CCD, 421
Frecuencia
de imagen, 104
de lnea, 181
espacial, 312
subportadora, 258
Fuente de mensajes, 284
Funciones cosenoidales, 308

G
Gabor, D, 85
Gama de colores, 48
Gamma, 164
Generacin
de barrido horizontal, 185
de sincronismos PAL, 264
Generador de efectos, 384
Generadores de barrido vertical, 188
Goodwin, Hannibal, 100
GOP, 347
Grandes angulares, 395
Group of pictures, 347
Grupo
cerrado de imgenes, 350
de imgenes, 347
ptico, 383, 386

H
H-261, 275, 340
H-263, 275, 328
Hannover, efecto, 253
Hart, 298
HDTV, 331
Helmholtz, Hermann L. F. von, 29
HHR, 331
Hi-8, 384, 439
High level, 368
High profile, 368
High-1440 level, 368
Hipermetropa, 29
Histograma, 280
Holograma, 85
Huffman, 281, 320
Huffman, cdigos, 288
I
Iconoscopio, 114
Iluminancia, 414
Imagen
B, 339
de referencia, 337, 341
I, 339
P, 339
Imgenes
3D, 65
base, 308
intra, 316
reales, 388
virtuales, 388
IMAX, 94
IMAX-3D, 73
Impulso de sincronismo de campo, 181, 184
Impulsos
de pre-igualacin, 181
de sincronismo de lnea, 184
Indeo 3.2, 334
Intensidad del haz, 163
Intercalacin de lneas, 125
Interleaving, 325
Interline Transfer CCD, 423
Interline twiter, 127
International Commission of Ilumination, 412
Interpolacin de lneas, 132
Intra-trama, 343, 347
IRD, 18
Iris, 397
ITU 601, 150, 276, 330
ITU-601 4:2:0, 332
ITU-656, 153

J
JBIG, 315
Joint Photographic Experts Group, 315
JPEG, 275, 278, 298, 314
2000, 300, 315, 328
Lossless, 315
LS, 315
modo jerrquico, 325
modo progresivo, 325
modo secuencial base, 316

K
Karhunen-Loeve, 298
Kell, efecto, 127
Kell, R.D., 134
Key frame, 334
Kinemacolor, 102
Kinetograph, 101
Kinetoscope, 101

L
Lemple, 294
Lente, 387
convergente, 387
divergente, 387
ideal, 390
anamrfica, 93
Line crawl, 127
Line Flywheel, 179
Lnea activa, 128
Lneas
NTSC, 251
PAL, 251
Lohscheller, 317
Lossless compression, 277
Lossy, compression, 277
Low level, 367
Lumen, 413
Lumire, Hnos, 101
Luminancia, 50, 415
Lux, 414
Luz blanca, 22
LZW, 293, 294

M
Macrobloque, 341, 355
Macrobloques,
entrelazado, 363
tipos B, 359
tipos P, 358
Maculea lutea, 28
Main Level, 368
Main Profile, 368
Main Profile, Main Level, 369
Markov, 311
Mscara, 162, 165
zonal, 313
Matiz de color, 24
Matrices de cuantificacin, 320
Memorias digitales, 253
Mensajes tipo B, 322
Mespica, 27
Mtodo base, JPEG, 316
Mezcla de colores, 41
MiniDV, 384, 439
Miopa, 29
MJPEG, 332
Modo
jerrquico, JPEG, 316
progresivo, JPEG, 316
sin prdidas, JPEG, 316
Modos de exposicin, 435
MOSFET, 416
Motion-JPEG, 332
Moving Pictures Experts Group, 329
MP@ML, 154, 369
MPEG, 275, 278, 298
MPEG-1, 155, 275, 329, 340, 341
MPEG-2, 116, 154, 275, 329
MPEG-2
sistemas, 274
imgenes entrelazadas, 362
MPEG-4, 300, 328, 329
MPEG-7, 329
MPEG-Systems, 369
Muestreo
espacial, 108
temporal, 98
MultiCam 1300AF, 434
Mltiples cortinillas, 402
Multiplexacin, 331
Multiplexacin vdeo-audio, 274
Multiplexor MPEG, 376
MUSE, 95, 141
Muybridge, Eadweard, 100

N
National Television System Committee, 198
NHK, 95
NICAM, 269
Nipkow, P, 113
NIT, 376
Nivel de blanco, 176
ndice alfabtico 449
Nivel de negro, 176
Nivel de sincronismo, 176
Niveles MPEG, 367
Norma G, 269
Normas TV CCIR, 268
NTSC, 63, 197, 198
Nmero de lneas, 116
alta definicin, 123
seleccin, 121
mnimo, 120
Nmeros f, 399

O
Obturador, 397, 399
doble cortinilla, 401
electrnico, 74, 383
Ojo de pez, 395

P
Packet identification code, 374
Packetized elementary stream, 370
Packs (MPEG), 372
Pagar por
canal, 18, 273
ver, 18
programa, 273
PAL, 63, 197, 250, 258
PAL D, 252
PAL S, 252
Palabra cdigo, 290
Palabras tipo A, 322
PALplus, 96, 98, 123
Pantalla, 162
Paquetes elementales, 370
Paquetes, MPEG, 372
Parallax, 67, 80
Parmetro p, 407
Parpadeo, 102
PAT, 375
Patrn
interferente, 145, 260
interferente PAL, 258
Pay per channel, 18, 273
Pay per view, 18, 273
PCM, 273
PCR, 374
Perfiles MPEG, 367
Persiana veneciana, 253
Persistencia, 98, 102
PES, MPEG, 370
Phase alternating line, 199
Phase locked loop, 179
Phenakistoscope, 100
Picture elements, 146
PID, 374
Pistas monoculares, 66
Pxel, 146, 156
Plano de imagen, 391
Plano focal, 387, 393
PLL, 179
PMT, 375
Poder de resolucin, 117, 389
Polaroid, 71
Prtico
anterior, 175
posterior, 176
Post-igualacin, 181
Prediccin
backward, 339, 340
bidireccional, 339
forward, 339
inter-trama, 296
intra-trama, 296
Predictor, 279
diferencial, 296
Presentation time stamp, 371
Primarios monocromticos, 36
Primarios NTSC, 37
Prisma dicroico, 427
Profundidad de campo, 402
Program
asignation table, 375
clock reference, 374
map table, 375
specific information, 375
stream, 370, 372
PSI, 375
PTS, 371
Punto ciego, 28
Pupila, 25
Puppet effect, 85
Purkinje, 27
Q
QCIF, 156
QPSK, 379
QSIF, 156

R
R/S, 321
Radiodifusin terrena, 198
Raster, 162
RCA, 164
Receptor decodificador integrado, 18
Receptores de 100 Hz, 130
Red de distribucin, 17
Reed-Solomon, 379
Reflex, 385
Registro magntico, 384
Rejilla, 160, 161
Relacin de aspecto, 89, 91
16:9, 95
4:3, 95
Relacin de entrelazado, 124
Resolucin, 137
Resolucin en color, 256
Restriccin de parmetros, 366
Retina, 26
Retrocompatibilidad, 58, 197
RLE, 293, 320
Rosing, Boris, 114
Rotacin de fase, 251
RS-232, 385
Run length encoding, 293
Run/Size, 321

S
Salva PAL, 265
Saturacin de color, 24, 45
Scanners, 149
SDT, 376
SECAM, 63, 197, 250, 269
Secuencia 8 campos, 261
Seleccin espectral, 325
Senlecq, C., 112
Sensacin de color, 31
Sensor de imagen, 383
Sensores de pxel activo, 426
Seales de barrido, 178
Seales
de color, 198
de prueba, 180
de sincronismo, 127
diferencia de color, 57, 198
Serrado entre lneas, 362
Showscan, 105
SIF, 155, 331
Significant Pel Area, 330
Simple profile, 368
Sinapsis, 26
Sincronismo
de campo, 180
de lnea, 173
Sistema
NTSC, 63
PAL, 63, 250
UVW, 55
Sistemas
autoestereoscpicos, 77
de autoenfoque, 430
digitales, color, 64
estereoscpicos, 70
tridimensionales, 65
Skipped macroblock, 357
Slice, 355
SMATV, 378
Smear, 420, 421
SMPTE, 37, 95
Snellen, patrn de, 118
SNR scalable, 368
Sobremodulacin. 200
Society of Motion Picture and Television
Engineers, 37
Source intermediate format, 155
SPA, 330
Spatial scalable, 368
Split Frame Transfer CCD, 422
Stanford, Leland, 100
Stream de vdeo, 331
Stuffing, 374
Subimgenes, 297
Subportadora de audio, 261
S-Vdeo, 19, 143

ndice alfabtico 451
T
Tabla de
asignacin de programas, 375
descripcin de servicio, 376
hora y fecha, 376
informacin de red, 376
informacin de sucesos, 376
cuantificacin, 317
Huffman, JPEG, 324
Lohscheller, 317
Talbot, W.H.F, 100
Talbot-Plateau, ley de, 102
Tamao del sensor, 89, 394
Tarjetas digitalizadoras, 149
Tasa de bits, MPEG, 361
TDT, 376
Tcnica de umbral, 314
Telecine, 106
Telefunken, 250
Teleobjetivo, 395
Teletexto, 180
Televisin digital, 273
por cable, 275
Televisin en color, 197
Televisin interactiva, 18, 378
Televisin por satlite, 18
Teora tricromtica, 29
Tiempo de
exposicin, 397
lnea, 128
Tonalidad de color, 45
Tono de color, 24
Trama de
programa, 370
transporte, 370, 372
vdeo, 331
Trama elemental MPEG, 369
Trama MPEG, 354
Transferencia de cuadro, CCD, 421
Transformacin diferencial, 279
Transformada
coseno, 298, 299, 337
wavelet, 328
Transformadas
bidimensionales, 305
ortonormales, 303
Transmultiplexor MPEG, 378
Transport stream, 370
Tradas
rectangulares, 165
RGB, 32
Tringulo de Maxwell, 39
Triniton, 33, 167
Tubo de
cmara, 116
rayos catdicos, 32, 114, 160
TV de alta definicin, 96

U
Unidad de control de cmara, 436
Unidades fotomtricas, 408
USB, 385

V
VCO, 179

1 Elementos bsicos de sistemas de comunicacin visual 15

1 Elementos bsicos de los sistemas de comunicacin visual
1.1 Introduccin
En este captulo pretendemos proporcionar una perspectiva general de los distintos elementos que
integran un sistema de comunicacin de imgenes en movimiento. Expondremos, desde un punto de
vista muy general y utilizando en algunos casos razonamientos intuitivos, los distintos subsistemas
que intervienen en la codificacin de una escena en una seal elctrica y cmo a partir de stas se
puede reproducir una aproximacin a la escena original. Nos concentraremos nicamente en los
sistemas que intervienen en la generacin de la seal de banda base de los distintos sistemas de
televisin, suponiendo, por tanto, que el lector est suficientemente familiarizado con las nociones
bsicas relativas a modulacin y radiodifusin que permiten la transmisin a distancia de estas
seales.

El objetivo final es mltiple. Por una parte queremos presentar una perspectiva general de la
tecnologa usada en los sistemas de representacin de imgenes en movimiento actuales, sus
tendencias futuras y sus antecedentes histricos. Tambin queremos proporcionar las bases tericas y
la filosofa general de los sistemas de televisin, preparando al lector para poder abordar en captulos
posteriores los detalles concretos de cada sistema. Por ello, se incluyen aspectos tan diversos como los
fundamentos del sistema visual humano, los principios de colorimetra, la definicin de diversos
parmetros bsicos en la seal de televisin como son el nmero de lneas, el nmero de imgenes por
segundo, su ancho de banda, resolucin, entrelazado, etc. Se presentan nociones bsicas sobre
sistemas de televisin digital y de alta definicin y se introducen diversas alternativas que actualmente
se estn considerando para la representacin de imgenes en tres dimensiones. La presentacin de
estos conceptos es en algunos casos rigurosa y completa por cuanto, o bien se trata de nociones
bsicas que tendrn una importante incidencia en captulos posteriores, o bien son aspectos parciales
que no sern cubiertos posteriormente. En otros casos, la presentacin tiene un carcter
eminentemente introductorio por cuanto se trata de aspectos que sern profundamente desarrollados
en otros captulos. As, el lector observar que dedicamos varias pginas a diversos aspectos
relacionados con el sistema visual humano o a la descomposicin de la luz, pues haremos constantes
referencias a ellos en futuros captulos.

Aspiramos a que el lector identifique la funcin de cada uno de los elementos, as como las
limitaciones que estos introducen en la calidad de la seal que finalmente se reproduce y, sobre todo,
que sea consciente de que el estado actual de estos sistemas (y con toda probabilidad, su evolucin
futura) es consecuencia de un proceso evolutivo en el que cualquier innovacin tecnolgica ha
intentado introducirse en el mercado de una manera gradual, manteniendo en lo posible la
compatibilidad y la coexistencia entre varios formatos para garantizar un flujo de ventas en constante
aumento a las grandes empresas del sector.

El captulo est organizado tomando como hilo argumental las distintas etapas de muestreo y
proyeccin que se aplican a una escena para convertirla en una seal elctrica que contiene la
informacin necesaria para su reproduccin en el receptor. Entre estas etapas se considera la
descomposicin de la imagen en las tres componentes de color primarias, la proyeccin de la escena a
un plano de imagen, los lmites fsicos del sensor de imagen y su relacin de aspecto, y finalmente las
distintas etapas de muestreo temporal y espacial de las imgenes. En paralelo a este proceso de
conversin progresiva de la escena a una seal elctrica, desarrollamos aspectos relativos a las
caractersticas del sistema visual humano que intervienen directamente en la seleccin de los
parmetros de muestreo, evaluando su incidencia sobre la calidad final de la imagen y las posibles
prdidas de informacin que de ellos se derivan. Tambin aprovechamos este hilo argumental para
introducir aspectos histricos relativos al cine o la televisin, tendencias de futuro, nuevas tecnologas,
etc.

Esta estructura puede parecer en un principio una exposicin un tanto desordenada, ya que no sigue el
patrn cronolgico usado en la mayora de textos sobre televisin. Sin embargo, creemos que es muy
enriquecedora, ya que desde los inicios se comparan distintas alternativas tecnolgicas que
proporcionan, sin necesidad de leer todos los captulos, una panormica general sobre los sistemas de
televisin. Adems, los distintos aspectos temticos que iremos desarrollando surgen de una manera
natural y sin prdida de continuidad. Creemos que la alternancia entre aspectos histricos, analticos,
tecnolgicos, visuales, etc, facilita la lectura y aumenta su inters sin que suponga una prdida de
rigor o de perspectiva histrica. En cualquier caso, hemos realizado un considerable esfuerzo para que
esta organizacin, intencionadamente catica, sea estrictamente progresiva y lineal en lo que se refiere
a la exposicin de los conceptos necesarios para la comprensin del texto.

1.2 Cadena bsica de un sistema de comunicacin visual
En la figura 1.1 se representa un diagrama general de un sistema de radiodifusin de seales de
televisin. Los distintos elementos que forman este sistema tienen como objetivo transmitir la escena
tridimensional para que pueda ser visualizada en tiempo real por mltiples receptores. Junto con la
informacin ptica, tambin se transmiten una o varias seales adicionales que proporcionan
informacin de audio sobre la escena y que sern consideradas en captulos posteriores.

Las escenas que pretendemos transmitir pueden considerarse funciones que dependen de varias
variables como la posicin, el tiempo y la longitud de onda. Para poder transmitir esta informacin
mediante sistemas de comunicacin convencionales es necesario realizar distintos tipos de
proyecciones y muestreos de la escena que permitan convertir esta funcin multidimensional en una
seal que dependa de una nica variable temporal. Esta seal es la que ser modulada para enviarla a
distintos usuarios. Es evidente que en el proceso de proyeccin y muestreo de la escena se sufrirn
prdidas de informacin que inevitablemente conducen a una reduccin de la calidad de la imagen.
As, por ejemplo, en los sistemas de televisin convencional slo se transmite una proyeccin plana de
la escena sobre la cmara, de modo que el receptor reproducir una imagen en la que no est
codificada la informacin tridimensional de la escena original. Sin embargo, el espectador ser capaz
de interpretar correctamente esta informacin espacial, pues el cerebro humano est entrenado para
identificar la posicin real de los objetos a partir de su tamao relativo y de los planos ocultos.

Fig. 1.1 Elementos de un sistema de comunicacin visual

En el estudio de televisin intervienen distintos equipos y profesionales cuya funcin es la de
producir, a partir de las distintas tomas de imgenes y sonido de la escena, la seal de TV que
finalmente llegar al espectador. En este proceso colaboran profesionales tcnicos y artsticos. Los
equipos utilizados para la produccin de la seal son muy variados y dependen del tipo de programa
que se transmita. Los ms usados son las cmaras y micrfonos, los sistemas de mezcla y
acondicionamiento de seales, los equipos para la edicin y postproduccin de vdeo y finalmente los
equipos de amplificacin y transmisin de las seales a los centros de distribucin. En una
transmisin en directo suelen utilizarse varias cmaras y micrfonos, que son controlados desde una
mesa de mezclas en la que se seleccionan los planos y tomas microfnicas que formaran la base del
programa. Estas seales son editadas posteriormente para introducir ttulos, rtulos y efectos, y
finalmente se envan a los sistemas de radiodifusin. Algunos de estos equipos pueden estar
integrados en unidades mviles si el lugar donde se producen las escenas as lo requieren. En este
caso, la seal se suele enviar al estudio central, donde es reeditada y se le aaden algunos ttulos y
efectos adicionales. Tambin tienen un papel fundamental en el estudio de televisin los sistemas para
el registro de las seales de vdeo en cinta magntica que permiten almacenar los programas en directo
y facilitan la produccin de documentales y programas registrados. Algunos de estos equipos sern
estudiados con cierto detalle en captulos posteriores.

La red de distribucin se encarga de garantizar que las seales lleguen en buenas condiciones al rea
de cobertura de la emisin. Las caractersticas de esta red estn determinadas por la tecnologa
utilizada para la transmisin de las seales pudiendo existir redes de distribucin por cable, por
satlite, terrestres y, en algunos casos, redes mixtas que utilizan varios de estos sistemas. La red de
Escena
Cmaras
Procesado
Edicin
Postproduccin
Red
Distribucin
Receptores
Escena
Cmaras
Procesado
Edicin
Postproduccin
Red
Distribucin
Receptores
radiodifusin terrestre es la que tiene actualmente mayor nmero de usuarios y es utilizada para la
difusin de programas de mbito nacional o local. En este caso, la distribucin de la seal se realiza
mediante redes de radioenlaces.

En la radiodifusin directa por satlite la seal se enva desde el centro servidor a un centro de
transmisin mediante radioenlaces terrenos o cable y posteriormente es transmitida al satlite (up-link)
que realiza una trasposicin de frecuencia de la seal y la redirige a una amplia zona de cobertura
sobre la tierra (down-link). La televisin por satlite requiere que el espectador disponga de una antena
parablica de gran ganancia, ya que el nivel de la seal recibida es pequeo debido al largo trayecto
que debe recorrer sin amplificacin (36000 Km en satlites geoestacionarios), y de un conversor de
seales que le permita trasladar la seal del satlite a las bandas de televisin convencionales con las
que puede operar su receptor. La televisin por satlite proporciona grandes coberturas de mbito
internacional y facilita la distribucin de la seal a regiones poco pobladas o de difcil acceso
geogrfico, cuya cobertura mediante radioenlaces terrestres o cable sera excesivamente costosa.

Los sistemas de distribucin por cable (CATV) surgieron a principios de los aos 50 en Estados
Unidos para proporcionar seal de televisin a regiones cuyo perfil geogrfico dificultaba establecer
una cobertura convencional mediante radioenlaces. Posteriormente, la CATV se extendi a zonas
metropolitanas en las que la presencia de edificios de gran altura dificultaba la correcta recepcin de la
seal. Actualmente, este sistema de distribucin est muy extendido en algunos pases donde se ofrece
al espectador una seal de televisin de gran calidad (la degradacin de la seal por transmisin es
muy baja) con un elevado nmero de canales y de servicios. Normalmente el proveedor del servicio
distribuye una seal con ms de 50 canales en los que se incorporan tanto canales convencionales (que
tambin se transmiten va terrestre o satlite) como canales exclusivos para los abonados del servicio.
La CATV ha sido precursora en la introduccin de los conceptos de acceso condicional a la
programacin, que posteriormente se han extendido a los sistemas terrestres o va satlite y que
requieren que el espectador disponga de un equipo IRD (receptor decodificador integrado) que le
permita recomponer la informacin de vdeo que ha sido encriptada en la transmisin. En este entorno
aparecen los conceptos de pagar por canal (pay per channel) y pagar por ver (pay per view). En el
primer caso, el espectador paga una cuota mensual que le permite desencriptar toda la programacin
del canal, mientras que en el segundo caso, el proveedor del servicio informa de precio de cada
programa y factura al abonado de acuerdo con la programacin que ste ha seleccionado. El concepto
de pagar por ver requiere una cierta interactividad entre el usuario y el centro servidor. La CATV
tambin ha sido precursora de este concepto de televisin interactiva ya que, desde sus orgenes, ha
proporcionado un canal de retorno que permite establecer una comunicacin directa con el servidor.
Con ello se permite que el espectador participe en encuestas de opinin pblica, solicite los vdeos que
desea ver o efecte una compra inmediata de los productos anunciados (telecompra). La extensin del
concepto de televisin interactiva a sistemas unidireccionales, como la televisin por satlite o
terrestre, requiere que el usuario disponga de un mdem telefnico que se utiliza como canal de
retorno auxiliar.

En la recepcin de la seal y su presentacin al espectador intervienen varios subsistemas que
dependen del tipo de distribucin de la seal utilizado. La antena es el elemento encargado de recoger
la energa radioelctrica de las seales de televisin en sistemas de radiodifusin terrestre y por
satlite. En el primer caso suele ser una array del tipo YAGI que se orienta hacia el repetidor ms
cercano y que tiene una ganancia moderada (unos 14 dBs). En el caso de televisin por satlite, suele
tratarse de una antena parablica de gran ganancia (30 dBs) que se apunta haca el satlite que
transmite las seales y que incorpora un subsistema demodulador que convierte las seales recibidas
en seales de vdeo que puedan ser interpretadas directamente por un receptor convencional. En
sistemas de CATV la seal de TV se obtiene directamente del cable de suministro y tambin requiere
que el usuario disponga de un demodulador que acondicione las seales al receptor. En el caso en que
el usuario est abonado a canales de televisin de acceso condicional, tambin es necesario un
decodificador o desencriptador de la informacin. Los receptores actuales suelen admitir, dependiendo
del pas, uno o varios de los formatos analgicos convencionales (NTSC, PAL, SECAM, PALplus) y
con varios tipos bsicos de entradas de vdeo: la seal de radiofrecuencia, la seal RGB, la seal de
vdeo compuesto o banda base y el formato SVideo. La primera se corresponde con las seales de
vdeo moduladas que son recibidas en la antena de un sistema de radiodifusin terrestre. Estas seales
son sintonizadas y demoduladas por el propio receptor, pudiendo memorizar la posicin de varios
canales. El resultado de esta modulacin es la seal de vdeo compuesto o seal de vdeo en banda
base que contiene la informacin de luminancia y de color. Las seales RGB son seales de vdeo ya
demoduladas procedentes de un magnetoscopio domstico o de un demodulador de CATV o va
satlite y son introducidas en el receptor a travs de una entrada especfica denominada euroconector.
Finalmente, la seal S-Vdeo es un formato utilizado en magnetoscopios domsticos y cmaras
porttiles en la que la informacin de brillo y de color se proporcionan en cables separados.
Actualmente, muchos fabricantes de televisores estn incorporando demoduladores digitales en el
propio receptor, por lo que se espera que muy pronto sea posible recibir las seales de radiodifusin
digital sin necesidad de utilizar un decodificador externo.

El objetivo de este captulo es definir, desde un punto de vista puramente conceptual, los distintos
elementos que tienen una incidencia directa en la obtencin de una seal elctrica que proporcione
informacin sobre la escena. Se presentar una perspectiva general sobre las distintas alternativas
posibles y se definir la seal de vdeo en blanco y negro como primera aproximacin a un sistema de
televisin. La descripcin detallada de otros conceptos como la introduccin de la informacin de
sincronismo y de color, la televisin digital y de alta definicin se realizar con detalle en captulos
posteriores.

1.3 De la escena a la seal de televisin
En el caso ms general, una escena puede ser representada como una funcin de 5 variables
independientes:

) , , , , ( t z y x (1.1)

donde x, y, z representan la posicin de un punto genrico del espacio que radia con un determinado
espectro radioelctrico visible y que, posiblemente debido al movimiento de los objetos, se modifica
a lo largo del tiempo t.

El principio en el que se basan todos los sistemas de televisin actuales consiste en hacer un muestreo
sobre esta funcin de cinco variables en el modo adecuado para obtener una funcin unidimensional
(seal temporal) que pueda ser transmitida utilizando los sistemas de modulacin convencionales.
Algunos sistemas de televisin se han apartado de este criterio general y han propuesto la transmisin
simultnea de varias seales que son recompuestas en el receptor. Entre estos sistemas cabe destacar
una de las primeras tentativas de televisin en color y algunos sistemas de televisin con definicin
mejorada (EDTV-Enhanced Definition TV) propuestos a principios de los noventa. En estas ltimas
propuestas, se pretenda transmitir una seal de televisin convencional junto un canal auxiliar, que al
ser demodulado por el receptor permitira obtener informacin sobre lneas adicionales de la imagen
que no se transmiten en un sistema estndar de televisin. No obstante, ninguna de estas alternativas
ha sido explotada comercialmente ni tampoco se prev que sean usadas en el futuro.

En el proceso de conversin de la escena a una funcin temporal intervienen distintos procesos de
proyeccin y muestreo que de uno u otro modo supondrn una prdida parcial de informacin
respecto al contenido de la escena original. En la seleccin de estos parmetros de muestreo y
proyeccin deben tenerse en cuenta las caractersticas del sistema visual humano, que es el que
finalmente decidir si la calidad de la imagen es adecuada. En consecuencia, al disear un sistema de
televisin, es necesario conocer con detalle las caractersticas de la visin humana, ya que nos
permitirn determinar qu partes de la informacin no requieren ser transmitidas por cuanto no
aportan ninguna mejora subjetiva sobre la calidad de la imagen. Con ello, el ancho de banda de la
seal transmitida se reducir al estrictamente necesario para poder reproducir imgenes de calidad
aprovechando al mximo el espectro radioelctrico.

En las secciones sucesivas presentaremos por una parte los procesos de proyeccin y muestreo de la
escena que se definen en cualquier sistema de televisin y por otra las caractersticas visuales que
permiten ajustar los parmetros de estos procesos. Consideraremos nicamente aquellos aspectos de la
visin que tengan una incidencia directa sobre los parmetros de muestreo de la escena, dejando
algunos aspectos, como la interpretacin detallada del movimiento, para captulos posteriores en los
que estos factores tengan una repercusin directa en la definicin del sistema de televisin.

A continuacin resumimos las distintas etapas de muestreo y su funcin bsica:

a) Separacin en componentes de color: Toda la informacin contenida en la variable
puede representarse mediante tres componentes discretas que corresponden a los colores
primarios rojo, verde y azul. Este proceso de muestreo no representa una prdida de
informacin aparente en el sistema visual humano. Analizaremos con detalle los
mecanismos de visin y percepcin del color, su representacin analtica y los principios
fsicos usados para la descomposicin del color en tres componentes.

b) Proyeccin plana de la imagen: La escena se proyecta mediante un sistema ptico sobre
un plano de imagen. Esta proyeccin representa una prdida significativa de informacin
espacial y reduce las tres variables espaciales de la escena a las dos variables de la
imagen. En esta seccin consideraremos diversas propuestas para la representacin de
imgenes en tres dimensiones.

c) Lmites del sensor: La imagen de la escena slo se considera dentro de los lmites del
sensor por lo que sus variables espaciales estn acotadas dentro de estos lmites.
Veremos que el tamao del sensor y su relacin de aspecto tienen una incidencia directa
sobre la resolucin del sistema y la integracin del espectador en la escena.
d) Muestreo temporal: Las imgenes pueden presentarse al espectador como una secuencia
de fotogramas. Si esta secuencia es suficientemente rpida no puede distinguirse de la
informacin original. La variable temporal, de naturaleza continua, puede sustituirse por
una secuencia de imgenes sin prdida aparente de informacin. Consideraremos los
fenmenos de persistencia y parpadeo de imgenes en la retina.

e) Muestreo espacial (Lneas): Cada una de las imgenes se descompone en un nmero
finito de lneas. Si este nmero es suficientemente elevado, el espectador ser incapaz de
percibir la diferencia con la imagen original. Los sistemas de televisin analgicos
surgen de manera natural a partir de este muestreo.

f) Muestreo espacial (Retcula): En este caso la imagen se muestrea tanto en el sentido
horizontal como en el vertical. Las muestras obtenidas constituyen la base de los
sistemas de televisin digitales.

1.4 Componentes de color RGB
La primera transformacin que se realiza de la escena original consiste en sustituir su dependencia con
la variable continua longitud de onda por tres muestras correspondientes a los colores primarios rojo,
verde y azul:

) , , , , ( ) , , , (
) , , , , ( ) , , , (
) , , , , ( ) , , , (
B B
G G
R R
t z y x t z y x
t z y x t z y x
t z y x t z y x

(1.2)

El principio en el que se basa esta descomposicin es que a partir de la combinacin adecuada de los
tres colores primarios puede obtenerse cualquier sensacin de color. De este modo, se reduce la
dimensionalidad de la escena de una funcin de cinco variables a tres funciones de cuatro variables.
Podemos entender este proceso como un muestreo de la escena en la variable . Las caractersticas de
la visin humana nos permiten asegurar que usando nicamente tres muestras de esta variable,
correspondientes a los colores rojo, verde y azul adecuadamente ponderados, podremos representar
todos los colores sin que ello suponga ninguna prdida de informacin visual.

Para comprender mejor este fenmeno debemos considerar diversos aspectos relacionados con la
naturaleza de la luz y la percepcin de los colores en el sistema visual.

1.4.1 La luz y el color
La luz puede considerarse, para los fenmenos de visin que nos ocupan en este texto, como una onda
electromagntica con longitudes de onda comprendidas entre 780 nm y 380 nm. En la figura 1.2 se
representa la situacin en el espectro radioelctrico de las ondas visibles y los colores asociados a las
distintas longitudes de onda. La longitud de onda ms larga corresponde al color rojo y la ms corta al
violeta. Ms all del margen visible se sitan las frecuencias correspondientes al infrarrojo y al
ultravioleta. El color blanco esta formado como la superposicin de todas las frecuencias del espectro
visible mientras que el negro supone que no existen componentes espectrales en la banda visible. Los
colores indicados en el margen visible se corresponden con los que se obtendran para una luz
formada por una nica frecuencia pura y se denominan colores monocromticos. Las tonalidades rojas
tienen longitudes de onda que van desde los 760 nm hasta los 650 nm, las tonalidades amarillas estn
situadas en el margen de 630 nm a 560 nm, las verdes de 540 nm a 500 nm, las azules de 500 nm a
420 nm y las violetas de 420 nm a 400 nm.

Fig. 1.2 Espectro de radiofrecuencia y frecuencias del visible

En la figura 1.3 se representa un experimento que permite descomponer una luz blanca, es decir una
luz con un espectro plano en todo el margen visible, en los distintos colores monocromticos. El
experimento consiste en hacer pasar la luz blanca a travs de un prisma que, al tener un coeficiente de
refraccin dependiente de la frecuencia, desva cada componente frecuencial en una direccin distinta.

Los colores monocromticos se corresponden con los colores del arco iris. Algunos colores, como el
prpura o el magenta, slo pueden obtenerse mediante la superposicin de distintas componentes
espectrales. As, el magenta es una sensacin coloreada obtenida a partir de la combinacin del rojo y
el azul.

En general, el color observado por el sistema visual humano depende de dos factores: el espectro de la
luz incidente y las caractersticas de reflexin y absorcin de las ondas visibles de los objetos. La
composicin espectral de la luz que recibe un espectador puede expresarse como el producto del
espectro de la luz incidente por el coeficiente de reflexin de los objetos:
Longitud de onda
1
0
K
m
1
K
m
1
0
0

m
1
0

m
1

m
1
0

c
m
1

c
m
1

m
m
1
0
0

m
1
0

m
1

m
1

m
1
0
0

n
m
1
0

n
m
1

n
m
1
0
0
p
m
1
0
p
m
1
p
m
O
n
d
a
s

l
a
r
g
a
s
O
n
d
a
s

m
e
d
i
a
s
O
n
d
a
s

c
o
r
t
a
s
F
M

-
V
H
F
U
H
F
S
H
F
E
H
F
M
i
c
r
o
o
n
d
a
s
I
n
f
r
a
r
r
o
j
o
U
l
t
r
a
v
i
o
l
e
t
a
R
a
y
o
s

X
R
a
y
o
s

g
a
m
m
a
R
a
y
o
s
c
o
s
m
i
c
o
s
7
8
0

n
m
7
0
0

n
m
6
0
0

n
m
5
0
0

n
m
3
8
0

n
m
I
n
f
r
a
r
r
o
j
o
R
o
j
o
R
o
j
o
N
a
r
a
n
j
a
A
m
a
r
i
l
l
o
V
e
r
d
e
A
z
u
l
U
l
t
r
a
v
i
o
l
e
t
a
Longitud de onda
1
0
K
m
1
K
m
1
0
0

m
1
0

m
1

m
1
0

c
m
1

c
m
1

m
m
1
0
0

m
1
0

m
1

m
1

m
1
0
0

n
m
1
0

n
m
1

n
m
1
0
0
p
m
1
0
p
m
1
p
m
O
n
d
a
s

l
a
r
g
a
s
O
n
d
a
s

m
e
d
i
a
s
O
n
d
a
s

c
o
r
t
a
s
F
M

-
V
H
F
U
H
F
S
H
F
E
H
F
M
i
c
r
o
o
n
d
a
s
I
n
f
r
a
r
r
o
j
o
U
l
t
r
a
v
i
o
l
e
t
a
R
a
y
o
s

X
R
a
y
o
s

g
a
m
m
a
R
a
y
o
s
c
o
s
m
i
c
o
s
7
8
0

n
m
7
0
0

n
m
6
0
0

n
m
5
0
0

n
m
3
8
0

n
m
I
n
f
r
a
r
r
o
j
o
R
o
j
o
R
o
j
o
N
a
r
a
n
j
a
A
m
a
r
i
l
l
o
V
e
r
d
e
A
z
u
l
U
l
t
r
a
v
i
o
l
e
t
a

Fig. 1.3 Descomposicin de la luz blanca en colores monocromticos

Fig. 1.4 Espectro de luz incidente y espectro observado

) ( ) ( ) ( r l l
inc obs
(1.3)

donde l
obs
( ) es el espectro de la luz observada, l
inc
( ) el de la luz incidente y r( ) el coeficiente de
reflexin de los objetos (ver figura 1.5). De acuerdo con esta ecuacin, cuando la luz incidente es
blanca (la luz solar es una buena aproximacin a la luz blanca), el espectro de la luz reflejada por los
objetos tiene la misma forma que su coeficiente de reflexin ya que podemos considerar que l
inc
()
=Kte. As, un objeto cuyo coeficiente de reflexin sea prximo a la unidad en la regin
correspondiente al color verde y prcticamente cero para el resto de frecuencias ser observado como
de color verde cuando la luz incidente sea blanca. Sin embargo, cuando incida sobre l una luz
monocromtica de color amarillo, absorber toda la energa incidente, adoptando una apariencia de
color negro. En la figura 1.5 se ilustra como un mismo objeto puede observarse de color amarillo
Luz blanca
Prisma
C
o
l
o
r
e
s

m
o
n
o
c
r
o
m
t
i
c
o
s
Luz blanca
Prisma
C
o
l
o
r
e
s

m
o
n
o
c
r
o
m
t
i
c
o
s
Observador
Objeto
Coeficiente reflexin
r()
Luz incidente
l
inc
()
l
obs
()
Observador
Objeto
Coeficiente reflexin
r()
Luz incidente
l
inc
()
l
obs
()
cuando la luz incidente es blanca, rojo cuando el espectro de la luz est situada en la regin de baja
frecuencia del visible, o verde cuando la iluminacin corresponde a un espectro situado en la regin
de alta frecuencia. En general, pues, el color de los objetos depende de las caractersticas espectrales
de la iluminacin a la que estn sometidos. Cuando nos referimos, de una manera genrica, al color de
un objeto suele entenderse que hablamos del color que observaremos cuando est expuesto a una luz
blanca.

Fig. 1.5 El color de los objetos depende de las caractersticas de la luz incidente

1.4.2 Percepcin del color en el ojo humano
El sistema visual humano es capaz de discriminar un elevado nmero de colores. Su resolucin en
colores monocromticos depende de la frecuencia y puede estimarse que en las bandas del azul, verde
y amarillo pueden distinguirse dos colores siempre que su longitud de onda difiera en al menos 1 nm.
En las regiones extremas de la banda visible, correspondientes al rojo y al violeta, la capacidad de
discriminacin de colores se reduce, y puede estimarse que se requiere una diferencia de 10 nm para
distinguirlos. Estas medidas son aproximadas y representan un valor medio para sujetos sin problemas
de visin. Se obtienen proyectando colores monocromticos en las dos mitades de una pantalla en la
que diversos espectadores indican si son capaces de diferenciar los dos colores. Desde un punto de
vista cualitativo pueden definirse tres atributos para describir el color: el brillo, el matiz o tono y la
saturacin o pureza. El brillo indica la intensidad de la luz que percibe el ojo. El matiz o tono es la
propiedad que permite clasificar los colores como distintos, distinguiendo entre el rojo, verde,
amarillo, etc. La saturacin indica en que grado un color se acerca o se aparta del blanco. As,
podemos hablar de un rojo ms o menos claro entendiendo que todos ellos corresponden a una misma
tonalidad roja. Diremos que un color es puro cuando no contiene blanco. Veremos que es posible
establecer medidas cuantitativas directamente relacionadas con estos atributos.

Adems de los colores monocromticos, el sistema visual humano es capaz de distinguir otros tonos
de color formados por la superposicin de varias frecuencias y apreciar colores con mayor o menor
Luz Incidente
Coeficiente
Reflexin
Luz observada
Luz blanca
Luz rojiza
Luz verde-azulada
Objeto
Amarillo
Rojo
Verde
Luz Incidente
Coeficiente
Reflexin
Luz observada
Luz blanca
Luz rojiza
Luz verde-azulada
Objeto
Amarillo
Rojo
Verde
pureza dependiendo del espectro final de la luz incidente. En general, la luz procedente de los
objetos no es casi nunca un color espectralmente puro, sino una mezcla compuesta de muchas
longitudes de onda distintas.

1.4.3 El ojo humano
En la figura 1.6 se representa una seccin transversal de un ojo humano en el que pueden apreciarse
los principales elementos que intervienen en el proceso de formacin y captacin de imgenes. El
glbulo ocular tiene una forma aproximadamente esfrica, de unos 20 mm de dimetro medio que est
recubierta por un tejido fibroso de gran resistencia denominado membrana esclertica. Esta membrana
es opaca en sus superficies posterior y lateral. El segmento frontal de la membrana esclertica recibe
el nombre de crnea y es transparente para permitir el paso de la luz hacia el interior de la cavidad
ocular. La crnea acta como elemento protector de las partes interiores del ojo y presenta una
curvatura superior al resto del glbulo ocular. Justo debajo de la membrana esclertica hay una capa
de tejido vascular, denominada coroides, que es la responsable de proporcionar nutrientes a todos los
elementos del ojo. La coroides est fuertemente pigmentada para ayudar a reducir la cantidad de luz
exterior que entra en el ojo y absorber la luz difundida en su interior.

Fig. 1.6 Seccin transversal del ojo humano

En el interior de la crnea se sita la cmara anterior, que est rellena con un liquido denominado
humor acuoso. En el interior de esta cavidad est situado el iris, que es una cortina muscular, de forma
aproximadamente circular, que permite regular la cantidad de luz que incide en la parte interior del
ojo. El color de este msculo determina el color de los ojos de una persona. La luz incide a travs de
la pupila, que es una obertura circular situada en el centro del iris. El dimetro de la pupila se regula
mediante el iris, que deja al descubierto una superficie mayor o menor de sta de acuerdo con las
condiciones de luz ambientales, permitiendo que los sensores de luz situados en el interior de la
cavidad ocular puedan operar en un amplio margen dinmico de condiciones de iluminacin. El
Membrana
Esclertica
Cornea
Cristalino
Iris
Pupila
Nervio ptico
Retina
Humor acuoso
Humor
vitreo
Sensores:
Conos y bastones
Fovea
Eje
visual
Membrana
Esclertica
Cornea
Cristalino
Iris
Pupila
Nervio ptico
Retina
Humor acuoso
Humor
vitreo
Sensores:
Conos y bastones
Fovea
Eje
visual
tamao de la pupila depende nicamente de las condiciones de iluminacin externa y se controla de
forma automtica sin que intervenga la voluntad del observador. Su dimetro puede oscilar entre unos
8 mm (en el caso de poca iluminacin) hasta unos 1.5 mm (para condiciones de gran iluminacin) por
lo que la superficie total del orificio por el que entra la luz puede modificarse en un factor de
aproximadamente 28, dependiendo de las condiciones de luz exteriores.

Detrs de la pupila se encuentra el cristalino. Su funcin bsica es la de actuar como una lente que
enfoca las imgenes en la retina, que es la superficie interior del ojo en la que se encuentran los
sensores de luz. La forma del cristalino se controla a travs del cuerpo ciliar, una estructura muscular
que forma parte de la coroide y que permite variar la distancia focal y la posicin de esta lente. El
cristalino se adapta para que los objetos sobre los que el sistema visual quiere centrar su atencin
permanezcan enfocados en la retina. La luz infrarroja y la ultravioleta son absorbidas, en su mayor
parte, por las protenas que forman la estructura del cristalino, ya que en cantidades excesivas podran
daar el ojo. La cmara situada entre la pupila y el cristalino se denomina cmara posterior y est
rellena con el humor acuoso.

Entre el cristalino y la retina se encuentra una cmara rellena de un lquido gelatinoso y transparente
que se denomina humor vtreo. Este lquido proporciona un equilibrio de presiones para que el
glbulo ocular mantenga su forma esfrica.

La retina es una capa de tejido nervioso que cubre aproximadamente las dos terceras partes del ojo
interno. En ella se encuentran las clulas sensibles a la luz que proporcionan la informacin bsica de
visin que posteriormente ser analizada e interpretada en el cerebro. De hecho, la retina puede
interpretarse como una ramificacin del cerebro ya que sus tejidos nerviosos tienen la misma
constitucin, y est conectada al mismo a travs del nervio ptico. La retina es por tanto la parte ms
importante del ojo, pudiendo considerar que la funcin del resto de elementos es, por una parte
proporcionarle nutrientes, y por otra enfocar la luz en la regin apropiada. Es un tejido de cierta
complejidad, formado por varias capas, de las cuales nicamente una capa intermedia contiene clulas
sensibles a la luz. Estas clulas reaccionan a las distintas longitudes de onda incidentes generando
impulsos nerviosos. La luz debe atravesar las capas superficiales hasta alcanzar estas clulas. La capa
ms interna de la retina est formada por complejas interconexiones entre las clulas (sinapsis) en las
que se combina la informacin recibida por estos elementos sensibles y se direcciona hacia el nervio
ptico. Esta informacin es posteriormente procesada en la corteza visual del cerebro donde se
analizan e interpretan las imgenes.

1.4.4 Clulas sensibles: conos y bastones
Existen dos tipos de clulas sensibles a la luz, que se denominan, como consecuencia de su aspecto
fsico externo, conos y bastones. Los bastones son elementos cilndricos, con un dimetro inferior a 1
m, que terminan con una ligera curvatura y que presentan una elevada sensibilidad a la luz. Son muy
abundantes en animales con visin nocturna, y en el hombre son los responsables de la visin en
condiciones de baja luminosidad, tambin denominada visin escotpica. Su respuesta muestra
dependencia de la frecuencia de la luz incidente, teniendo un mximo de sensibilidad para frecuencias
prximas a los 500 nm. La seal que transmiten al cerebro no proporciona informacin sobre la
composicin espectral de la luz, de modo que una iluminacin monocromtica de 500 nm con baja
intensidad puede provocar la misma respuesta que una iluminacin de 600 nm de mayor intensidad,
siendo ambas seales indistinguibles por los rganos de visin. Los bastones, por tanto, no
proporcionan informacin sobre el color de los objetos.

Los conos presentan una menor sensibilidad a la luz y slo se activan en condiciones de iluminacin
normal o diurna (tambin denominada, visin fotpica). Son clulas de aspecto cnico con un
dimetro medio que oscila entre 1 m y 5 m. Presentan una sensibilidad mxima en la longitud de
onda de 555 nm y proporcionan informacin bsica sobre la composicin espectral de la luz por lo
que son los responsables de la percepcin del color. Las curvas de sensibilidad de los conos y los
bastones se representan, de manera aproximada y en tanto por ciento respecto al mximo, en la figura
1.7. Estas curvas se obtienen proyectando en una pantalla dos luces monocromticas de distinta
frecuencia y amplitud y pidiendo que el observador indique cundo considera que ambas tienen el
mismo brillo. En caso en que la intensidad de la luz sea elevada (visin fotpica), el espectador
observar las dos seales con colores distintos, pero deber decidir basndose nicamente en la
sensacin de brillo que le producen las imgenes.

Fig. 1.7 Curvas de sensibilidad espectral de los conos y los bastones

El desplazamiento relativo que existe entre las curvas de visin escotpica y fotpica se conoce con el
nombre de desplazamiento de Purkinje y es el responsable de algunos fenmenos psicofisiolgicos de
cambio de luminosidad aparente que se producen al anochecer. As, al oscurecer, las tonalidades rojas
tienden a perder brillo mientras que las azules parece que aumentan su luminosidad debido al
desplazamiento existente entre las curvas de sensibilidad correspondientes a los conos y a los
bastones. Este efecto es debido a que, al reducirse la iluminacin, la visin cambia gradualmente de
fotpica a escotpica de manera que la sensibilidad del ojo al color rojo disminuye (volvindose ms
oscuro) mientras que la sensibilidad al azul aumenta (apareciendo ms brillante). Esta regin
intermedia entre la visin fotpica y la escotpica, en la que operan simultneamente los conos y los
bastones, se conoce con el nombre de visin mespica.
Sensibilidad
relativa
100 %
50 %
0 %
380 nm 720 nm
Visin Escotpica
Bastones
Visin Fotpica
Conos
500 nm 550 nm
Sensibilidad
relativa
100 %
50 %
0 %
380 nm 720 nm
Visin Escotpica
Bastones
Visin Fotpica
Conos
500 nm 550 nm

La distribucin de los conos y los bastones en la retina no es uniforme. Los primeros tienen una
concentracin mxima en la zona central de la retina, denominada fvea central, donde se sita el eje
de visin. Mantienen una concentracin elevada en las proximidades del eje visual, en una regin
circular de aproximadamente 1 cm de dimetro denominada maculea lutea, que rodea la fvea central.
Los bastones se sitan principalmente en la periferia de la retina, teniendo una concentracin
prcticamente nula en la fvea.

En la figura 1.8 se representa de forma aproximada la densidad de conos y bastones en la retina
respecto al eje visual; se observa que los bastones presentan una concentracin mxima en una regin
circular que forma un ngulo de unos 20 respecto al eje visual y que prcticamente son inexistentes
en la fvea. La distribucin de los bastones es aproximadamente simtrica respecto a la fvea,
exceptuando el denominado punto ciego, que corresponde al punto de la retina de donde parte el
nervio ptico, sobre el que no se encuentran ni conos ni bastones. Se estima que el nmero
aproximado de conos en individuos con visin normal es de unos 7 millones de sensores, mientras que
el de bastones es del orden de los 120 millones.

Fig. 1.8 Distribucin y densidad de los conos y los bastones en la retina

En condiciones de iluminacin normal o alta, la percepcin de la visin es debida fundamentalmente a
los conos, ya que los bastones, de mayor sensibilidad, se saturan y no proporcionan informacin al
cerebro. En condiciones de poca iluminacin, la pupila se dilata permitiendo que la imagen quede
enfocada sobre la regin perifrica de la retina, obteniendo una respuesta debida fundamentalmente a
los bastones. Los conos, al recibir poca energa lumnica, no se excitan, por lo que las imgenes que se
perciben no contienen informacin sobre el color de los objetos. Por ello, en condiciones de baja
iluminacin, es difcil distinguir el color de los objetos, ya que los conos no llegan a excitarse y la
visin es fundamentalmente en blanco y negro. Adems, es en la regin prxima a la fvea donde
quedan correctamente enfocadas las imgenes, por lo que la percepcin del detalle de los objetos no
ser buena si los sensores situados en esta zona no responden. Por ello, resulta difcil leer en
condiciones de baja iluminacin. En otras palabras, podramos decir que la frase De noche, todos los
gatos son pardos, queda ampliamente justificada a partir de la distribucin y la respuesta de los
elementos sensores de luz en el ojo.
0 20
40 -20 -40
100
200
300
D
e
n
s
i
d
a
d

(
m
i
l
e
s
/
m
m
2
)
Angulo respecto al eje visual
270
bastones
conos
Punto
ciego
0 20
40 -20 -40
100
200
300
D
e
n
s
i
d
a
d

(
m
i
l
e
s
/
m
m
2
)
Angulo respecto al eje visual
270
bastones
conos
Punto
ciego
Algunos problemas de visin como la miopa o la hipermetropa se producen como consecuencia de
un incorrecto enfoque de las imgenes en la fvea. En el primer caso, el cristalino enfoca las imgenes
dentro de la regin del humor vtreo, antes de que incidan sobre la retina, mientras que en el segundo
caso, el punto de enfoque de las imgenes queda ms all de la retina. En ambos casos, las imgenes
que se forman en la retina quedan desenfocadas. Esto explica tambin que el problema de la miopa se
acente en condiciones de baja iluminacin, puesto que en este caso, el desenfoque de la imagen en la
periferia de la retina es mayor, con lo que la resolucin de las imgenes cuando solo estn operativos
los bastones es considerablemente inferior a la que se obtiene en la regin prxima a la fvea. El
astigmatismo es un problema visual que se origina como consecuencia de una deformacin de la
crnea.

La percepcin del color se debe a que existen tres tipos distintos de conos que presentan una respuesta
dependiente de la longitud de onda de la luz incidente. La sensacin de color se produce cuando el
cerebro interpreta las seales enviadas por cada uno de estos elementos. La existencia de estos tres
tipos de receptores fue postulada en 1802 por Thomas Young, aunque no fue verificada
experimentalmente hasta 1964 por biofsicos americanos. El postulado de Young fue desarrollado
tericamente por Hermann L. F. von Helmholtz y se conoce como la teora tricromtica de Young-
Helmholtz. Esta teora se fundamentaba en el fenmeno de mezcla de colores previamente descrito
por Newton, quien haba realizado el experimento de descomposicin de la luz blanca en colores
monocromticos descrito en el apartado anterior. Newton tambin observ que si algunos colores
monocromticos se volvan a hacer pasar a travs de un prisma, podan obtenerse, como resultado de
su mezcla, sensaciones de color distintas a las de los colores monocromticos. La mezcla de
pigmentos elementales tambin era utilizada desde antiguo en pintura para obtener distintas
tonalidades y matices de color a partir de pocos colores bsicos.

En trminos modernos, existen tres tipos de conos con respuestas frecuenciales distintas dentro del
margen visible y cuya mxima sensibilidad se corresponde aproximadamente con los colores rojo,
verde y azul. Las curvas de sensibilidad para cada uno de los tipos de conos se representan
esquemticamente en la figura 1.9. Obsrvese que la curva correspondiente al receptor azul est
ampliada en un factor 20 para que pueda compararse con las curvas asociadas a los receptores rojo y
verde, ya que estos ltimos tienen una mayor sensibilidad.

Fig. 1.9 Sensibilidad espectral de los diferentes tipos de conos. La sensibilidad del color azul est multiplicada
por un factor 20 para que su amplitud sea comparable a la de los otros sensores
Sensibilidad
relativa
100 %
50 %
0 %
380 nm 720 nm
azul
verde
rojo
amarillo
Sensibilidad
relativa
100 %
50 %
0 %
380 nm 720 nm
azul
verde
rojo
amarillo
Estas curvas pueden inducir a cierta confusin cuando se comparan con la curva de sensibilidad
espectral asociada a la visin fotpica presentada en la figura 1.7. En este ltimo caso, si bien los
mecanismos de combinacin de las seales recibidas por los distintos tipos de conos no son conocidos
con exactitud, podramos decir que la curva de visin fotpica se correspondera aproximadamente
con la suma de cada una de las curvas asociadas a los distintos receptores. Recurdese que la curva de
visin fotpica se obtiene pidiendo al observador que valore nicamente el brillo de la imagen y que
no tenga en cuenta su color, por lo que incorpora la valoracin conjunta de cada uno de los receptores
al brillo global de la imagen.

La percepcin del color de los objetos depende del tipo de conos que se activan al incidir un
determinado estmulo luminoso en la retina. As, por ejemplo, cuando la luz incidente es una
componente monocromtica correspondiente al amarillo, se activarn los receptores rojo y verde
(vase la grfica de la figura 1.9) que la corteza visual interpretar como una sensacin de amarillo.

Si bien la teora tricromtica de la existencia de tres tipos de sensores lumnicos en la retina ha sido
verificada por distintos experimentos, an no est completamente claro cmo se transmiten estas
seales al cerebro ni como ste las interpreta. La presencia de los tres tipos de conos se ha podido
comprobar con distintas pruebas y experimentos. Una de estas experiencias consiste en examinar la
luz reflejada por la retina bajo diversas condiciones de iluminacin. Cuando la iluminacin es de baja
intensidad, de manera que puede considerarse que solo estn activos los bastones, la luz reflejada tiene
un espectro en el que se detecta una fuerte absorcin de las componentes azules (longitudes de onda
prximas a 500 nm). Esto es debido a que los bastones absorben preferentemente estas componentes
frecuenciales, como se deduce de la curva de sensibilidad escotpica.

En condiciones de iluminacin diurna, donde puede considerarse como buena aproximacin que slo
estn operativos los conos, la luz reflejada por la retina muestra una fuerte absorcin energtica en las
longitudes de onda correspondientes al rojo y al verde debido a la presencia de los pigmentos
erythrolabe y chlorolabe existentes en los conos sensibles a estas frecuencias. La absorcin en la
componente azul es ms difcil de detectar debido a la menor sensibilidad de estos elementos. Otra
experiencia con la que se ha conseguido verificar la presencia de estos tres tipos de sensores consiste
en examinar a travs del microscopio una escisin de la retina humana, observando que los conos
adoptan los colores correspondientes a los tres colores primarios postulados en la teora tricromtica.
Recientemente se ha postulado la existencia de hasta 7 tipos de conos que son sensibles a distintas
longitudes de onda. No obstante, esta hiptesis no est completamente verificada ni aceptada, ya que
slo los 3 tipos principales tienen una densidad importante en la retina. Por lo que respecta a los
sistemas de televisin no parece necesario hacer uso de estos resultados para obtener una buena
calidad de imagen.

La densidad de conos en el ojo humano es muy superior al nmero de seales que se envan al cerebro
a travs del nervio ptico. De hecho, el nmero de fibras del nervio ptico es slo del orden de
decenas de miles mientras que el nmero de conos es del orden de millones. Est plenamente aceptado
que una parte importante del procesamiento de seales implcito en el sistema de visin humano se
realiza directamente en la retina, combinando las seales sensadas por los conos para enviar al cerebro
informacin preprocesada. Esta etapa del sistema visual se denomina visin de bajo nivel y no est
claro hasta qu punto se trata de una interconexin de seales hereditaria o si se realiza un cierto
aprendizaje en las primeras etapas despus del nacimiento.
1.4.5 Estmulos de los fotoreceptores: sensacin de color
La conclusin ms relevante de este mecanismo de visin es que la sensacin de color depende
nicamente de las seales recibidas por los conos y transmitidas al cerebro. Los rganos de visin
sern incapaces de diferenciar dos imgenes que produzcan el mismo patrn de excitacin en los
conos. Hemos visto que una luz monocromtica pura correspondiente al color amarillo provocar una
cierta respuesta de los conos correspondientes al rojo y al verde, ya que ambas curvas muestran cierta
sensibilidad a esta frecuencia. La sensacin de color obtenida podr reproducirse combinando una luz
roja y una luz verde que produzcan la misma respuesta en los conos que la luz amarilla original,
siendo imposible distinguir, para el sistema visual, la composicin espectral de ambos estmulos.

Si el objeto radia un espectro visible arbitrario C
i
(), podemos calcular la respuestas de cada uno de
los sensores construyendo un modelo de percepcin del color basado en las curvas de sensibilidad de
la figura 1.9. Segn este modelo, el estmulo obtenido por los distintos tipos de receptores puede
expresarse como:

max
min
max
min
max
min
) ( ) ( ) (
) ( ) ( ) (
) ( ) ( ) (
d C S C
d C S C
d C S C
i B i B
i G i G
i R i R
(1.4)

donde
R
(C
i
),
G
(C
i
),
B
(C
i
) representan la respuesta de cada uno de los receptores al espectro visible
C
i
() y S
R
(), S
G
(), S
B
() corresponden sus curvas de sensibilidad espectral. Los lmites de
integracin,
min
y
max
son las longitudes de onda extremas en el margen visible.

Atendiendo a este modelo, podemos concluir que dos espectros visibles distintos C
1
() y C
2
()
producirn la misma sensacin de color en el observador siempre que:

) ( ) (
) ( ) (
) ( ) (
2 1
2 1
2 1
C C
C C
C C
B B
G G
R R

(1.5)

Es evidente que esta condicin puede verificarse sin necesidad de que los dos espectros C
1
() y C
2
()
sean iguales. As por ejemplo, para que las componentes
R
coincidan, basta con que las reas bajo las
curvas S
R
()C
1
() y S
R
()C
2
() sean iguales, lo que puede cumplirse aun cuando los dos espectros
sean distintos.

La conclusin directa de este resultado es que, debido a que el sistema visual humano no identifica el
espectro visible completo de los objetos, sino que nicamente utiliza estas tres componentes
ponderadas, es posible que objetos con espectros completamente distintos puedan producir las mismas
sensaciones de color. Esto justifica que todos los sistemas de representacin de imgenes utilicen
nicamente tres muestras del espectro de la escena sin que ello represente una prdida de informacin
desde el punto de vista del espectador.

Esta idea es el principio bsico sobre el que se basa la sntesis de los colores: para reproducir el color
de un objeto que tiene un espectro C
1
() basta con sintetizar un espectro C
2
() que produzca los
mismos estmulos visuales que el original. Veremos los detalles de esta idea en el siguiente apartado.

Resumiendo, podemos obtener cualquier sensacin de color combinando los colores primarios para
que la respuesta de los tres tipos de conos coincida con la que se obtiene con los estmulos del mundo
real, de modo que cualquier estimulo luminoso, sea cual sea su composicin espectral, puede ser
sustituido por una mezcla adecuada con los colores primarios rojo, verde y azul sin que sea
perceptualmente distinguible la diferencia entre ambos estmulos. As pues, la escena original
(x,y,z,t,) puede sustituirse, sin prdida aparente de informacin para un observador humano, por
tres funciones que representan las tres componentes de color de la escena tal y como habamos
postulado en la ecuacin 1.2.

Visin dicromtica

El daltonismo es un defecto de la visin relacionada con la carencia de respuesta de uno de los tres
tipos de conos. Alrededor de un uno por ciento de los varones son dicromticos, es decir, utilizan slo
dos de los colores primarios para la percepcin del color. Los individuos con ceguera en la
componente roja son incapaces de distinguir entre las tonalidades rojas, naranjas, amarillas y verdes
resultantes de la mezcla entre los colores rojo y verde. Todas estas tonalidades las observan como
verdes. La ceguera en la componente roja tampoco permite discriminar entre las tonalidades
anteriores, aunque en este caso se observan como rojas. Estos dos tipos de daltonismo slo pueden
diferenciar entre los colores verde, rojo y amarillo basndose en su brillo, por lo que tienen
dificultades para distinguir los colores de un semforo o de distintos elementos habituales en
seguridad vial. La luz blanca la observan coloreada debido a la falta de respuesta en uno de los colores
primarios. La ceguera en la componente azul es ms rara y slo afecta a un individuo de cada 50000.
En este caso pueden distinguirse las distintas tonalidades entre el rojo y el verde y la capacidad global
de discriminacin de colores es bastante superior a los otros dos tipos de daltonismo.

1.4.6 Tradas RGB en displays de TV
En sistemas de televisin en color las imgenes se descomponen en sus tres colores bsicos mediante
filtros pticos cuyos principios de funcionamiento describiremos en un apartado posterior. La seal
que se enva al receptor contiene informacin sobre las tres componentes de color pero no describe el
contenido espectral completo de los objetos. Las imgenes se presentan al espectador en un display,
que normalmente es un tubo de rayos catdicos (o ms recientemente displays de cristal lquido), en el
que se superponen los tres colores bsicos y a partir de los cuales, el sistema visual recompondr la
informacin de color completa. En el caso de los tubos de rayos catdicos, la imagen que se presenta
al espectador se obtiene iluminando tres tipos distintos de fsforos que emiten en longitudes de onda
prximas a los colores bsicos. Los fsforos son de tamao reducido y se encuentran distribuidos
uniformemente en toda la superficie de la pantalla de modo que al observarlos desde cierta distancia el
ojo integra sus contribuciones observando la mezcla de colores y no sus colores individuales.

En la figura 1.10 se representa un esquema de la distribucin de los fsforos en la pantalla de un
receptor. Cada grupo de tres fsforos se denomina trada y, para el caso representado en la figura, los
fsforos tienen forma aproximadamente circular y su distribucin es tal que la trada tiene una forma
triangular. Existen otras posibles formas y distribuciones, como en el caso de los tubos de imagen del
tipo Trinitron, en las que los fsforos se distribuyen en bandas verticales y que permiten aprovechar
una mayor rea de iluminacin en la pantalla. En el captulo dedicado a los displays analizaremos con
cierto detalle las distintas alternativas existentes en el mercado y discutiremos sus ventajas e
inconvenientes.

Fig. 1,10 Disposicin en delta de los fsforos en un display

Los colores exactos de los fsforos son muy importantes. En principio, eligiendo un determinado
conjunto de tres fsforos, cuyas radiaciones estn centradas aproximadamente en las frecuencias de
los colores rojo, verde y azul, pueden obtenerse casi todas las sensaciones de color. Para obtener un
determinado color bastar con ajustar el nivel de radiacin de cada fsforo para que activen los conos
de la retina en la proporcin adecuada. Sin embargo, si se sustituye uno de los fsforos por otro cuyo
espectro de radiacin no sea exactamente igual, la sensacin de color se modifica apreciablemente,
siendo necesario recalcular las intensidades de radiacin de todos los fsforos. Por ello, en los
sistemas de televisin debe establecerse a priori las caractersticas de radiacin y los colores bsicos
de los fsforos para que todos los receptores vean los mismos colores.

1.4.7 Sistemas de coordenadas para la representacin del color: principios de colorimetra
Hemos visto que es fundamental definir sistemas de coordenadas que permitan representar los colores
sin ambigedad y con arreglo a algn convenio preestablecido. Con ello podremos cuantificar la
informacin de color y estableceremos las bases para transmitir esta informacin a los receptores. La
medida, cuantificacin y representacin grfica de los colores y sus posibles combinaciones se conoce
con el nombre de colorimetra.

La definicin de un sistema de coordenadas para cuantificar los colores exige especificar con
exactitud las caractersticas espectrales primarios, de modo que un color pueda identificarse como una
tripleta de nmeros que establece en que proporcin debe intervenir cada uno de estos primarios en su
R G
B R G
B R G
B R G
B R G
B R G
B R G
B R G B R
R
R G
B R G
B R G
B R G
B R G
B R G
B R G
B R G B R
R
sntesis. Una vez fijado el conjunto de primarios, la obtencin de la tripleta de coordenadas asociadas
a un determinado espectro C
1
() requiere la resolucin de un sistema de lineal ecuaciones. El
planteamiento del problema es el siguiente:

Supongamos que p
R
(), p
G
(), p
B
() representan los espectros de radiacin asociados a cada uno
de los tres colores considerados como primarios y denotemos como
R
,
G
,
B
las coordenadas
asociadas a un color C
1
() representado sobre el anterior conjunto de colores primarios.

El color que obtenemos ponderando los primarios mediante estas coordenadas es:

) ( ) ( ) ( ) (
2
+ +
B B G G R R
p p p C (1.6)

Es evidente que si las coordenadas anteriores representan correctamente el color, los estmulos
producidos por C
1
() y C
2
() en los tres tipos de receptores visuales deben coincidir. Esto implica
que deben verificarse las siguientes ecuaciones:

) ( ) ( ) ( ) ( ) (
) ( ) ( ) ( ) ( ) (
) ( ) ( ) ( ) ( ) (
2 1
2 1
2 1
B B B G B G R B R B B
B G B G G G R G R G G
B R B G R G R R R R R
p p p C C
p p p C C
p p p C C
+ +
+ +
+ +
(1.7)
donde hemos aplicado que la relacin integral que define el clculo de la respuesta de los
receptores de la retina es lineal.

Ntese que los trminos de la derecha son escalares que, una vez conocidos el espectro del color a
sintetizar C
1
() y las curvas de sensibilidad de cada uno de los receptores, podran ser calculados
a partir de la ecuacin 1.4. Los trminos
X
(p
Z
) corresponden a ecuaciones anlogas que tambin
podran calcularse a partir del espectro visible de los primarios y las curvas de sensibilidad. En
este caso, las expresiones vendran dadas por:

max
min
) ( ) ( ) ( d p S p
Z X Z X
(1.8)
donde los subndices X y Z se utilizan para denotar cualquiera de las componentes R,G,B.

La ecuacin 1.7 puede expresarse en forma matricial como:

1
1
1
]
1
1
1
1
]
1
1
1
1
]
1
B
G
R
B B G B R B
B G G G R G
B R G R R R
B
G
R
p p p
p p p
p p p
C
C
C
) ( ) ( ) (
) ( ) ( ) (
) ( ) ( ) (
) (
) (
) (
1
1
1
(1.9)

que en forma vectorial escribiremos:

r
r
P (1.10)
donde P representa la matriz asociada a los colores primarios que definen este sistema de
coordenadas, y los vectores y los estmulos de los sensores y las coordenadas del color
respectivamente.

Esta relacin algebraica simple tiene un gran inters terico, puesto que establece que la relacin entre
las coordenadas de color y los estmulos recibidos por los conos es lineal (siempre de acuerdo con el
modelo simplificado que estamos utilizando). Esto permite establecer dos resultados importantes:

1) Las coordenadas de un color obtenido como superposicin de dos espectros C
1
() y C
2
() se
corresponden con la suma de las coordenadas asociadas a cada uno de los espectros.
2) Si la amplitud del espectro incidente aumenta en un factor , las coordenadas del color
asociado tambin quedan afectadas por este mismo factor.

Estos dos resultados permiten que podamos operar con las coordenadas de los colores como si se
tratara de vectores algebraicos. La suma de dos tripletas de coordenadas representar la combinacin
de dos colores y el producto de una tripleta por un escalar, un aumento o disminucin de luminosidad,
ya que, en este caso, la composicin espectral de la luz no se modifica.

1.4.8 Normalizacin de las coordenadas de color: coeficientes triestmulo
Es habitual trabajar con coordenadas de color normalizadas, de manera que el color blanco
corresponda a la tripleta (1,1,1). Con ello se consigue que las tres componentes tengan rdenes de
magnitud parecidos, simplificando la interpretacin de las posibles mezclas de colores. El proceso de
normalizacin puede considerarse como un ajuste de amplitud de los espectros primarios que se
utilizan como patrn.

Los sistemas de coordenadas en los que el color blanco queda representado con todas las componentes
igual a la unidad son los ms utilizados y reciben el nombre de componentes triestmulo.

1.4.9 Cambio de sistema de coordenadas
Veremos que existen diversos sistemas de referencia para expresar cuantitativamente los colores. El
uso de uno u otro sistema de coordenadas depende de la problemtica que estemos considerando, por
lo que suele ser habitual tener que realizar cambios de coordenadas para expresar los coeficientes
triestmulo en diferentes sistemas.

El cambio de coordenadas se realiza, en todos los casos, multiplicando el vector de coeficientes por
una matriz 3 3. En efecto, supongamos que t y t son los coeficientes triestmulo que representan a
un mismo color en dos sistemas distintos que vienen caracterizados por las matrices Q y Q:

' ' ) (
) (
t Q
t Q
r
r
r
r

C
C
(1.11)
La relacin entre los coeficientes triestmulo en los dos sistemas viene dada por:

t R t Q Q' t
r r r

1
) ( ' (1.12)

donde R representa la matriz de cambio de sistema de coordenadas. Evidentemente, la relacin
inversa se obtiene multiplicando por la inversa de esta matriz:

'
1
t R t
r r

(1.13)

Es evidente que aunque slo hemos deducido estas ecuaciones para primarios normalizados
(coeficientes triestmulo), el tipo de relacin se mantiene aun cuando estemos considerando un sistema
de coordenadas no normalizado.

Estas transformaciones lineales entre distintos sistemas de coordenadas tienen una gran importancia
desde el punto de vista tecnolgico, pues, en principio, permiten desvincular el tipo de fsforos
utilizados en recepcin de las seales transmitidas. As por ejemplo, si un determinado fabricante
decide introducir un nuevo tipo de fsforos en sus receptores, slo requerir realizar la transformacin
lineal que relaciona su sistema de reproduccin con el codificado en la transmisin para adaptarse a
las caractersticas de los nuevos elementos.

1.4.10 Sistema de coordenadas con primarios monocromticos
En 1931 el C.I.E. (Commission Internationale de LEclaire comit internacional dedicado a la
establecer normativas sobre la representacin del color) propuso utilizar como sistema de coordenadas
para representar los colores un conjunto de primarios monocromticos. Las longitudes de onda de
estos primarios son de 700 nm, 546.1 nm y 435.8 nm para el rojo, verde y azul respectivamente.

Al tratarse de colores monocromticos, pueden expresarse analticamente como:

) 10 8 , 435 ( ) (
) 10 1 , 546 ( ) (
) 10 700 ( ) (
9
9
9

B
G
R
p
p
p
(1.14)

donde () representa la funcin Delta de Dirac, de modo que en este caso, los coeficientes de la
matriz P asociada a este sistema de coordenadas representan muestras sobre las curvas de sensibilidad
de los tres tipos de receptores de la retina. En efecto, podemos escribir:

) ( ) ( ) ( ) ( ) ( ) (
max
min
max
min
Z X Z X Z X Z X
S d S d p S p

(1.15)

de modo que particularizando los valores de X y Z a las distintas componentes de color R, G y B,
obtenemos una matriz P en la que cada fila est formada por tres muestras de la curva de sensibilidad
de un tipo de conos en las frecuencias asociadas a los colores considerados como primarios:


1
1
1
]
1
) ( ) ( ) (
) ( ) ( ) (
) ( ) ( ) (
B B G B R B
B G G G R G
B R G R R R
S S S
S S S
S S S
P (1.16)

Este conjunto de primarios se normaliza respecto a un blanco de referencia que tiene un espectro
plano en todo el margen visible. Los coeficientes triestmulo obtenidos por esta normalizacin se
denotaran como R
C
, G
C
y B
C
.

1.4.11 Sistema de coordenadas basado en los fsforos del receptor NTSC
La seleccin de los fsforos para el sistema NTSC se realiz en 1953 teniendo en cuenta los
materiales existentes en aquella poca y las tendencias futuras. Los colores seleccionados, si bien
estn centrados sobre las regiones roja, verde y azul del espectro visible, no fueron puramente
monocromticos por cuanto el rendimiento luminoso de este tipo de materiales es muy bajo y hubiera
sido necesario aplicar grandes potencias de seal para excitarlos adecuadamente. En este caso los
primarios estn normalizados para que, con los tres componentes triestmulo igual a la unidad, se
obtenga un color aproximadamente blanco que se utiliza como referencia. Este blanco de referencia
es ligeramente distinto que el definido por el CIE. Los coeficientes triestmulo utilizados en este
sistema de coordenadas se denotan como R
N
, G
N
y B
N
.

La relacin matricial entre las componentes del receptor NTSC y los primarios monocromticos del
C.I.E. viene dada por:

1
1
1
]
1
1
1
1
]
1

1
1
1
]
1
C
C
C
N
N
N
B
G
R
B
G
R
897 . 0 069 . 0 008 . 0
203 . 0 320 . 1 129 . 0
091 . 0 156 . 0 842 . 0
(1.17)

Evidentemente, la relacin inversa puede obtenerse invirtiendo la matriz de cambio de coordenadas.

A pesar que la tecnologa de fabricacin de fsforos ha evolucionado considerablemente desde 1953,
este sistema de coordenadas sigue siendo uno de los ms utilizados para referirse a las seales que se
envan a travs de cualquier sistema de televisin. De hecho, veremos que aunque tanto en el sistema
NTSC como en el PAL, las seales de informacin de color no se corresponden directamente con las
componentes R
N
, G
N
y B
N
, siempre se suelen expresar en funcin de este sistema de coordenadas.
Debido a su gran uso, siempre que nos refiramos de manera genrica a las componentes R, G, B, sin
hacer referencia a ningn subndice, entenderemos que se trata de este sistema de coordenadas.

Desde 1953 hasta la aparicin de los primeros sistemas de televisin en color en Europa, el desarrollo
de materiales luminiscentes evolucion considerablemente, por lo que la EBU (European
Broadcasting Union) defini unos colores para las tradas ligeramente distintos a los utilizados en el
sistema NTSC. Estas tradas, aunque cubren algo peor los matices de color en la gama del verde-azul,
permiten obtener una luminosidad de pantalla superior a la del sistema NTSC, proporcionando una
excelente sensacin de plenitud de color. Tambin el SMPTE (Society of Motion Picture and
Television Engineers) ha definido un nuevo conjunto de primarios cuyo propsito es adaptarse a las
caractersticas de los diversos tipos de fsforos que se utilizan actualmente en el propio sistema
NTSC. Sin embargo, a pesar de estas actualizaciones, sigue siendo prctica habitual referirse al
sistema de fsforos NTSC original. Denotaremos como R
P
, G
P
, B
P
y R
S
, G
S
, B
S
los coeficientes
triestmulo asociados a los sistemas de coordenadas definidos por la E.B.U. y el S.M.P.T.E.
respectivamente. Actualmente, cada fabricante suele utilizar fsforos con caractersticas ligeramente
distintas, por lo que, en cualquier caso, siempre debe realizarse un cambio de variables en el propio
receptor.

En la figura 1.11 se representan los valores de los coeficientes triestmulo correspondientes al sistema
NTSC necesarios para obtener los distintos colores monocromticos. La grfica indica, para cada
longitud de onda, los valores tericos con los que deberan excitarse los fsforos para reproducir cada
color monocromtico. La principal consecuencia de este resultado es que existe toda una gama de
longitudes de onda que requeriran utilizar una componente negativa, lo que evidentemente impide
generar estos colores, ya que los fsforos slo admiten excitaciones positivas. En consecuencia, la
gama cromtica que puede reproducirse con estos fsforos no es completa y algunos colores slo
pueden ser aproximados. Este problema, como veremos, es de carcter general para todo tipo de
fsforos y de primarios reales.

Fig. 1.11 Coeficientes triestmulo NTSC para la obtencin de colores monocromticos

La seleccin de un tipo u otro de fsforo permite cubrir gamas cromticas distintas y obtener matices
distintos con mayor o menor brillo en la pantalla del reproductor, pero en ningn caso cubrir
completamente todos los colores. Este resultado puede parecer en principio decepcionante, pero se
trata de un problema casi exclusivamente de carcter conceptual, pues la gama de colores que pueden
obtenerse es suficientemente amplia como para que el espectador no sea consciente de esta
deficiencia.
-0.1
0
0.1
0.2
0.3
0.4
400 500 600 700
Coeficientes
Triestmulo
nm
B
G
R
-0.1
0
0.1
0.2
0.3
0.4
400 500 600 700
Coeficientes
Triestmulo
nm
B
G
R

El C.I.E. desarrollo un sistema de coordenadas, denominado XYZ, basado en unos primarios
artificiales (inexistentes) que permite expresar de modo analtico toda la gama de colores utilizando
tan slo coeficientes triestmulo positivos. Antes de examinar los detalles de este sistema, cuyo uso es
tambin bastante frecuente, veremos algunas alternativas para representar grficamente los colores en
el sistema R
N
, G
N
, B
N
. Estas tcnicas de representacin son generalizables a cualquier sistema de
coordenadas por lo que suprimiremos el subndice en las componentes triestmulo.

1.4.12 Tringulo de Maxwell y diagrama cromtico
Nuestro objetivo ahora es poder representar los distintos colores sobre una superficie plana de modo
que en cada punto del plano podamos asignarle un color cuyas componentes triestmulo sean
fcilmente identificables. El problema fundamental es que estas componentes forman un espacio
tridimensional, por lo que no es posible una representacin conjunta del vector y su color asociado
sobre el plano. En la figura 1.12 se representan esquemticamente distintas componentes triestmulo
como vectores en un espacio tridimensional. Es importante observar que la informacin de tonalidad
de un color est codificada en la direccin del vector, ya que, como hemos visto, el mdulo representa
tan slo el brillo o intensidad de la luz, cambiando todas las componentes de forma proporcional
cuando se produce un cambio de magnitud del vector siempre que se mantenga su direccin.

Podemos aprovechar esta caracterstica para normalizar, segn algn criterio, las componentes
triestmulo de modo que se pierda la informacin de magnitud de los vectores. Con ello, perderemos
una de las variables por lo que ya ser posible obtener una representacin plana de los colores.

Fig 1.12 Representacin de las componentes triestmulo en un espacio tridimensional

La normalizacin ms comn consiste en escalar las componentes triestmulo de manera que su suma
siempre sea igual a la unidad. Esta normalizacin puede parecer extraa desde un punto de vista
matemtico, ya que lo ms usual sera utilizar una normalizacin respecto al mdulo, de modo que
todos los vectores resultantes tuvieran mdulo unitario. Sin embargo, esta filosofa tampoco tiene
R
G
B
R
G
B
mucho sentido en colorimetra por cuanto, aunque el mdulo y el brillo estn relacionados, ste ltimo
depende tambin de la direccin, por lo que dos vectores con mdulos iguales no tienen por qu tener
el mismo brillo. Esto puede parecer algo confuso, pero tngase en cuenta que nicamente hemos
demostrado que un cambio de mdulo supone un cambio en la intensidad de la luz y no en su
tonalidad, por cuanto se mantienen las contribuciones relativas de cada componente. Un cambio en la
direccin supone un cambio tanto de la tonalidad como de la intensidad. Es fcil comprender que se
produzca este cambio en la intensidad de la luz si tenemos en cuenta que la sensibilidad del ojo es
distinta para cada componente, de modo que cuando vara su contribucin relativa tambin vara su
sensacin lumnica. Finalmente, recurdese que nuestro propsito es representar las distintas
tonalidades de color en un plano, sin inters especifico en que todos ellos tengan el mismo brillo. La
normalizacin que se utiliza es simple y permite relacionar rpidamente las componentes resultantes.

Fig. 1.13 Tringulo de Maxwell y diagrama cromtico sobre el espacio de coeficientes triestmulo

Los coeficientes resultantes de esta normalizacin se denominan coeficientes cromticos y se denotan
con letras minsculas:

B G R
B
b
B G R
G
g
B G R
R
r
+ +
+ +
+ +
; ;
(1.18)

Es evidente, por la propia definicin de estos coeficientes, que su suma se mantiene siempre igual a la
unidad por lo que uno de ellos es redundante y puede calcularse en funcin de los otros dos:

1 + + b g r (1.19)

Estas nuevas variables nos ofrecen dos alternativas para representar grficamente las distintas
tonalidades de color sobre unos planos que se conocen con el nombre de tringulo de Maxwell y
diagrama cromtico. Ambos planos se representan grficamente en la figura 1.13 sobre el espacio
tridimensional de los componentes triestmulo y corresponden con los planos R+G+B=1 y B=0
respectivamente. En cada punto del tringulo de Maxwell se representan los colores obtenidos con los
coeficientes triestmulos que verifican que la suma de sus componentes es igual a la unidad. El
diagrama cromtico, cuyo uso es ms frecuente que el del tringulo de Maxwell, puede considerarse
como una proyeccin del tringulo de Maxwell sobre el plano B=0. Dadas las dos componentes (r, g)
R
G
B
R
G
B Tringulo de Maxwell
Diagrama de cromaticidad
R+G+B=1
B=0
R
G
B
R
G
B Tringulo de Maxwell
Diagrama de cromaticidad
R+G+B=1
B=0
de un color en el diagrama cromtico, pueden calcularse con facilidad las componentes triestmulo sin
ms que imponer la condicin de que la suma de las tres componentes debe ser igual a la unidad: (r, g,
1-r-g).

1.4.13 Representacin grfica de la mezcla de colores
En la figura 1.14 se representa una mezcla entre dos colores C
1
y C
2
en los tres sistemas de
representacin que estamos utilizando. En el caso de componentes triestmulo, la suma de los colores
se corresponde con una suma de vectores convencional y se representa exclusivamente para ayudar a
comprender el resultado de esta combinacin en los otros dos sistemas de representacin en los que,
como resulta evidente a partir del dibujo, el color resultante se encuentra en la recta que une los
colores originales. La posicin exacta dentro de esta recta depende de la participacin de cada color en
la mezcla, situndose ms cerca del color cuya suma de componentes triestmulo sea mayor.

Fig. 1.14 Representacin grfica de la mezcla de colores

Determinemos la posicin exacta del valor de la mezcla para el caso del diagrama cromtico.
Supongamos que las componentes triestmulo de los colores originales vienen dadas por:

); , , (
); , , (
2 2 2 2
1 1 1 1
B G R C
B G R C
(1.20)

Las componentes cromticas de estos dos colores son:

) / , / (
) / , / (
2 2 2 2 2
1 1 1 1 1
L G L R C
L G L R C
C
C
(1.21)

donde hemos definido:

R
G
B
C1
C2
C1+C2
C1
C2
C1+C2
C1
C2
C1+C2
Coeficientes
Triestmulo
Tringulo de
Maxwell
Diagrama
Cromtico
R
G
B
C1
C2
C1+C2
C1
C2
C1+C2
C1
C2
C1+C2
Coeficientes
Triestmulo
Tringulo de
Maxwell
Diagrama
Cromtico

2 2 21 2
1 1 1 1
B G R L
B G R L
+ +
+ +
(1.22)

Las componentes triestmulo y las cromticas de la mezcla de los dos colores vienen dadas por:

; ,
); , , (
2 1
2 1
2 1
2 1
, 2 1
2 1 2 1 2 1 2 1
,
_
+
+
+
+
+ + +
+
+
L L
G G
L L
R R
C
B B G G R R C
C
(1.23)

Este resultado se representa grficamente en la figura 1.15, donde se indica explcitamente que la
mezcla se sita en un punto de la recta que une los dos colores a una distancia proporcional a L
1
del
color C
2
y L
2
del color C
1
. Esto justifica la idea intuitiva de que la mezcla se sita ms o menos cerca
de los colores originales dependiendo del grado de participacin de stos.

Fig. 1.15 Procedimiento para la mezcla de colores en el diagrama cromtico

Comprobaremos este resultado analticamente slo para una de las componentes cromtica.
Supongamos que r
1
, r
2
y r
1+2
son las componentes rojas correspondientes a los colores C
1
, C
2
y C
1+2
.
De acuerdo con la grfica de la figura 1.15, hemos de comprobar que:

2
2 1
1 2
1 2 1
) (
L
L L
r r
r r
+
+
+
(1.24)
donde r
2
-r
1
representa la distancia entre las dos componentes r.

Sustituyendo r
1
=R
1
/L
1
y r
2
=R
2
/L
2
en la parte derecha de la igualdad anterior obtenemos:

r
g
C1
C2
C1+2
d
d L
2
/(L
1
+ L
2
)
d L
1
/(L
1
+ L
2
)
r
r
g
C1
C2
C1+2
d
d L
2
/(L
1
+ L
2
)
d L
1
/(L
1
+ L
2
)
r

2 1
2 1
2 1 1
2 1 1 2 2 1 1 1
2
2 1
1
1
2
2
1
1
2
2 1
1 2
1
) (
) (
L L
R R
L L L
L R L R L R L R
L
L L
L
R
L
R
L
R
L
L L
r r
r
+
+
+
+ +

+
,
_
+
+
+
(1.25)

que concuerda con la expresin de la componente cromtica roja obtenida en la ecuacin 1.23.

El resultado obtenido es vlido para cualquier componente cromtica, y por lo tanto el mismo
procedimiento puede aplicarse para el clculo grfico de la mezcla de colores en el tringulo de
Maxwell. La figura 1.16 ilustra como aplicar el mtodo en este caso.

Fig. 1.16 Procedimiento grfico para la mezcla de colores en el tringulo de Maxwell

1.4.14 Situacin de los colores en el tringulo de Maxwell y en el diagrama de cromaticidad
Una vez conocido cmo se obtiene una mezcla de colores sobre el tringulo de Maxwell, resulta fcil
ver dnde se situarn los distintos colores que resulten de la combinacin de los primarios.
Evidentemente, los vrtices del tringulo se corresponden con los propios colores primarios, que en
este caso sern los correspondientes a los fsforos del sistema NTSC. Por ello, la lnea base del
tringulo, que une los primarios rojo y azul, contiene la gama de rojos, magentas y azules conseguida
mediante la combinacin de estos dos primarios. Anlogamente, en el lado izquierdo del tringulo
aparece la gama de azules, cianos y verdes obtenidos al combinar los primarios azul y verde y en el
lado derecho las tonalidades rojas, amarillas y verdes resultado de combinar los dos primarios
restantes.

El resultado obtenido por la intervencin conjunta de los tres colores primarios puede derivarse
grficamente descomponiendo esta mezcla de colores en dos partes, tal y como se indica en la figura
1.17. En primer lugar podemos calcular el resultado de la combinacin entre los primarios rojo y azul,
lo que produce un color situado sobre la lnea base del tringulo de Maxwell (C
X
). Este color puede
mezclarse posteriormente con el verde, obteniendo el resultado mostrado en la figura e indicado como
b r
g
C1
C2
C1+2
d
d L
2
/(L
1
+ L
2
)
d L
1
/(L
1
+ L
2
)
b r
g
C1
C2
C1+2
d
d L
2
/(L
1
+ L
2
)
d L
1
/(L
1
+ L
2
)
C
Y
. De acuerdo con este procedimiento, es evidente que combinando los tres colores bsicos podemos
desplazarnos a travs de todo el tringulo limitado por estos colores.

Fig 1.17 Mtodos para la situacin de los colores en el tringulo de Maxwell

Fig. 1.18 Lneas de matiz y saturacin de color en tringulo de Maxwell

Una alternativa a este procedimiento que ayuda a comprender mejor la procedencia de los colores y en
qu grado interviene cada primario en su formacin consiste en trazar la recta que pasa desde el
blanco al color cuya composicin queremos analizar y prolongarla hasta que intersecte con uno de los
lados del tringulo. El blanco corresponde a las coordenadas cromticas (1/3,1/3,1/3), por lo que est
situado en el baricentro del tringulo de Maxwell. En la figura 1.17 se muestra como la recta que pasa
b r
g
C
X
C
y
C
A
Blanco
C
B
b r
g
C
X
C
y
C
A
Blanco
C
B
b r
g
Mati ces
Azul - Magenta - Roj o
M
a
t
i
c
e
s
V
e
r
d
e

-
A
m
a
r
i
l
l
o

-
R
o
j
o
M
a
t
i
c
e
s
A
z
u
l

-
C
i
a
n
o

-
V
e
r
d
e
Desaturaci n
Bl anco Matiz
Col or
por el blanco y el color C
A
, intersecta los lados del tringulo en el color C
B
. Esto significa que C
A

puede obtenerse aadiendo una cantidad adecuada de blanco al color C
B
, el cual, al estar situado sobre
la lnea que limita el tringulo, puede obtenerse como una mezcla en la que intervienen nicamente
los dos primarios situados en los vrtices de ese lado del tringulo.

Esta ltima interpretacin nos permite considerar que los colores estn distribuidos segn su tonalidad
y saturacin en direcciones distintas. As, los lados del tringulo corresponden a distintas tonalidades
o matices de color obtenidos como la combinacin de dos primarios, mientras que las lneas que
partiendo de uno de los lados del tringulo van hacia el baricentro (posicin del blanco) corresponden
a versiones de la misma tonalidad ms o menos saturadas de blanco, dependiendo de su proximidad al
centro. Esta distribucin de los colores se indica esquemticamente en la figura 1.18.

En la figura 1.19 se simulan los colores obtenidos por la combinacin de los primarios en los lados del
tringulo y tambin se ilustra la degradacin al blanco que experimentan distintas tonalidades
conforme nos aproximamos al centro del tringulo.

Fig. 1.19 Simulacin de la distribucin de los colores en el tringulo de Maxwell

Los resultados que hemos obtenido para el tringulo de Maxwell pueden generalizarse directamente
para el diagrama de cromaticidad sin ms que considerar que ste ltimo puede entenderse como una
proyeccin del primero sobre el plano b=0. Por ello, todas los procedimientos geomtricos para
calcular la combinacin entre dos o ms colores se mantienen, con la salvedad de que en este caso las
coordenadas del color blanco corresponden al punto (1/3, 1/3) del plano. En las figura 1.20 y figura
1.21 se representan la distribucin de los colores obtenida en este sistema de representacin.

Fig. 1.20 Lneas de matiz y saturacin de color en el diagrama de cromaticidad

Fig. 1.21 Simulacin de colores en el diagrama de cromaticidad

Ejemplo: Clculo de los coeficientes triestmulo a partir del diagrama de cromaticidad

Consideremos un ejemplo de cmo pueden derivarse las componentes triestmulo de un color que
tenemos situado sobre el diagrama cromtico, tal y como se indica en la figura 1.22, en el punto
(1/6,1/3). Si no se dispone de ninguna informacin adicional que permita estimar el brillo, slo
podremos calcular la participacin relativa de cada uno de los primarios en la formacin del color,
r
g
Matices
Azul - Magenta - Rojo
M
a
t
i
c
e
s
A
z
u
l

-
C
i
a
n
o

-
V
e
r
d
e
M
a
t
i
c
e
s
V
e
r
d
e

-
A
m
a
r
i
l
l
o

-
R
o
j
o
Desaturacin
Blanco Matiz
Color
quedando indeterminada su amplitud. En nuestro ejemplo disponemos de las coordenadas r y g, y por
lo tanto, podemos estimar la componente b que vendr dada por:

2 / 1 1 g r b (1.26)

De acuerdo con ello, cualquier color cuyas componentes triestmulo sean:

) 2 / 1 , 3 / 1 , 6 / 1 ( ) , , ( k B G R (1.27)

siendo k una constante arbitraria, quedar proyectado sobre el punto (1/6, 1/3) del diagrama de
cromaticidad. Supongamos ahora que disponemos de la informacin adicional que este color se ha
obtenido aadiendo una cantidad (0.8, 0.8, 0.8) de blanco a una combinacin entre los primarios azul
y verde. Esta informacin adicional nos permitir deducir los componentes triestmulo exactos.

Fig. 1.22 Ejemplo para relacionar componentes cromticas y triestmulo

El color C
A
, de acuerdo con el esquema de la figura 1.22, debe corresponder a una mezcla entre los
primarios azul y verde que produce el color C
B
. Adems, como C
A
se encuentra a la misma distancia
de C
B
que del blanco (W), podemos deducir que la suma de las componentes triestmulo de C
B
y del
blanco deben coincidir. Es decir:

B B B
B G R L L + + + + 4 . 2 8 . 0 8 . 0 8 . 0
2 1
(1.28)

Las coordenadas del color C
B
en el diagrama de cromaticidad son: (0, 1/3), por lo que sus coeficientes
triestmulo deben poder expresarse como:

) 3 / 2 , 3 / 1 , 0 ( ) , , ( k B G R
B B B
(1.29)
Blanco
r
g
1/3
1/3
C
A
C
B
1/6 1
1
W
Blanco
r
g
1/3
1/3
C
A
C
B
1/6 1
1
W

Esto nos permite deducir que el valor de la constante k debe ser de 2,4. Una vez conocidas las
componentes de C
B
, debemos aadir la cantidad de blanco especificada para obtener el color C
A
:

) 4 . 2 , 6 . 1 , 8 . 0 ( ) 8 . 0 , 8 . 0 , 8 . 0 ( ) 3 / 2 , 3 / 1 , 0 ( 4 . 2 ) , , ( +
A A A
B G R (1.30)

Este ejemplo sugiere un procedimiento directo para extraer sistemticamente la cantidad de blanco
existente en cualquier color, obteniendo as un nuevo color como combinacin de dos nicos
primarios cuyo matiz es igual al original pero que est completamente saturado. As, es evidente que
los colores con componentes triestmulo (0.3, 0.6, 0.8) y (0, 0.3, 0.5) tienen el mismo matiz, aunque
en el primero intervienen los tres primarios, mientras que en el segundo slo intervienen el verde y el
azul, siendo por tanto una versin ms saturada.

1.4.15 Algunos comentarios sobre la representacin grfica de los colores
El diagrama de cromaticidad facilita comprender el efecto de un cambio de primarios en la gama de
colores que pueden reproducirse. En la figura 1.23 se ilustra el efecto de sustituir los primarios RGB
originales, situados en los vrtices del tringulo, por un nuevo grupo de primarios. Es evidente, a
partir de las reglas de mezcla de colores que hemos desarrollado, que la gama de colores reproducibles
estar limitada por el tringulo cuyos vrtices son las posiciones de estos nuevos primarios.

Fig. 1.23 Efecto de la seleccin de nuevos primarios sobre un diagrama referido a los primarios antiguos

En el caso representado en la figura 1.23, esta regin aparece sombreada y el nuevo grupo de
primarios puede reproducir menos colores que el conjunto original, ya que ste segundo tringulo est
completamente comprendido dentro del primero. Esto no es necesariamente as, ya que es posible
elegir unos nuevos colores base que tengan alguna de las componentes negativas, con lo que pueden
existir nuevas regiones no cubiertas por el sistema original.
1/3
1/3
1
1
Otros
Primarios
Primarios
NTSC
1/3
1/3
1
1
Otros
Primarios
Primarios
NTSC
Desde un punto de vista analtico, un cambio de sistema de coordenadas supone identificar la regin
sombreada correspondiente a los nuevos primarios con un nuevo tringulo rectngulo, con dos de sus
lados de longitud unidad y situados sobre los ejes de coordenadas. De esta forma, queremos indicar
que un cambio de coordenadas en los coeficientes triestmulo supone tambin una modificacin de las
coordenadas cromticas, con el consiguiente cambio en el tringulo de Maxwell y el diagrama de
cromaticidad. La forma de estos dos ltimos permanece inalterada, aunque la gama de colores en su
interior variar dependiendo del conjunto de primarios elegido. As pues, cualquier referencia al
diagrama de cromaticidad debe aclarar cul es el conjunto de primarios al que nos estamos refiriendo.

Consideremos ahora, sobre el diagrama de cromaticidad correspondiente a los fsforos del sistema
NTSC, cul es la posicin terica en la que se encuentran los colores monocromticos. Para ello,
podemos utilizar la informacin proporcionada por la grfica de la figura 1.11, en la que se indica en
qu grado participa cada uno de los primarios para la obtencin de los colores monocromticos. El
procedimiento consiste en identificar los valores R
N
, G
N
, B
N
asociados a una determinada longitud de
onda y posteriormente calcular las coordenadas cromticas (r, g), representado este punto sobre el
diagrama de cromaticidad. La secuencia de coordenadas obtenida se representa en la figura 1.24,
donde observamos que los colores monocromticos estn situados sobre una lnea que tiene forma
semielptica y que est situada en el exterior de la gama de colores reproducible con los primarios
NTSC. Este resultado no debera sorprender al lector puesto que ya hemos comentado anteriormente
que con este conjunto de primarios no es posible reproducir toda la gama de colores. De hecho, la
grfica indica que no puede reproducirse con exactitud ninguno de los colores monocromticos.

Fig. 1.24 Representacin de los primarios CIE monocromticos y XYZ en el diagrama de cromaticidad asociado
a los primarios RGB del NTSC

La lnea recta que une los extremos del espectro visible incluye toda la gama de prpuras, que aun
siendo colores puros (no contienen blanco), no estn asociados a una nica componente espectral.
Esto significa que existe toda una gama de tonalidades que no pueden obtenerse a partir de la
1/3
1
1
700nm
580 nm
540 nm
520 nm
500 nm
490 nm
360 nm
Colores
monocromticos
Purpuras
(Lnea base)
560 nm
510 nm
Primarios
monocromticos
CIE
Primarios
X Y Z
CIE
X
Y
Z
1/3
1/3
1
1
700nm
580 nm
540 nm
520 nm
500 nm
490 nm
360 nm
Colores
monocromticos
Purpuras
(Lnea base)
560 nm
510 nm
Primarios
monocromticos
CIE
Primarios
X Y Z
CIE
X
Y
Z
1/3
descomposicin espectral simple de la luz y que por lo tanto no estn presentes en el arco iris. Los
lmites de esta superficie semielptica incluyen todas las posibles tonalidades de color y las lneas
rectas que parten desde el blanco hasta un punto de la curva representan los distintos grados de
saturacin que puede tener cada tonalidad. As pues, esta regin semielptica incluye toda la gama
cromtica de colores.

Tambin es importante notar que los primarios NTSC no estn situados sobre la curva
correspondiente a los colores monocromticos debido a que, como ya hemos comentado, se prefiri
elegir unos fsforos que no fueran espectralmente puros, pero que proporcionaran una mejor
sensacin de brillo en la pantalla del reproductor. Por el contrario, si representamos los primarios del
sistema de coordenadas monocromticas definidas por el CIE, veremos que stos estn situados justo
sobre esta curva, en las longitudes de onda correspondientes a 700 nm, 546.1 nm, y 435.8 nm. En la
grfica se sitan aproximadamente estos primarios y se observa que la gama de tonalidades que
pueden obtenerse con estos dos sistemas de coordenadas son distintas y que, en ninguno de los dos
casos puede conseguirse toda la gama de colores utilizando exclusivamente componentes triestmulo
positivas.

Hemos comentado que el CIE defini el sistema de coordenadas XYZ, basado en unos primarios
artificiales, que permita cubrir toda la gama de colores utilizando nicamente coeficientes positivos.
La posicin de estos primarios en el diagrama de cromaticidad asociado a las componentes RGB del
sistema NTSC se representa en la mima figura 1.24. Obsrvese que, necesariamente, los primarios de
este sistema de coordenadas deben estar situados sobre los vrtices de un tringulo que cubra toda la
curva correspondiente a los colores monocromticos y la gama de tonalidades prpuras. Como esta
superficie tiene una forma semielptica, es preciso que los vrtices del tringulo estn situados en su
exterior, en puntos del espacio en los que no est definido ningn color real. Por ello, decimos que
estos primarios son artificiales, ya que nicamente tienen sentido desde un punto de vista matemtico
y no muestran una correspondencia directa con ningn color real.

La seleccin de las posiciones de estos primarios se realiz utilizando dos criterios. Por una parte, el
rea limitada por estos tringulos deba ser lo ms reducida posible y, por otra, una de las
componentes triestmulo deba corresponderse directamente con la sensacin de brillo producida por
el color. La componente elegida para representar el brillo fue la Y, lo que como veremos, define un
plano sobre el que debe situarse uno de los primarios. Los otros dos primarios se seleccionaron para
que la regin semielptica correspondiente a toda la gama cromtica tuviera un rea mxima al
representarla en el diagrama de cromaticidad de este sistema de referencia. Antes de definir las
relaciones analticas entre el sistema XYZ y otros sistemas de coordenadas examinaremos con cierto
detalle cmo se mide y cuantifica el brillo de un color.

1.4.16 La seal de luminancia
Hemos visto que el brillo es un atributo subjetivo del color que nos permite identificar la luminosidad
aparente de los objetos. Decimos que dos objetos tienen el mismo brillo cuando, independientemente
de la tonalidad de sus colores, producen en el observador la misma sensacin de luminosidad. Este
concepto est ntimamente ligado a los sistemas de representacin de imgenes en blanco y negro, ya
que en stas se intenta reproducir la misma sensacin de brillo que en la escena original utilizando
distintas graduaciones de gris.

En los sistemas de televisin en blanco y negro se utiliza una seal denominada luminancia cuyo nivel
es proporcional a la sensacin de brillo. Esta seal se obtiene utilizando sensores de imagen, filtros
pticos y sistemas de correccin de nivel de seal cuya respuesta en frecuencia conjunta tiene una
forma parecida a la curva de sensibilidad del ojo para visin diurna. La seal de luminancia o,
simplemente, la luminancia, es la versin cuantitativa de la sensacin de brillo.
Podemos obtener la expresin de la luminancia en funcin de los primarios de un determinado sistema
de representacin de color sin ms que considerar la sensibilidad lumnica del ojo para cada uno de los
colores base. Este clculo puede realizarse determinando el rea existente bajo la curva resultante de
ponderar la curva de sensibilidad fotpica (figura 1.7) por el espectro correspondiente a cada uno de
los primarios normalizados. As, la sensacin de brillo que produce cada uno de los primarios viene
dada por:

max
min
max
min
max
min
) ( ) (
) ( ) (
) ( ) (
d S q
d S q
d S q
f B B
f G G
f R R
(1.31)

Estos coeficientes se normalizan para que su suma sea igual a la unidad con lo que se obtiene la
aportacin relativa de cada coeficiente triestmulo en la luminancia. La expresin de la luminancia en
funcin de los coeficientes triestmulo viene dada por:

B G R Y
B G R
B
B G R
G
B G R
R
+ +
+
+ +
+
+ +
(1.32)

En el caso de utilizar los primarios del sistema NTSC obtenemos:

N N N
B G R Y 114 . 0 587 . 0 299 . 0 + + (1.33)

Obsrvese que los coeficientes obtenidos indican el grado de participacin de cada uno de los
primarios en la sensacin de brillo y que la normalizacin de estos coeficientes supone que la
luminancia asociada al blanco de referencia es la unidad.

Si utilizamos los primarios monocromticos del CIE, la luminancia viene dada por:

C C C
B G R Y 011 . 0 812 . 0 177 . 0 + + (1.34)

En este caso, los coeficientes se corresponden directamente con los valores de la curva de sensibilidad
fotpica, convenientemente normalizados, en las longitudes de onda asociadas a los primarios.
1.4.17 Sistema de coordenadas XYZ
El sistema XYZ suele usarse con frecuencia como sistema patrn para realizar clculos de
colorimetra y para comparar las gamas de colores que pueden obtenerse con distintos conjuntos de
primarios. Su principal ventaja es que cuando se normalizan sus componentes triestmulo, se obtiene
un diagrama de cromaticidad que contiene la gama completa de colores en el primer cuadrante, lo que,
sin duda, facilita los clculos grficos. Otra de sus ventajas es, como hemos comentado, que la
componente Y representa directamente la informacin de luminancia asociada a cada color.

Los coeficientes triestmulo del sistema de coordenadas XYZ estn definidos a partir de los primarios
monocromticos del CIE mediante la relacin matricial:

1
1
1
]
1
1
1
1
]
1
1
1
1
]
1
C
C
C
B
G
R
Z
Y
X
990 . 0 010 . 0 000 . 0
011 . 0 812 . 0 177 . 0
200 . 0 310 . 0 490 . 0
(1.35)

Anlogamente, su relacin con los primarios en el sistema NTSC viene dada por:

1
1
1
]
1
1
1
1
]
1
1
1
1
]
1
N
N
N
B
G
R
Z
Y
X
116 . 1 066 . 0 000 . 0
114 . 0 587 . 0 299 . 0
200 . 0 174 . 0 607 . 0
(1.36)

Evidentemente, las relaciones inversas pueden obtenerse utilizando las inversas de estas matrices.
Ntese que en las expresiones anteriores la relacin entre la componente Y y los primarios coincide
con los valores de la luminancia obtenidos en las ecuaciones 1.33 y 1.34.

Los coeficientes triestmulo XYZ pueden ser normalizados respecto a su suma obteniendo los
coeficientes cromticos x, y, z:

Z Y X
Z
z
Z Y X
Y
y
Z Y X
X
x
+ +
+ +
+ +
; ;
(1.37)

Utilizando estos coeficientes normalizados, podemos obtener el tringulo de Maxwell y el diagrama
de cromaticidad en funcin de estas nuevas variables. ste ltimo se representa en la figura 1.25
donde observamos que la superficie semielptica correspondiente a toda la gama de colores ha sido
normalizada y ahora est situada en el cuadrante positivo. Ntese que los colores reproducidos slo
son aproximados por cuanto la tcnica de representacin, tanto si se visualizan en la pantalla del
ordenador como en un papel de color, est basada en la mezcla de unos colores primarios que no
pueden cubrir toda la gama cromtica. Esta aproximacin es ms que evidente en el supuesto de que el
lector disponga de una copia en blanco y negro del diagrama cromtico.

En el caso del papel en color, los principios de formacin y mezcla de colores son algo distintos de los
que estamos considerando en este texto, pues, como en la pintura, los pigmentos que proporcionan la
informacin de color deben considerarse como elementos absorbentes de determinadas componentes
espectrales en vez de elementos emisores. Por ello, este tipo de mezcla se denomina substractiva y
utiliza unos colores primarios distintos de los que se utilizan en una mezcla aditiva como la que se
produce en un monitor de televisin. Sin embargo, los principios generales sobre la limitacin de la
gama de colores reproducibles siguen siendo vlidos. Siempre es posible, dados unos colores bsicos
con los que se realiza la mezcla substractiva, definir un conjunto de primarios que mezclados
aditivamente cubran su misma gama cromtica. Por ello, es frecuente representar sobre el diagrama de
cromaticidad en componentes (x,y), las regiones de colores que pueden obtenerse cuando se combinan
un grupo determinado de colores primarios, independientemente de si se usan mezclas aditivas
(televisin, paneles electroluminiscentes) o substractivas (pintura, impresin, fotografa, cine).

Fig. 1.25 Diagrama cromtico en x,y. Simulacin de la gama de colores completa

En la figura 1.26 se indican aproximadamente las posiciones de los primarios para el sistema
monocromtico del CIE, los fsforos NTSC y una gama cromtica tpica de pelcula fotogrfica. Es
importante notar que la gama de colores que puede obtenerse con una pelcula fotogrfica es ms
limitada que la que proporcionan los primarios de televisin. Por ello, cuando se transmiten por
televisin programas registrados directamente en formato de vdeo, se observa una mayor riqueza
cromtica que cuando se pasan pelculas procedentes de un registro fotogrfico. La gama cromtica
proporcionada por una pelcula depende de los materiales fotosensibles utilizados, de manera que es
importante seleccionar adecuadamente estas caractersticas en funcin del tipo de colores que
queramos enfatizar en la escena. As, en fotografa, es habitual seleccionar la marca Kodak cuando el
tipo de paisaje incluye tonalidades rojas, marrones, naranjas, etc., pues toda esta gama est muy bien
cubierta por este carrete. La marca Fujifilm cubre muy bien las tonalidades verdes y Agfa las azules y
rojas.
Coordenada x
C
o
o
r
d
e
n
a
d
a

y
Coordenada x
C
o
o
r
d
e
n
a
d
a

y

Fig. 1.26 Gamas de colores cubiertas por los distintos tipos de primarios

En la misma figura 1.26 tambin hemos representado la posicin del blanco de referencia cuyas
coordenadas son (1/3, 1/3). La lnea recta que une un punto del contorno de la superficie con el blanco
corresponde a colores que tienen la misma tonalidad pero distinto grado de saturacin mientras que el
contorno de la superficie representa todas las tonalidades puras (sin blanco).

La capacidad de discernir colores del sistema visual humano no es uniforme cuando nos desplazamos
a travs de la superficie cromtica. As, en la regin del azul pueden distinguirse muchos ms colores
que en la del verde. Para indicar grficamente sobre el diagrama de cromaticidad la capacidad del
sistema visual para discernir colores, suelen utilizarse las elipses de Mac-Adam. Una elipse de Mac-
Adam indica que los colores que estn en su interior son indistinguibles para un observador con visin
normal. El procedimiento utilizado para determinar la elipse de Mac-Adam, cuyo centro est situado
sobre un determinado color C
1
, consiste en presentar a un espectador diversos colores prximos a C
1
,
marcando el contorno de la elipse sobre aquellos en que se aprecian diferencias de tono o de matiz y
que presentan una distancia mnima con el color de referencia. De acuerdo con este procedimiento,
podemos considerar que los colores contenidos dentro del contorno sern indistinguibles, de modo
que cuanto menor sea el rea de una elipse, mayor es la sensibilidad del ojo para la percepcin de
colores en esa regin.

En la figura 1.27 se han representado aproximadamente algunas elipses de Mac-Adam sobre el
diagrama de cromaticidad con el nico objetivo de obtener una imagen grfica de la capacidad para
distinguir los colores. Las elipses se han representado ampliando los ejes en un factor 10 para que
puedan apreciarse claramente las direcciones en las que el sistema visual presenta mayor sensibilidad.
C
o
o
r
d
e
n
a
d
a

y
Coordenada x
Primarios monocromticos CIE
Primarios NTSC
Gama colores
pelcula fotogrfica
blanco
Color
puro
C
o
o
r
d
e
n
a
d
a

y
Coordenada x
Primarios monocromticos CIE
Primarios NTSC
Gama colores
pelcula fotogrfica
blanco
Color
puro

Fig. 1.27 Representacin esquemtica de las elipses de Mc-Adam

En 1960 el CIE defini un nuevo sistema de coordenadas basado en el sistema xyz con el objetivo de
que las elipses de Mc-Adam quedaran representadas con crculos del mismo tamao
independientemente de su posicin. Este sistema de coordenadas se denota como el sistema UVW y se
denomina el sistema de cromaticidad uniforme. Es un sistema que se utiliza con frecuencia en la
calibracin y ajuste de los colores proporcionados por un display. La relacin entre las coordenadas
normalizadas u, v y las coordenadas x e y es:

3 12 2
6
3 12 2
4
+ +
+ +
y x
y
v
y x
x
u
(1.38)

1.4.18 Obtencin de las componentes de color: filtros dicroicos
La separacin de las tres componentes de color de la escena se realiza en la cmara mediante un
subsistema denominado separador ptico o filtro dicroico. Estos filtros presentan unos coeficientes de
reflexin y de refraccin que dependen de la frecuencia de manera que pueden desviar cada
componente de color en direcciones distintas. En la figura 1.28 se representa un esquema de separador
ptico en el que se observa que a travs de distintas reflexiones y refracciones de las imgenes puede
conseguirse separar las tres componentes de color y dirigirlas hacia distintos sensores de imagen.
C
o
o
r
d
e
n
a
d
a

y
Coordenada x
C
o
o
r
d
e
n
a
d
a

y
Coordenada x
Cada filtro dicroico refleja una de las componentes de color y permite la transmisin del resto, por lo
que mediante dos filtros, uno que refleje la componente azul y otro que refleje la roja, pueden
obtenerse las tres componentes de la imagen. Una vez separadas las componentes se utilizan filtros de
ajuste adicionales (indicados en la figura 1.28) para garantizar que las seales se ajustan al sistema de
representacin de colores utilizado, que normalmente ser el sistema de fsforos NTSC.

Fig. 1.28 Descomposicin de la imagen en componentes de color mediante filtros dicroicos

El principio de funcionamiento de estos filtros se esquematiza en la figura 1.29 para una de las
superficies reflectantes de una componente de color. Sobre una base de vidrio con un ndice de
refraccin aproximado de 1,5 se deposita, normalmente por vaporizacin, una capa de sulfuro de zinc
(ndice de refraccin de 2,4) o cualquier otro material con un ndice de refraccin elevado. El espesor
de esta capa es de /4 de la longitud de onda a reflejar, as en el caso del color rojo el espesor de la
capa es de unos 740/4 nm. Cuando la luz incide sobre el sistema se producen dos posibles cambios de
medio entre el aire, el sulfuro de zinc y el vidrio. En el primer cambio de medio, del aire al sulfuro de
zinc, parte de la luz se reflejar y parte se transmitir a travs del sulfuro de zinc. La parte reflejada en
A sufre un cambio de fase de 180 , ya que el ndice de refraccin del sulfuro de zinc es superior al del
aire. La parte transmitida volver a encontrarse con un cambio de medio entre el sulfuro de zinc y el
vidrio, donde parte de la energa ser nuevamente reflejada. En este caso la reflexin no introduce
cambio en la fase de la onda, por cuanto el ndice del vidrio es inferior al del sulfuro de zinc. La onda
reflejada en el punto B se propaga hasta el punto C, donde parte de la energa se transmitir de nuevo
hacia el aire. Los dos rayos reflejados D y E estarn en fase, y por lo tanto se sumarn
constructivamente, para aquella longitud de onda para la que se ha diseado el espesor de la capa. En
efecto, la onda del rayo D ha sufrido un desfasaje de 180 como consecuencia de su reflexin directa
mientras que la onda E, que ha seguido la trayectoria A-B-C, no ha sufrido ninguna inversin de fase
en los cambios de medio, pero ha recorrido un trayecto de aproximadamente /2, por lo que ambos
rayos estn en fase y se suman constructivamente. El sistema favorece por tanto la reflexin de la
imagen en aquellas longitudes de onda que son 4 veces superiores al espesor de la capa de sulfuro de
zinc. Para el resto de frecuencias, los rayos reflejados no estarn en fase, por lo que la energa refleja
es considerablemente inferior. Superponiendo un cierto nmero de capas formadas por un ndice de
reflexin dbil y uno fuerte sucesivamente, puede aumentarse la selectividad de la discriminacin en
frecuencia.

Fig. 1.29 Principio de funcionamiento de un espejo dicroico

1.4.19 Transmisin de informacin de color: seales diferencia de color
Para poder reproducir correctamente un color, es preciso disponer de las componentes RGB en algn
sistema de coordenadas adaptado a las caractersticas de los fsforos del monitor. Si se transmitieran
directamente las componentes RGB del sistema NTSC, siempre sera posible convertirlas al tipo de
fsforos utilizado en nuestro receptor mediante un cambio de coordenadas, que al ser una relacin
lineal, puede implementarse circuitalmente mediante una red resistiva. Por otra parte, parece lgico
establecer un sistema de coordenadas comn en el que se realicen todas las transmisiones, dejando
para el fabricante de receptores el problema de tratar estas seales para acondicionarlas al tipo de
fsforos que prefiera.

Sin embargo, cuando se plantearon los primeros sistemas de televisin en color se prefiri mantener la
compatibilidad con los sistemas de blanco y negro, para as realizar una transicin gradual hacia el
color. Esta decisin fue una cuestin puramente comercial, pues se pens, acertadamente, que la
implantacin progresiva de los sistemas en color mantendra un nivel global de ventas en el sector con
un aumento sostenido.

La compatibilidad exige que la seal de color pueda seguir siendo visualizada mediante un receptor
monocromo con un nivel de interferencia o degradacin de la informacin en blanco y negro
imperceptible para el usuario. De este modo, cuando una emisora decida empezar a transmitir su
programacin en color, poda seguir siendo vista por todo el parque de receptores en blanco y negro
sin que estos apreciaran el cambio de sistema.
A
B
C
D
E
Vidrio
n=1,5
Aire (n=1)
Sulfuro de zinc
n=2,4
A
B
C
D
E
Vidrio
n=1,5
Aire (n=1)
Sulfuro de zinc
n=2,4
Un segundo requisito es la denominada compatibilidad indirecta o retrocompatibilidad, que establece
que desde un receptor en color deben poder decodificarse las seales que se transmiten en blanco y
negro, obteniendo las tres componentes de color iguales y en consecuencia visualizando una imagen
de las mismas caractersticas que en un televisor en blanco y negro. Veremos que tanto la
compatibilidad directa como la indirecta condicionan el tipo de seales que deben transmitirse para
codificar el color.

As pues, es evidente que todo sistema de televisin en color compatible requiere transmitir la
informacin de luminancia, ya que sta es la nica componente de seal que puede ser utilizada por
los receptores monocromos para decodificar correctamente la imagen en blanco y negro. Pero adems
de la seal de luminancia, deberemos proporcionar informacin adicional que permita reconstruir las
componentes de color RGB que son necesarias para atacar al tubo de imagen en un receptor de color.
Estas componentes adicionales debern codificarse de manera que su efecto sobre un receptor en
blanco y negro sea imperceptible. En el captulo sobre la seal de televisin en color veremos que las
seales que proporcionan la informacin de color estn imbricadas en el espectro de la seal de blanco
y negro utilizando una modulacin en cuadratura cuyos parmetros se han elegido para que la
interferencia que introducen en un receptor monocromo, que no est diseado para tener en cuenta la
existencia de esta informacin, sea lo ms reducida posible.

Por otra parte, parece absurdo transmitir, junto con la informacin de luminancia, las tres
componentes de color, ya que en este caso se emitiran cuatro seales que dependen nicamente de
tres variables, lo que supondra un injustificable derroche en ancho de banda. La solucin ms
evidente, en primera instancia, parece ser la de transmitir la luminancia y dos componentes
adicionales de color. Los receptores en blanco y negro ignoraran la informacin de color
reproduciendo directamente la luminancia, mientras que los receptores de color podran utilizar todas
seales para obtener las tres variables independientes de color. Examinemos con cierto detalle esta
posibilidad para comprobar que es una buena solucin al problema de la compatibilidad directa, pero
que finalmente ser inviable, pues no permite la retrocompatibilidad.

Luminancia ms dos componentes de color

Supongamos que en un hipottico sistema de televisin en color se transmiten, junto con la
luminancia, dos componentes de color cualesquiera, por ejemplo, las componentes R
N
y B
N
. Es
evidente que si las componentes de color se modulan de acuerdo con los criterios comentados
anteriormente, su efecto sobre un receptor en blanco y negro ser mnimo, por lo que ste nicamente
utilizar la informacin de luminancia, con una degradacin muy reducida debido a la presencia de las
componentes de color.

El receptor en color puede interpretar correctamente la informacin transmitida, siendo posible
recomponer las tres seales de color a partir de la luminancia y las componentes R y B. Para ello, es
necesario realizar la siguiente transformacin lineal:

1
1
1
]
1
1
1
1
]
1

1
1
1
]
1
B
R
Y
B
G
R
1 0 0
194 . 0 509 . 0 703 . 1
0 1 0
(1.39)
La segunda fila de esta matriz se obtiene aislando el valor de la componente G en la expresin de la
luminancia obtenida en la ecuacin 1.33:

B R Y
B R Y
G 194 . 0 509 . 0 703 . 1
587 . 0
114 . 0 299 . 0

(1.40)

relacin que, al ser lineal, puede realizarse fcilmente combinando elementos sumadores y restadores
mediante un circuito resistivo basado en amplificadores operacionales. En la figura 1.30 se indica
esquemticamente la obtencin de las tres componentes R, G y B a partir de las seales Y, R y B que
garantizan la compatibilidad directa del sistema propuesto.

Para determinar si el sistema es retrocompatible, consideremos que se transmite nicamente la seal
de luminancia y veamos cul es la informacin que recuperamos en un receptor en color. En este caso,
las componentes de color son nulas, por lo que si aplicamos la relacin matricial 1.39 obtenemos:

1
1
1
]
1
1
1
1
]
1
1
1
1
]
1

1
1
1
]
1
0
703 . 1
0
0
0
1 0 0
194 . 0 509 . 0 703 . 1
0 1 0
Y
Y
B
G
R
(1.41)

Es decir, si la seal slo contiene informacin de luminancia, el receptor en color presentar una
imagen monocroma, pero no en blanco y negro, sino en verde. La imagen podra verse igual, pues
ahora el brillo est contenido en una de las componentes de color, aunque hemos de admitir que no se
trata de la solucin que se espera de un sistema de televisin retrocompatible.

Fig. 1.30 Compatibilidad y retrocompatibilidad en un sistema Y,R,B

Receptor
B&W
Y
R
B
Y
Y
R
B
1.70Y-0.51R-0.19B
G
R
B
Transmisin de seal en color: Y, R, B
Decodificador de color
Receptor
B&W
Y
0
0
Y
Y
0
0
1.70Y-0.51R-0.19B
G=1.7Y
R=0
B=0
Transmisin de seal en blanco y negro: Y
Receptor
B&W
Y
R
B
Y
Y
R
B
1.70Y-0.51R-0.19B
G
R
B
Receptor
B&W
Y
0
0
Y
Y
0
0
1.70Y-0.51R-0.19B
G=1.7Y
R=0
B=0
A partir de este resultado vemos que para que un sistema sea retrocompatible, es necesario que,
cuando no se transmita informacin de croma, recuperemos las tres componentes de color con el
mismo valor. As, si el receptor es capaz de obtener las componentes R=G=B=Y, veremos la imagen
con las mismas caractersticas de brillo y color que con un receptor en blanco y negro. Para obtener
simultneamente la compatibilidad directa y la indirecta, es necesario sustituir las componentes de
color por las componentes diferencia de color transmitiendo las seales que consideraremos en el
siguiente apartado.

Luminancia ms seales diferencia de color

Se denominan seales diferencia de color a las obtenidas de restar la luminancia a cualquiera de las
componentes de color. As, las posibles seales diferencia de color son: R-Y, G-Y y B-Y. Si junto con
la luminancia se transmiten dos seales diferencia de color cualesquiera, es posible obtener un sistema
de televisin en color que admita simultneamente la compatibilidad directa y la indirecta.

Supongamos un sistema en el que se transmiten las seales diferencia de color R-Y y B-Y junto con la
informacin de luminancia. El sistema tendr compatibilidad directa siempre que las dos componentes
de croma estn moduladas de modo que su incidencia sobre un receptor en blanco y negro sea nula (o
mnima) y cuando el receptor en color pueda recuperar, a partir de las seales transmitidas, las tres
componentes triestmulo.

En este ltimo caso, requiere realizarse una transformacin lineal de variables en el receptor que viene
caracterizada por la matriz:

1
1
1
]
1

1
1
1
]
1

1
1
1
]
1
Y B
Y R
Y
B
G
R
1 0 1
194 . 0 509 . 0 1
0 1 1
(1.42)

Resulta directo comprobar la correccin de la primera y tercera fila. Para comprobar la segunda
podemos escribir:

B R Y Y B Y R Y G 194 . 0 509 . 0 703 . 1 ) ( 194 . 0 ) ( 509 . 0 (1.43)

En la figura 1.31 se indica el esquema de un decodificador de color para obtener las tres componentes
RGB a partir de la luminancia y las dos seales diferencia de color.

Consideremos ahora el caso en que se transmita una seal en blanco y negro y comprobemos que las
tres componentes de color sern iguales a la luminancia. En efecto, ahora las seales diferencia de
color no se transmiten, por lo que estas seales sern nulas en el receptor. Si aplicamos la misma
matriz de decodificacin a las seales recibidas obtenemos:

1
1
1
]
1
1
1
1
]
1
1
1
1
]
1

1
1
1
]
1
Y
Y
Y Y
B
G
R
0
0
1 0 1
194 . 0 509 . 0 1
0 1 1
(1.44)
Es decir, tal y como esperbamos, obtenemos las tres componentes idnticas e iguales a la luminancia,
por lo que la imagen se ver en blanco y negro y con el mismo nivel de luminancia con el que ha sido
transmitida.

Fig. 1.31 Compatibilidad y retrocompatibilidad en un sistema Y, (R-Y), (B-Y)

Los resultados obtenidos pueden generalizarse de modo que con dos seales diferencia de color
cualesquiera podamos obtener un decodificador de color compatible con la transmisin de seales en
blanco y negro. No obstante, todos los sistemas de televisin utilizan siempre las dos componentes
que hemos considerado, o alguna transformacin lineal de las mismas, descartando la seal Y-G. La
razn principal es que la seal de luminancia est ms correlada con la componente verde que con las
otras dos. Esto es debido a que al construir la informacin de luminancia la componente verde
interviene prcticamente en un 60 %, mientras que las otras dos participan en un 30 % y 10 %. Es
decir, gran parte de la informacin correspondiente a la tonalidad verde est contenida en la propia
seal de luminancia. La consecuencia inmediata es que el nivel de la seal G-Y suele ser ms reducido
que el de las otras dos seales diferencia de color, en prcticamente la totalidad de la gama de colores,
por lo que ser una ms sensible al ruido que en consecuencia conviene no transmitir. Otra ventaja de
transmitir las seales (R-Y) y (B-Y) es que los coeficientes que se requieren en el decodificador de
color son siempre menores que la unidad, por lo que ste puede sintetizarse mediante una red pasiva.
Esta ltima caracterstica no tiene excesiva importancia para la tecnologa actual, en la que los
amplificadores de seal tienen bajo ruido y son fcilmente integrables, pero tuvo cierto peso en la
seleccin de estas componentes en los albores de la televisin en color.

La codificacin de la informacin de color en una componente de luminancia y dos seales diferencia
de color ofrece, adems de la compatibilidad, ventajas adicionales, y por ello se sigue utilizando en
sistemas digitales o de alta definicin en los que no se busca ningn tipo de compatibilidad con los
Receptor
B&W
Y
R-Y
B-Y
Y
Receptor
B&W
Y
0
0
Y
Y
R-Y
B-Y
G
R
B
Y-0.509(R-Y)-0.194(B-Y)
Y
0
0
G=Y
R=Y
B=Y
Y-0.509(R-Y)-0.194(B-Y)
Receptor
B&W
Y
R-Y
B-Y
Y
Receptor
B&W
Y
0
0
Y
Y
R-Y
B-Y
G
R
B
Y-0.509(R-Y)-0.194(B-Y)
Y
0
0
G=Y
R=Y
B=Y
Y-0.509(R-Y)-0.194(B-Y)
sistemas de televisin precedentes. La principal ventaja es que el ancho de banda asignado a las
seales diferencia de color puede ser considerablemente inferior al ancho de banda asignado a la seal
de luminancia sin que se observe una prdida de calidad en la imagen. La razn de esta posible
reduccin del ancho de banda se encuentra nuevamente en las caractersticas de percepcin del color
en el sistema visual humano. En condiciones de visin fotpica, los conos son responsables tanto de la
percepcin del brillo como del color. En la percepcin del brillo colaboran todos los conos,
independientemente de su tipo, por lo que la densidad equivalente de sensores de intensidad de luz en
la retina es superior a la de los sensores de cada componente color. Supongamos por ejemplo un
pequeo objeto de color situado a una determinada distancia del espectador. Para percibir el color del
objeto se requiere que el tamao de su imagen en la retina active, como mnimo, una regin que
contenga los tres tipos de conos, mientras que para percibir su presencia, a partir de su diferencia de
brillo con el fondo, es suficiente con que se activen algn tipo de sensores. Una experiencia sencilla
que permite comprobar esta diferencia en resolucin consiste en situar un hilo de color delante de un
espectador. Si la distancia es la adecuada, resulta fcil detectar la presencia del hilo, pero difcilmente
podr identificarse su color.

En definitiva, el sistema visual humano tiene mayor agudeza visual para distinguir distintos niveles de
iluminacin que para diferenciar colores. Por ello, las seales diferencia de color pueden enviarse con
un ancho de banda menor que la luminancia, puesto que requieren transmitir menos informacin de
color al ser el ojo menos crtico. Si se transmitieran las tres componentes RGB directamente, debera
utilizarse un ancho de banda equivalente al de la luminancia en cada una de ellas, ya que, en este caso,
la informacin de luminancia estara distribuida en las tres componentes. Tngase en cuenta, que
cuando se transmite la luminancia y las seales diferencia de color, el decodificador de color obtendr
las componentes RGB con un ancho de banda parecido al de la seal de luminancia, ya que esta seal
interviene en la recomposicin de todas las componentes de color. La ventaja de separar la luminancia
de la informacin de color es que slo la primera requerir transmitirse con mxima resolucin.

El ancho de banda con el que se codifica cada una de las seales se determina a partir de pruebas de
visin subjetivas en las que el espectador puede controlar el ancho de banda asignado a cada
componente hasta comprobar que un aumento de la informacin transmitida no mejora la calidad de la
imagen.

Las seales que se transmiten en los sistemas de televisin suelen ser transformaciones de las
componentes diferencia de color. Las transformaciones utilizadas dependen del sistema de televisin y
pueden ser muy diversas. As, en el sistema NTSC se transmite una versin rotada y escalada de las
seales diferencia de color, mientras que en el sistema PAL nicamente se realiza un escalado previo
de las seales para nivelar su margen dinmico antes de la transmisin.

En general, para cualquier combinacin de estas seales diferencia de color en la forma:

1
1
1
]
1

1
1
1
]
1
1
1
1
]
1
Y B
Y R
Y
r r
r r
B
A
Y
22 21
12 11
0
0
0 0 1
(1.45)

puede obtenerse un decodificador de las componentes de color RGB a partir de las componentes
YAB, que es compatible con la transmisin de seales en blanco y negro. Para comprobarlo, basta con
observar que la matriz de decodificacin puede obtenerse como:

1
1
1
]
1
1
1
1
]
1
1
1
1
]
1
1
1
1
]
1

1
1
1
]
1

1
1
1
]
1
B
A
Y
r r
r r
Y B
Y R
Y
B
G
R
1
22 21
12 11
0
0
0 0 1
1 0 1
194 . 0 509 . 0 1
0 1 1
1 0 1
194 . 0 509 . 0 1
0 1 1
(1.46)

de modo que cuando no se transmite informacin de croma (A=0 y B=0), las componentes RGB que
obtenemos son todas iguales a la luminancia. Las seales A y B son, de acuerdo con la ecuacin
anterior, una transformacin lineal de las (R-Y) y (B-Y) y tambin suelen denominarse seales
diferencia de color. Sus valores dependen del sistema de televisin utilizado siendo los ms habituales
los que se indican a continuacin.

SISTEMA PAL:

En el sistema PAL las seales diferencia de color reciben lo nombre U y V. Estn
relacionadas con las (R-Y) y (B-Y) mediante:

) ( 493 . 0
) ( 877 . 0
Y B U
Y R V

(1.47)

que es un caso particular de la relacin matricial de la ecuacin 1.45:

1
1
1
]
1

1
1
1
]
1
1
1
1
]
1
) (
) (
493 . 0 0 0
0 877 . 0 0
0 0 1
Y B
Y R
Y
V
U
Y
(1.48)

SISTEMA NTSC.

Utiliza las seales I y Q que son una versin rotada 33 de las seales (R-Y) y (B-Y).
Veremos la razn de esta rotacin en el captulo de sistemas de TV en color.

1
1
1
]
1

1
1
1
]
1

1
1
1
]
1
) (
) (
414 . 0 478 . 0 0
269 . 0 783 . 0 0
0 0 1
Y B
Y R
Y
Q
I
Y
(1.49)

SISTEMA SECAM.

En este caso son tambin las seales (R-Y) y (B-Y) escaladas por otros coeficientes:

) ( 5 . 1 ); ( 9 . 1 Y B D Y R D
B R
(1.50)

SISTEMAS DIGITALES.

En los sistemas de televisin digital, se transmiten las seales (R-Y) y (B-Y) con otros
factores de escalado:

) ( 564 . 0 ); ( 713 . 0 Y B E Y R E
CB CR
= = (1.51)

1.5 Proyeccin de las escenas en el plano de imagen
Una vez la escena se ha descompuesto en los tres haces de luz con frecuencias distintas, la siguiente
etapa, que tambin se realiza en la cmara, consiste en proyectar la escena sobre el plano de imagen.
El plano de imagen es la superficie del espacio donde se situarn los elementos encargados de
convertir la energa luminosa existente en cada punto del plano de imagen en una seal elctrica. En el
caso de cmaras de vdeo, los dispositivos sensores de la imagen suelen ser matrices CCD o cualquier
otro tipo de tubo de imagen. En cmaras de fotografa o de cine, el elemento sensor de la imagen es la
pelcula fotogrfica. En ambos casos, el elemento sensor est situado exactamente en el plano de
imagen.

Desde un punto de vista analtico, la funcin escena queda ahora representada mediante tres funciones
de 3 variables:

) , ' , ' (
) , ' , ' (
) , ' , ' (
t y x
t y x
t y x
B
G
R
(1.52)

donde las variables x e y indican las nuevas variables bidimensionales en las que ha quedado
proyectada la escena. Alternativamente, podramos emplear cualquier conjunto de tres funciones
obtenidas como combinaciones lineales independientes de estas tres componentes. As por ejemplo,
podramos representar la escena mediante las componentes de luminancia y diferencia de color. En
general, utilizaremos la notacin
X
(x,y,t) para indicar mediante el smbolo X, cualquiera de estas
funciones.

Evidentemente, estas proyecciones representan una prdida de la informacin espacial existente en la
escena original que no podr ser recuperada en la recepcin. El espectador deber determinar la
situacin espacial de los objetos en la imagen original a partir de sus tamaos relativos y de sus partes
ocultas, no pudiendo reproducirse la sensacin de espacio tridimensional. Sin embargo, veremos en el
apartado siguiente, que an en el caso de que deseemos reproducir sensaciones de espacio
tridimensional en el espectador, es suficiente con registrar dos proyecciones planas de la imagen, con
lo que la filosofa general de reduccin de variables independientes se mantiene incluso en este caso.

En la figura 1.32 se representa un esquema simplificado de una cmara en color de vdeo en la que se
incluyen los tres elementos bsicos: grupo ptico, filtros dicroicos y sensores de imagen. El grupo
ptico suele estar formado por varias lentes, cuya funcin es la de obtener una imagen correctamente
enfocada de la escena sobre el sensor de imagen. El grupo ptico realiza una funcin parecida a la que
desempean el iris, la pupila y el cristalino en el sistema visual humano, encargndose tanto del
correcto enfoque de las imgenes como de regular la cantidad de luz que incide sobre el sensor. La
mayora de grupos pticos incorporan la funcin de zoom, que consiste en modificar la distancia
relativa entre las distintas lentes para variar su distancia focal conjunta. Con ello es posible controlar
el tamao de la imagen de los objetos sobre el sensor. As, mediante un grupo ptico de gran distancia
focal es posible que objetos muy alejados del observador ocupen una regin significativa del rea del
sensor, obteniendo la sensacin de que el grupo ptico acerca las imgenes. Anlogamente,
disminuyendo el poder de la lente, podemos aumentar el ngulo de visin de la cmara obteniendo la
sensacin de que nos alejamos de los objetos. El sistema visual humano, lamentablemente, no dispone
de esta capacidad para modificar su distancia focal.

Fig. 1.32 Proceso de proyeccin de la escena a imgenes planas

Los filtros dicroicos, cuya funcin ya se ha descrito en el apartado anterior, slo se usan en sistemas
de televisin en color. En cine, fotografa o televisin en blanco y negro se utiliza un nico sensor de
imagen. Los filtros dicroicos suelen estar situados detrs del grupo ptico, aunque en algunos casos es
posible que existan algunas lentes detrs de este separador. Es importante notar que la presencia del
sensor de imagen introduce una limitacin fsica en el tamao de la imagen cuyos efectos
discutiremos en la siguiente seccin.

1.5.1 Sistemas para la representacin de imgenes 3D
Recientemente ha cobrado cierto inters el desarrollo de sistemas tridimensionales, que pretenden que
el espectador pueda recuperar la sensacin de espacio existente en la escena original.

El inters para el desarrollo de estos sistemas abarca aplicaciones muy diversas, que van desde
sistemas de gran pblico como el cine o la radiodifusin de seales de televisin hasta sistemas ms
Pl anos I magen
Gr upo pt i co Escena
) , , , , ( t z y x
) , ' , ' ( t y x
R
Pr oyecci ones Pl anas

de l a escena
Fi l t ros
di croi cos
) , ' , ' ( t y x
G
) , ' , ' ( t y x
B
Pl anos I magen
Gr upo pt i co Escena
) , , , , ( t z y x
) , ' , ' ( t y x
R
Pr oyecci ones Pl anas

de l a escena
Fi l t ros
di croi cos
) , ' , ' ( t y x
G
) , ' , ' ( t y x
B

especficos, como el control de robots para la manipulacin a distancia de brazos mecnicos en tareas
de peligro, donde el operador pueda actuar sobre una imagen tridimensional del medio; la
monitorizacin del trfico areo en aeropuertos; el desarrollo de sistemas informticos para la
representacin grfica tridimensional con aplicaciones en arquitectura; diseo de interiores; sistemas
para realidad virtual; video-juegos; simuladores educativos, etc.

Desde el inicio de la dcada de los 80, se ha detectado una gran actividad en la investigacin y
desarrollo de sistemas para la representacin de imgenes tridimensionales y actualmente existen
diversos sistemas, con filosofas de funcionamiento bastante distintas, algunas de las cuales se
encuentran slo al nivel de prototipos, aunque otras ya estn siendo comercializadas con cierto xito,
sobre todo en aplicaciones de video-juegos y presentaciones audiovisuales. Probablemente la
introduccin de estos sistemas en la televisin ser bastante tarda, ya que, si bien la mayora de
grandes empresas en el sector de la electrnica de consumo han empezado a desarrollar programas de
investigacin en este sentido, las soluciones no parecen por el momento triviales pues los sistemas
estudiados son excesivamente complejos y caros y en algunos casos producen cansancio visual en el
espectador. Adems, el objetivo principal de este sector para los prximos decenios es la
implantacin en el mercado de los sistemas de TV digital y de alta definicin, por lo que no se espera
que aparezcan sistemas tridimensionales en el futuro inmediato. Sin embargo, es probable que el uso
de estos sistemas empiecen a popularizarse en aplicaciones profesionales, educativas o ldicas, en
sistemas informticos domsticos o industriales. De hecho, algunos de estos sistemas ya se
comercializan actualmente y, probablemente, la principal dificultad para su implantacin radica en
que existe una multitud de propuestas y sistemas incompatibles que desorientan al consumidor y que
se inhiben mutuamente. El objetivo de esta seccin es presentar los principios bsicos sobre visin
tridimensional junto con las distintas propuestas que se estn considerando actualmente.

1.5.2 Mecanismos de visin tridimensional
Para analizar los distintos sistemas de representacin de imgenes tridimensionales es necesario
comprender los mecanismos clave para la percepcin del espacio en el sistema visual humano. La
percepcin tridimensional del espacio se realiza a travs de un complejo proceso en el que intervienen
conjuntamente varios factores, entre los que destacan: el uso de pistas monoculares, la convergencia y
acomodacin de los ojos al centrar la atencin en distintos puntos del espacio, y las diferencias entre
las imgenes captadas por las dos retinas debidas a la distinta perspectiva del espacio que se obtiene
con cada uno de los ojos.

Las denominadas pistas monoculares permiten que seamos capaces de identificar con cierta precisin
la posicin de los objetos en un espacio tridimensional, aun cuando mantengamos uno de los ojos
cerrados. Esta percepcin del espacio hace uso de la experiencia previa en identificar objetos
conocidos de los que se deducen claves, que son analizadas de manera sistemtica por el cerebro para
determinar su posicin y orientacin en el espacio. Una de las pistas ms relevantes la proporcionan
los objetos que quedan parcialmente ocultos por otros objetos situados ms cerca del espectador. Otras
se obtienen a partir del conocimiento previo del espectador sobre las formas y tamaos de objetos
conocidos. As por ejemplo, si observamos una bicicleta con un nico ojo, seremos capaces de deducir
la distancia aproximada a la que se encuentra a partir de su tamao y de las dimensiones de los objetos
conocidos que se encuentran a su alrededor. Tambin podremos deducir su orientacin utilizando
conceptos elementales de perspectiva visual como el tamao relativo de cada una de sus ruedas y la
forma elptica que estas toman. Sabemos que la rueda de menor tamao ser la ms alejada y que la
forma de stas ser tanto ms elptica cuanto ms frontalmente est orientada la bicicleta hacia el
espectador. Todas estas apreciaciones se basan en que sabemos que las dos ruedas de la bicicleta son
circulares y que su tamao es aproximadamente igual. Si construyramos una bicicleta con ruedas
elpticas de dimensiones dispares tendramos serias dificultades para situarla en el espacio a partir de
una observacin monocular. As pues, la visin monocular es una consecuencia directa sobre la
experiencia de vivir en un espacio tridimensional.

Otro aspecto muy utilizado por el sistema visual para deducir la posicin real de los objetos mediante
el uso de un nico ojo consiste en ver cmo se modifica la perspectiva de la imagen cuando movemos
ligeramente la cabeza. En este caso, los objetos prximos experimentan un cambio de posicin
relativa importante, mientras que la posicin de los objetos alejados apenas cambia. Este cambio de
posicin, conjuntamente con el movimiento de la cabeza, permite deducir aproximadamente la
distancia a la que se encuentran los objetos. Los sistemas de representacin de imgenes que permiten
observar un cambio en la perspectiva de la escena cuando el espectador se desplaza se conocen como
sistemas con parallax de movimiento.

Existen algunos programas informticos para el diseo grfico, o vdeo-juegos, que se autodenominan
sistemas tridimensionales, que nicamente proporcionan pistas monoculares al espectador sobre un
display plano convencional. En el entorno del diseo grfico suele tratarse de programas que permiten
trabajar y definir los objetos en un espacio tridimensional virtual permitiendo modificar con facilidad
el punto de vista desde el que se observa el objeto. Probablemente el vdeo-juego 3D ms popular es
el doom, cuya filosofa ha sido adoptada por muchos otros juegos. En este caso, el usuario observa en
la pantalla un mundo virtual, en el que puede desplazarse mediante el joystick o el teclado,
proporcionndose una perspectiva natural de la escena llena de pistas monoculares. El programa
modifica el punto de vista de la escena de acuerdo con los movimientos del joystick, admitiendo
movimientos en cualquier direccin, por lo que el jugador puede inducir fcilmente la distancia a la
que se encuentran los objetos. Los sistemas que nicamente utilizan pistas monoculares y representan
las imgenes sobre displays convencionales son conocidos en el entorno de los sistemas 3D que
requieren sistemas de representacin especficos como sistemas de 2dimensiones.

La visin monocular es esencialmente plana y la percepcin de los objetos en el espacio se realiza
siempre utilizando pistas indirectas, por lo que no puede considerarse como una verdadera percepcin
tridimensional del espacio. Este tipo de visin se conoce tambin como visin ciclpea, en honor al
cclope, animal mitolgico que posea un nico ojo en el centro de la cabeza, ya que el tipo de
informacin que proporciona es el que se obtendra con un nico ojo. Las pistas monoculares son la
nica informacin tridimensional que tenemos en cine y televisin convencional, puesto que las
imgenes se reproducen siempre sobre un dispositivo plano. A veces, los propios movimientos de la
cmara (travellings) se utilizan para dar al espectador una sensacin subjetiva del espacio en el que
transcurre la accin.

Un experimento caracterstico para ver los lmites de la percepcin monocular, y que se encuentra
disponible en casi todos los museos cientficos, consiste en pedir a una persona que con un ojo cerrado
y sin mover la cabeza toque una pequea barra cilndrica que est colgada del techo y prxima a l. En
general se requiere realizar un buen nmero tentativas para tocar la barra, mientras que si el
experimento se repite con los dos ojos abiertos sta se localiza sin dificultad. El experimento tambin
sirve para comprobar que cuando el espectador ha adquirido informacin sobre las dimensiones reales
de la barra, resulta mucho ms sencillo localizar la posicin de la barra con uno de los ojos cerrados.
Tambin se simplifica notablemente la localizacin de la barra si se permite que el observador
desplace la cabeza. En ambos casos la percepcin del espacio se realiza a travs de pistas
monoculares. Algunos animales, como los pjaros, tienen una notable percepcin del espacio
utilizando exclusivamente pistas monoculares. En estos casos, los dos ojos estn situados a los lados
de la cabeza, por lo que proporcionan puntos de vista completamente distintos del entorno, de modo
que no puede usarse esta informacin para reconstruir el espacio tridimensional. Se supone que el
proceso de percepcin de distancias y espacio se realiza a travs de rpidos movimientos de la cabeza
con los que se cambia ligeramente el punto de vista de la escena. La informacin de los distintos
puntos de vista es entonces procesada de manera secuencial por el cerebro para obtener la percepcin
definitiva del espacio. La diferencia fundamental entre este tipo de visin y la humana es, pues, que en
el primer caso la informacin es procesada en serie, mientras que en el segundo se realiza en paralelo.
En general, los animales que tienen los dos ojos situados en la parte frontal tienen una mejor
percepcin del espacio.

Los mecanismos de visin humana requieren la coordinacin de los ojos interviniendo dos factores
que tambin resultan determinantes para la percepcin del espacio: la acomodacin y la convergencia.
Se denomina acomodacin a los cambios que deben realizarse sobre el cristalino para que, al centrar
la atencin sobre un objeto, est quede correctamente enfocado en la retina. De acuerdo con esto, la
posicin de los msculos que controlan el cristalino se modificar dependiendo de lo alejado que est
el objeto sobre el que centramos nuestra atencin. Seguramente, la posicin de los msculos es
utilizada parcialmente por el cerebro como informacin adicional para la percepcin espacial. Por otra
parte, al fijar la atencin en un objeto, es preciso modificar el eje visual de cada uno de los ojos para
que ste permanezca correctamente enfocado. Esto significa que los dos ejes visuales convergen en el
punto donde est situado el objeto y por lo tanto, el ngulo de convergencia de estos dos ejes
constituye otra clave para determinar su distancia. Es evidente que el ngulo que formarn los dos ejes
visuales ser tanto mayor cuanto menor sea la distancia entre el observador y el objeto, por lo que, en
principio, es posible obtener una medida subjetiva de la distancia del objeto a partir de la
convergencia entre los dos ojos.

La convergencia de los dos ejes visuales y la acomodacin del cristalino aportan una valiosa
informacin para la situacin de los objetos aunque no constituye seguramente la principal
responsable de la percepcin tridimensional del espacio, como lo constata el hecho de que podemos
situar con precisin los objetos que permanecen fuera del campo de enfoque. La informacin ms
relevante que utiliza el cerebro para componer el espacio la constituyen las diferencias existentes entre
las imgenes sensadas por cada una de las retinas. El filsofo griego Euclides de Alejandra, en el ao
280 a.C., fue el primero en postular que la percepcin de la profundidad se produca como
consecuencia de en cada ojo se formaban dos imgenes ligeramente distintas de los objetos. Sin
embargo, estos postulados no fueron comprobados experimentalmente hasta el ao 1600 en el que el
artista Giovanni Battista della Porta experiment con varios dibujos para crear las primeras imgenes
tridimensionales artificiales.

La formacin de las imgenes en el espectador se esquematiza en la figura 1.33, donde se indican las
disimilitudes entre las proyecciones de los puntos de una escena en las dos retinas. En este ejemplo se
supone que el espectador mantiene enfocado el punto F, por lo que los dos ejes visuales coinciden en
este punto. El punto B, situado a la misma distancia del espectador, se proyecta en la retina derecha a
una distancia del punto F ligeramente inferior a la que queda proyectado en la retina izquierda. En el
punto A, situado ms cerca del espectador, las diferencias entre cada una de las proyecciones se
acentan. Estas diferencias entre las dos imgenes permitirn situar la posicin del objeto. El clculo
de la posicin de los objetos a partir de sus proyecciones en la retina es un complejo problema de
trigonometra que, sorprendentemente, el cerebro realiza de forma automtica, resolviendo adems las
posibles ambigedades que pudieran surgir de un clculo meramente matemtico por su interpretacin
fsica ms plausible. Este anlisis supone realizar un reconocimiento de formas previo para identificar
los objetos y puntos caractersticos de la escena y establecer cules se corresponden uno a uno en las
dos proyecciones. La solucin al problema no siempre es nica, por lo que en algunos casos surgen
ambigedades que el cerebro debe interpretar de la forma ms coherente. Cuando la interpretacin de
la imagen no se corresponde con los objetos, sus posiciones o movimientos reales decimos que se trata
de ilusiones pticas.

Fig. 1.33 Proyeccin de los objetos en las retinas de un observador

En cualquier caso, la percepcin tridimensional est ntimamente ligada con las disimilitudes entre las
imgenes sensadas en cada retina, por lo que cualquier sistema que pretenda reproducir las
sensaciones tridimensionales deber proporcionar al espectador esta informacin. Muchos de los
sistemas de representacin de imgenes tridimensionales se basan en separar, por algn procedimiento
ptico, mecnico o electrnico dos imgenes correspondientes a dos puntos de vista distintos que se
presentarn a cada ojo independientemente. Estos sistemas se conocen como estereoscpicos y son
probablemente los ms populares.
F
A
B
a
L
f
L
b
L
a
L
f
L
b
L
F
A
B
a
L
f
L
b
L
a
L
f
L
b
L
F
A
B
a
L
f
L
b
L
a
L
f
L
b
L
1.5.3 Sistemas estereoscpicos
La alternativa ms utilizada para proporcionar al espectador la sensacin de imgenes en tres
dimensiones consiste en presentar las proyecciones planas de la escena que se obtendran en dos
puntos del espacio situados a una distancia parecida a la que separa los dos ojos (unos 6,5 cm). Para
conseguir el efecto de tres dimensiones, el sistema reproductor deber presentar al ojo derecho la
imagen que se ha captado con la cmara de la derecha y al ojo izquierdo la obtenida con la cmara
izquierda. La mayora de sistemas requieren que el espectador utilice algn tipo de lentes u otros
elementos pticos que acten como filtros separadores de las imgenes. Con ello, las imgenes
proyectadas en la retina coincidirn con las que hubieran incidido en el espectador si hubiera estado en
la posicin de la cmara. De hecho, la sensacin de espacio conseguida con esta tcnica es muy
espectacular y sus principios han venido utilizndose desde hace bastantes aos. Actualmente, con la
posibilidad de sintetizar imgenes mediante ordenador es posible presentar al espectador puntos de
vista y ngulos de la escena que seran impensables en una situacin real.

El primer sistema comercial para la visin de imgenes en tres dimensiones se populariz alrededor de
1900 y estaba basado en el estereoscopio de Brewster, que haba aparecido en 1847. Este equipo era
un visor para uso personal que cargaba dos pares de fotografas en un sistema ptico-mecnico que
permita que cada ojo viera una imagen distinta. La fotografa estereoscpica tuvo un considerable
xito durante el primer cuarto de siglo, vendindose un nmero importante de estereoscopios y
material fotogrfico asociado (sobre todo colecciones de fotografas). Sin embargo, despus de la
segunda guerra mundial, este mercado experiment una importante cada y prcticamente desapareci,
ya que el montaje de los pares fotogrficos era bastante tedioso y slo podan ser visualizados por una
nica persona, por lo que no pudo competir con otras formas de entretenimiento, de gran auge, como
el cine y la televisin.

En la dcada de los 50 se realizaron algunas producciones cinematogrficas que utilizaban sistemas
estereoscpicos que podan ser observados por varios espectadores simultneamente. No obstante, sus
efectos parecan poco reales y, en consecuencia, su xito comercial fue relativamente bajo. El
problema se deba a que el procedimiento utilizado para proyectar las dos imgenes en cada una de las
retinas del espectador no estaba suficientemente depurado y haba un importante cruce de imgenes.

El primer sistema se comercializ con el nombre de Anaglyph y requera que el espectador utilizase
unas gafas con un cristal rojo y uno verde (que posteriormente fue azul). Las imgenes se haban
obtenido mediante dos cmaras (o una cmara con dos lentes) y se proyectaban superpuestas en la
pantalla. Una de las imgenes se proyectaba con una tonalidad dominante verde y la otra con una
tonalidad roja, de manera que si la pantalla se observaba sin gafas se distingua claramente que las dos
imgenes estaban desplazadas. Cuando el espectador se colocaba las gafas, el cristal rojo oscureca la
imagen con esta tonalidad y dejaba pasar la verde y viceversa con el cristal verde. Por lo tanto, la
seal que pasaba a travs de cada ojo se corresponda con la que haba captado la cmara
correspondiente. En principio cada una de las imgenes eran adquiridas en blanco y negro y se
proyectaban en la pantalla con el filtro correspondiente. La imagen percibida por el espectador induce
sensaciones de color artificiales por cuanto en una retina se activan los conos de color rojo mientras en
la otra los de color verde. El problema de este sistema es que los colores que inciden en cada ojo
tienen componentes de color distintas y se producen desequilibrios de intensidad entre las dos
imgenes, lo que confunde y dificulta la concentracin en el espectador. Adems, los filtros utilizados
en las gafas solan ser muy econmicos y no separaban las dos imgenes correctamente. En algunos
casos, sobre todo en fotografa, se ha intentado generalizar el sistema Anaglyph para percibir una
sensacin de color ms real proyectando imgenes en color y procesndolas con filtros adecuados. No
obstante, debido al filtrado de colores inherente al sistema, no pueden reproducirse todos los colores y
es sumamente difcil establecer el balance de colores adecuado para que cada fotograma pueda ser
visualizado con un mnimo de error de color. En la figura 1.38 se muestra un fotograma para ser
visualizado mediante este sistema. El propsito de esta ilustracin es que el lector aprecie el orden de
magnitud de las diferencias entre las dos imgenes que se presentan a la retina. En el caso de que se
disponga de una versin en color de la fotografa podr observarse el efecto estereoscpico utilizando
un filtro rojo en el ojo izquierdo y un filtro azul en el derecho ya que la imagen para la retina derecha
est codificada en rojo (el filtro elimina la componente azul) y la de la izquierda en azul (el filtro
elimina la roja).

Fig. 1.38 Fotograma de una escena tridimensional en el sistema Anaglyph

Posteriormente se utiliz el sistema Polaroid que se basaba en grabar dos pelculas con dos lentes que
polarizaban la luz en ngulos opuestos. Las imgenes se superponan posteriormente en la pantalla y
el espectador deba observarlas con unas gafas que incluan unas lentes polarizadoras de
caractersticas similares a las utilizadas en la grabacin de la pelcula. Esta tentativa tampoco tuvo
inicialmente excesivo xito comercial y, al igual que el sistema Anaglyph, fue considerada como una
curiosidad tecnolgica utilizndose espordicamente en algunos museos o ferias.

Estos sistemas tuvieron un importante impulso a finales de la dcada de los 80, en los que se
mejoraron tanto los sistemas de separacin de las imgenes como la precisin en el posicionamiento
de las imgenes en pantalla. Actualmente existen diversos teatros especiales en donde se proyectan
pelculas y documentales registrados en formatos parecidos y que tienen un considerable xito
comercial.
En general, estos sistemas de proyeccin utilizan dos filosofas distintas para la separacin de las
imgenes que, en ambos casos, requieren que el espectador utilice gafas especiales. El primer sistema
deriva directamente del sistema Polaroid y utiliza filtros de polarizacin de luz verticales y
horizontales. En la pantalla se proyectan simultneamente las imgenes captadas por dos cmaras, una
de las cuales se pasa a travs de un filtro de polarizacin horizontal y la otra por uno vertical. El
espectador lleva unas gafas en la que en cada ojo hay un filtro polarizador distinto, con lo que slo se
observa la imagen que le corresponde, producindose el efecto estereoscpico deseado. La evolucin
en la fabricacin de materiales plsticos polarizadores de bajo coste ha permitido que este sistema
proporcione una calidad aceptable y un reducido nivel de cruce entre las imgenes.

La alternativa a este procedimiento es un sistema en el que las imgenes correspondientes a cada ojo
se presentan de manera alternativa al espectador, que est equipado con unas gafas de cristal lquido
que actan a modo de obturador. El cristal lquido es un material que puede ser opaco o transparente,
dependiendo de la tensin externa que se aplique. Las gafas estn equipadas con un controlador
electrnico que aplica las tensiones apropiadas para que uno de los cristales sea opaco mientras el otro
es transparente, y viceversa. El principio de funcionamiento del sistema se ilustra en la figura 1.35.
Cuando se proyecta la imagen correspondiente a la cmara derecha, el cristal correspondiente al ojo
derecho ser transparente, mientras el del ojo izquierdo permanecer opaco, de manera que esta
imagen slo ser capturada por la retina derecha. La situacin se invierte cuando se proyecta la
imagen correspondiente a la cmara izquierda. Las imgenes se intercalan a una velocidad
suficientemente alta para que el observador no pueda apreciar la naturaleza discontinua de la
informacin que se presenta a cada ojo. Las gafas LCD que lleva el espectador estn equipadas con un
receptor de infrarrojos o de radio para que el sincronismo entre cada una de las imgenes y los
obturadores de las gafas sea perfecto y no existan cruces entre imgenes. La percepcin del espacio
tridimensional en este sistema es bastante buena por cuanto las imgenes quedan correctamente
separadas y no aparecen cruces.

Fig. 1.35 Principio de funcionamiento de los sistemas estereoscpicos con obturadores de cristal lquido. Las
imgenes proyectadas en la pantalla y las gafas estn sincronizadas
Proyector cmara
derecha
Proyector cmara
izquierda
Cuando se proyecta
la imagen de la cmara
derecha la luz de la cmara
izquierda est obturada
La informacin de sincronizacin
se enva a las gafas LCD que
mantienen abierto el cristal
derecho mientras se proyecta
esta imagen
Proyector cmara
derecha
Proyector cmara
izquierda
Cuando se proyecta
la imagen de la cmara
derecha la luz de la cmara
izquierda est obturada
La informacin de sincronizacin
se enva a las gafas LCD que
mantienen abierto el cristal
derecho mientras se proyecta
esta imagen
El sistema de exhibicin ms popular es probablemente el IMAX-3D para el que existen bastantes
salas de exhibicin y que se basa en un formato de pelcula de grandes dimensiones. La empresa
IMAX, de origen canadiense, da soporte para la instalacin de salas de exhibicin y tiene un servicio
de alquiler de cmaras y de equipos para la postproduccin de pelculas en este formato. El
procedimiento para la separacin de las imgenes puede ser, dependiendo del teatro, mediante gafas
polarizadas o mediante obturadores. En el IMAX-3D del Port Vell de Barcelona se utiliza un sistema
basado en gafas polarizadas. La cmara requiere utilizar dos negativos cuyas imgenes se
corresponden con las que se presentaran a cada uno de los ojos. Cada fotograma tiene una superficie
tres veces superior a la del formato de 70 mm utilizado en el cine convencional por lo que la calidad
de las imgenes es muy buena y puede proyectarse en pantallas de grandes dimensiones. Los
fotogramas correspondientes a las dos pelculas se toman de manera sincronizada mediante una
cmara especial (ver figura 1.36) que, junto con las lentes y la pelcula, tiene un peso aproximado de
100 Kgs. La carga de la pelcula en la cmara supone un laborioso proceso que requiere el empleo de
un mnimo de 30 minutos. Adems, cada carga slo permite registrar un mximo de tres minutos de
pelcula tras lo cual debe repetirse el procedimiento de carga de nuevo celuloide.

Fig. 1.36 Cmara y proyector en el formato IMAX-3D

El proyector del sistema IMAX-3D intercala los fotogramas correspondientes a cada pelcula en la
pantalla. Las dos pelculas estn arrolladas en carretes de grandes dimensiones para que puedan tener
duraciones largas sin necesidad de recargarlas. Las pelculas se desplazan en la direccin horizontal,
ya que el gran tamao de los carretes dificultara un desplazamiento vertical como el usado en el cine
convencional. El proyector contiene dos lmparas, una para cada pelcula, con potencias de alrededor
de 15000 Vatios que deben ser enfriadas por agua. En la figura 1.36 puede observarse una fotografa
de un proyector IMAX-3D donde se aprecia el gran tamao del equipo y los carretes contenedores de
la pelcula en sentido horizontal.

La idea general de estos sistemas estereoscpicos para fotografa y cine ha sido trasplantada a otros
entornos que comprenden diversas aplicaciones informticas, prototipos de sistemas de televisin
tridimensionales, video-juegos, realidad virtual, etc. Los dos procedimientos ms usados para la
Cmara IMAX 3D Proyector IMAX 3D Cmara IMAX 3D Proyector IMAX 3D
separacin de las imgenes siguen siendo las gafas polarizadas y las de obturacin de imagen
mediante cristal lquido. Ambos sistemas ofrecen una calidad comparable y, por supuesto, permiten
una codificacin del color real que no era posible con el sistema Anaglyph. En los dos casos se
produce una ligera prdida de luminosidad puesto que los cristales utilizados slo dejan pasar una
fraccin de la luz incidente ya que no son completamente transparentes. El cruce entre imgenes, es
decir, la parte de energa que recibe el ojo derecho de la imagen correspondiente al ojo izquierdo o
viceversa, es algo menor en el caso de las gafas de cristal lquido, aunque es tolerable, y siempre
depender de la calidad del filtro, en las polarizadas.

La principal ventaja del sistema de obturacin electrnica de las imgenes es que puede adaptarse
fcilmente para usarse con monitores convencionales. En este caso, las imgenes correspondientes a
cada ojo se alternan en la pantalla y se sincronizan con los obturadores de cristal lquido, con lo que
puede obtenerse un sistema de representacin en tres dimensiones modificando nicamente la
secuencia de imgenes que se presenta al usuario y sin necesidad de aadir ningn tipo de hardware
adicional. Es un sistema que puede adaptarse a sistemas de televisin o equipos informticos sin ms
que adecuar la seal de vdeo para que proporcione alternativamente las imgenes correspondientes a
cada ojo e incorporar un subsistema que permita la correcta sincronizacin de los obturadores. El
principal inconveniente de esta tecnologa es que al multiplexar temporalmente los dos canales, se
reduce la frecuencia de imagen por lo que puede llegar a producirse un parpadeo significativo. Este
efecto es tanto ms notorio cuanto menor sea la frecuencia de actualizacin de imgenes en la
pantalla, por lo que, si bien se adapta sin excesivos problemas a equipos informticos con velocidades
de refresco altas, plantea serias dificultades para su implantacin en sistemas de televisin
convencionales.

En el mbito de los sistemas de televisin en tres dimensiones se han realizado algunos prototipos que
combinan dos seales de vdeo, una para cada ojo, y que presentan las imgenes alternadas en un tubo
de rayos catdicos convencional, con lo que se consigue mantener la frecuencia de refresco de
imagen. A pesar de que esta filosofa requiere el uso de receptores especficos para combinar la
informacin de los dos canales en imgenes estereoscpicas, estos sistemas seran compatibles con la
TV convencional, ya que bastara con sintonizar el canal correspondiente a uno de los ojos para que el
usuario que no tuviera un receptor 3D pudiera ver las imgenes en formato convencional. La seal de
vdeo del otro canal estereoscpico puede usarse para introducir la informacin necesaria para
mantener el sincronismo de los obturadores con el monitor. Sin embargo, se supone que ninguno de
estos prototipos se convertir en un estndar por cuanto, en cualquier caso, imponen el uso de gafas
especiales en el espectador, lo que se suele considerar como una restriccin importante para que los
sistemas tengan una buena aceptacin.

Actualmente se comercializan distintos sistemas basados en obturadores de cristal lquido para
aplicaciones informticas. La integracin de estos sistemas en un equipo informtico es relativamente
simple, y afecta, casi exclusivamente, al software. El sistema VR-SimulEyes, uno de los ms
populares, nicamente requiere, como se indica en la figura 1.37, conectar una pequea extensin de
hardware adicional en la salida del conector VGA a la que tambin permanece conectado el monitor.
Los pares de imgenes estereoscpicas se envan secuencialmente al monitor insertando en una de las
lneas visibles un cdigo que indica a que ojo corresponde cada imagen. Para sincronizar los
obturadores con la imagen de la pantalla basta con reconocer este cdigo y conmutar las tensiones
aplicadas al cristal lquido. De ello se encarga el hardware adicional, que est integrado en una caja
externa de reducidas dimensiones y que proporciona la seal de control de las gafas. Este hardware
dispone de varias salidas para que puedan conectarse simultneamente varios usuarios. La sensacin
de profundidad y la percepcin espacial es muy aceptable y el parpadeo, si el ordenador es rpido, es
poco perceptible. Si acaso, se observa sobre todo en los objetos exteriores a la pantalla y siempre
puede reducirse o anularse oscureciendo la habitacin. Existen otros productos de caractersticas y
prestaciones parecidas y, probablemente, el verdadero problema para su implantacin definitiva en el
mercado es la competencia que ejercen entre ellos y la carencia de productos software genricos para
ellos. La mayora de fabricantes se han dedicado a establecer colaboraciones con compaas de
software para vdeo-juegos produciendo versiones de programas comerciales de xito que puedan
adaptarse al formato tridimensional. Nuevamente, el citado Doom es probablemente el programa del
que se han creado ms versiones estereoscpicas. Sin embargo, an existen pocos programas de
aplicaciones para trabajar con estos sistemas.

Fig. 1.37 Integracin de un sistema de gafas de cristal lquido en un equipo informtico

La empresa VRex dispone de una completa gama de productos para la produccin de vdeo y
programas informticos en formato estereoscpico para aplicaciones domsticas y profesionales. Los
elementos bsicos para la presentacin son los displays LCD y los proyectores que en ambos casos
deben visualizarse con gafas polarizadas. La orientacin principal de estos productos es la de ofrecer
un soporte global para las presentaciones de empresa o docentes y la publicidad. Las cmaras son de
dimensiones y peso reducidos y proporcionan las imgenes sensadas por cada uno de los grupos
pticos en una seal de vdeo NTSC o PAL convencionales en la que en las lneas pares estn
codificadas las imgenes correspondientes a uno de los canales y en las impares el otro. La resolucin
de imagen que se apreciar con cada uno de los ojos es, por tanto, la mitad de la televisin
convencional, aunque este efecto no es excesivamente notorio. La principal ventaja de este sistema es
que proporciona una salida estndar que puede grabarse en un magnetoscopio de cualquier formato o
editarse en cualquier equipo.

Como proyector se utiliza un LCD color de alta definicin en el que, sobre su superficie, estn
montados unos microfiltros de polarizacin (Pol) que proporcionan a la luz emitida por las lneas
pares y las impares una polarizacin lineal o circular. De este modo, si las gafas del espectador tienen
los filtros de polarizacin adecuados, cada uno de los ojos ver exclusivamente las lneas pares o las
impares. Estos filtros Pol tambin pueden adaptarse a ordenadores porttiles, aunque el proceso de
instalacin es complejo y debe realizarse en centros especializados. La tecnologa actual permite que
la anchura de los filtros sea de 201 m con lo que puede adaptarse a displays TFT de hasta 1280
1024 pxeles. Los filtros Pol tambin pueden adaptarse para producir copias impresas de imgenes
tridimensionales. En este caso, la distribucin de los polarizadores puede ser bidimensional resultando
en una mejor imbricacin entre los dos pares estereoscpicos.

Uno de los inconvenientes del sistema es que no puede usarse con tubos de rayos catdicos, ya que
estos no ofrecen suficiente precisin para adaptar los microfiltros en la pantalla. Para la sntesis de
grficos 3D por ordenador se suministra un software especfico que permite la edicin de imgenes y
finalmente intercala el contenido de los dos canales en las lneas de la pantalla.

Visores integrados

La mayora de mquinas para vdeo-juegos de realidad virtual o simuladores profesionales utilizan la
misma filosofa de los sistemas estereoscpicos, aunque el procedimiento utilizado para la separacin
de las imgenes es, en ocasiones, algo ms sofisticado. En estos casos, suele incorporarse un visor o
casco en la cabeza del usuario que incorpora dos displays de cristal lquido independientes, uno para
cada ojo, de modo que la separacin de dos imgenes es perfecta y ambas tienen una buena definicin.

Fig. 1.38 Vistas frontal y posterior de un sistema de visin estereoscpica integrado (ProView 30)

Este tipo de sistemas se conocen como HMD, que corresponde a las siglas Head Mounted Displays.
En algunos casos el visor puede incorporar sensores de movimiento y posicin que determinan la
direccin a la que el usuario dirige la cabeza e indican al ordenador que genera las imgenes que
realice los cambios adecuados sobre el punto de vista de la escena de realidad virtual. En este ltimo
es fundamental que el ordenador realice los cambios del punto de vista a gran velocidad, ya que los
retardos entre el movimiento de la cabeza y la actualizacin de las imgenes producirn una sensacin
de descoordinacin del movimiento que inevitablemente puede conducir a la aparicin de mareo y
nuseas. Este tipo de sistemas tienen un elevado precio y suelen usarse en aplicaciones profesionales
de carcter cientfico (microscopa 3D), industrial (inspeccin, control de procesos, CAD/CAM) o de
realidad virtual. En la figura 1.38 se presentan dos vistas de uno de estos sistemas que puede aceptar
una o dos seales (para trabajar en modo mono o estreo) tanto en formato VGA como vdeo NTSC o
PAL. El sistema incorpora un sistema ptico que admite diversos ajustes para evitar la fatiga (los LCD
no podran enfocarse correctamente si no existiera ptica adicional, ya que estn muy prximos a la
retina). Los displays son del tipo TFT de color y tienen una resolucin de 640 480 proporcionando
un campo de visin de 24 18 (Horizontal Vertical).

1.5.4 Sistemas autoestereoscpicos
Todos los sistemas que hemos descrito hasta el momento requieren utilizar unas gafas especiales, lo
que sin duda introduce cierto grado de incomodidad en el espectador. Los denominados sistemas
autoestereoscpicos continan con la misma filosofa de presentar al usuario una visin binocular de
la escena, pero sustituyen el proceso de separacin de las imgenes que se realiza en las gafas por un
filtrado ptico que se produce en la pantalla del propio dispositivo de presentacin. En esta seccin
describiremos las ideas y caractersticas fundamentales de estos sistemas, de los que existen mltiples
variantes tecnolgicas y cuya descripcin detallada excede nuestros objetivos.

Una posible configuracin bsica de uno de estos sistemas se esboza en la figura 1.39, donde se
representa una escena genrica que es captada por dos cmaras, de modo anlogo a como se realizara
en un sistema estereoscpico convencional. Las imgenes obtenidas por estas cmaras son procesadas
y se combinan en una secuencia de imgenes en las que se intercalan los pxeles correspondientes a
cmara, tal y como se indica esquemticamente en la parte superior derecha de la figura 1.39. Cada
una de las imgenes que se presentarn al espectador tiene una estructura de barras verticales
estrechas en las que se alternan cada uno de los canales binoculares. Esta distribucin queda indicada
por los caracteres A y B que representan la cmara a la que corresponde cada elemento de imagen. La
distancia horizontal entre dos elementos correspondientes a una misma cmara se denomina pitch.

Fig. 1.39 Principios de formacin de imagen en sistemas autoestereoscpicos
Cmara A
Cmara B
Procesado
Imbricacin
Imgenes
Proyector LCD
Placa difusora
A
A
A
A
B
B
B
B
B
A
Pantalla
Lenticular
A A
A
A
A
A A A
B
B
B
B
A
A
B
B
B
A B
B B
Cmara A
Cmara B
Procesado
Imbricacin
Imgenes
Proyector LCD
Placa difusora
A
A
A
A
B
B
B
B
B
A
Pantalla
Lenticular
A A
A
A
A
A A A
B
B
B
B
A
A
B
B
B
A B
B B
El resultado de esta imbricacin de las cmaras se proyecta mediante un display LCD de alta
resolucin a la parte posterior de una pantalla que est compuesta por una placa difusora traslcida y
una pantalla lenticular. Los detalles de su constitucin fsica se ilustran slo para una pequea porcin
de la pantalla, en la que se ha aumentado considerablemente la escala, para poder apreciar con
claridad el principio de la formacin de imgenes. La pantalla lenticular est situada con gran
precisin sobre la placa difusora y acta como un elemento ptico que direcciona la luz procedente de
los pxeles correspondientes a las cmaras A y B hacia los puntos A y B, sobre los que se situar el
espectador. De este modo, se produce una sensacin de espacio tridimensional, ya que cada ojo slo
observa la imagen captada con la cmara que le corresponde.

La proyeccin de la imagen sobre una placa difusora puede sustituirse por una presentacin directa
sobre un LCD color del tipo TFT como los usados en ordenadores personales, o incluso, se han
realizado algunos prototipos, sobre tubos de rayos catdicos. En estos ltimos, sin embargo, se
requiere que la deflexin del haz sea extremadamente lineal y que la distorsin geomtrica de la
pantalla sea muy baja para poder posicionar correctamente los elementos correspondientes a cada
imagen sobre la pantalla lenticular. An as, por las limitaciones propias en la distorsin de los
mejores tubos de rayos catdicos, la resolucin obtenida es inferior a la que se obtiene con los
modernos LCD. Tambin es posible, utilizando pantallas lenticulares con una pelcula de aluminio de
alta reflexin, utilizar un sistema de proyeccin frontal de las imgenes.

Las pantallas lenticulares estn formadas por pequeas lentes cilndricas distribuidas verticalmente y
situadas una al lado de la otra, y aunque su uso para sistemas de vdeo autoestereoscpicos es
relativamente reciente, se han venido usando desde hace aos para otras aplicaciones. Probablemente,
uno de los productos ms conocidos que utilizan pantallas lenticulares son unas postales, que se
popularizaron en la dcada de los 70 y que dependiendo del punto de vista desde el que son
observadas representan escenas distintas. Otra aplicacin tpica es usarlas como pantalla para la
proyeccin de cine o diapositivas para un grupo reducido de espectadores. Su principal ventaja
respecto a otro tipo de pantallas es que son muy directivas y reflejan casi toda la luz incidente en la
direccin del proyector, por lo que si los espectadores se sitan entre la pantalla y el proyector,
observan la imagen con mucha luminosidad. Sin embargo, esta alta directividad las hace intiles en
aplicaciones como el cine comercial, en las que hay espectadores que observan la pantalla desde los
laterales. En la aplicacin que estamos considerando, la pantalla lenticular debe estar colocada con
mucha precisin respecto al sistema de presentacin de las imgenes y la distancia entre las lentes
debe coincidir con el pitch o distancia entre pxeles correspondientes a una misma imagen.

El inconveniente principal del sistema que hemos esbozado parece bastante claro: el espectador debe
situarse en una determinada posicin respecto a la pantalla y cualquier desplazamiento respecto a la
misma representar una reduccin considerable en el nivel de la imagen, con prdida eventual de la
visin binocular. Esto representa un serio problema, seguramente ms grave que el uso de gafas y se
han propuesto varias alternativas.

Una posible solucin, adecuada para aplicaciones informticas con un nico usuario, est siendo
desarrollada en el Instituto Heinrich Hertz de Berln y se basa en una sencilla variacin del sistema
descrito anteriormente. La idea bsica del sistema es controlar la posicin de la pantalla lenticular para
que cualquier movimiento del espectador se corresponda con un movimiento de la pantalla que
provoque que los nuevos puntos de convergencia de las imgenes coincidan con la nueva posicin de
los ojos. Para ello, se permite que la pantalla lenticular pueda desplazarse en la direccin horizontal y
acercarse o alejarse ligeramente del espectador (el movimiento vertical no es necesario puesto que la
pantalla es uniforme en esta direccin). Para determinar la posicin de los ojos del espectador se
utiliza un sistema de reconocimiento automtico de formas basado en adquirir, mediante una cmara
auxiliar, una imagen de los ojos del espectador, que se utiliza para realizar un seguimiento en tiempo
real de sus movimientos. El sistema de reconocimiento usado actualmente tiene un retardo
aproximado de unos 120 ms, por lo que es necesario utilizar un algoritmo de prediccin de posicin
para intentar reducir este retardo.

En aplicaciones en las que se supone que pueden coexistir varios espectadores, el sistema deber
proporcionar imgenes que sean visibles simultneamente desde distintas ubicaciones. La solucin
adoptada para resolver este problema consiste en captar la escena con un mayor nmero de cmaras,
de modo que cuando el espectador se site en distintas posiciones observe las imgenes captadas por
cmaras distintas. En la figura 1.40 se representa esta idea para un caso simplificado en el que
intervienen nicamente cuatro cmaras. El sistema representado sigue un esquema parecido al de la
figura 1.39, en el que las imgenes captadas por las distintas cmaras se entrelazan espacialmente en
una nica imagen de acuerdo con un patrn vertical. Ahora, es posible obtener un conjunto de puntos,
distribuidos en el rea donde se supone que se situarn los espectadores, desde donde pueden
visualizarse las imgenes correspondientes a distintas cmaras.

Fig. 1.40 Sistema autoestereoscpico para mltiples usuarios

Es evidente que si la resolucin del proyector LCD se mantiene, al tener que multiplexar un mayor
nmero de cmaras, el nmero de elementos de imagen asociados a cada una se reduce con lo que
aparece una prdida de resolucin en la imagen tanto mayor cuanto mayor sea el nmero de cmaras
implicadas. Como alternativa puede pensarse en usar un sistema basado en el uso de mltiples
retroproyectores cuyo principio de funcionamiento es muy parecido al que hemos expuesto. En vez de
utilizar un nico proyector en el que se imbrican todas las imgenes se utiliza un proyector para cada
secuencia de vdeo que ha sido capturada por una cmara distinta. La pantalla de retroproyeccin est
Cmara A
Cmara B
Procesado
Imbricacin
Imgenes
Proyector LCD
Placa difusora
A
C
A
C
B
D
B
D
C
B
Pantalla
Lenticular
A C
A
A
A
A C A
B
B
B
B
C
C
D
D
D
A B
B D
Cmara C
Cmara D
D C
B A
C
C
D
D
A
D
A
Cmara A
Cmara B
Cmara A
Cmara B
Procesado
Imbricacin
Imgenes
Proyector LCD
Placa difusora
A
C
A
C
B
D
B
D
C
B
Pantalla
Lenticular
A C
A
A
A
A C A
B
B
B
B
C
C
D
D
D
A B
B D
Cmara C
Cmara D
Cmara C
Cmara D
D C
B A
C
C
D
D
A
D
A
formada por dos pantallas lenticulares, una posterior y otra frontal, entre las que se encuentra una
placa difusora. La pantalla lenticular posterior descompone las imgenes procedentes de los
proyectores sobre la placa difusora en una componente para cada cmara, y posteriormente, la pantalla
lenticular frontal realiza la operacin inversa. No obstante, esta alternativa tecnolgica encarece
notablemente el producto, sobre todo si el nmero de cmaras es grande, pero la resolucin depender
exclusivamente de la calidad de los proyectores y de la pantalla lenticular.

El sistema de la figura 1.40 introduce una importante novedad respecto a los mtodos binoculares que
habamos considerado hasta este momento, y es que el punto de vista de la escena depende de la
posicin del espectador. En efecto, cuando el espectador se sita entre los puntos A y B, ve las
imgenes que han sido captadas por estas cmaras, obteniendo la percepcin del espacio que
corresponde a esta posicin. Cuando se desplaza a una posicin en la que observe las imgenes
correspondientes a las cmaras B y C percibir un cambio de perspectiva de la escena debido a que
estas dos cmaras estn situadas en un punto de vista distinto. Las caractersticas del sistema de
representacin han cambiado drsticamente, ya que ahora no slo percibimos la sensacin de espacio
tridimensional, sino que tambin experimentamos un cambio de perspectiva de los objetos al
desplazarnos dentro del recinto en el que se nos presentan las imgenes.

Atendiendo a la posibilidad de que un desplazamiento del espectador provoque un cambio en la
perspectiva de la escena, los sistemas de representacin tridimensional pueden clasificarse como
sistemas de espectador pasivo o de espectador activo. El primer tipo corresponde a todos los sistemas
estereoscpicos que hemos considerado en la seccin precedente (a excepcin del visor integrado con
sensores de movimiento), por cuanto en todos ellos las imgenes que se proyectan o reproducen en la
pantalla son independientes de la posicin del observador. Por ello, ste siempre percibir la misma
perspectiva desde cualquier posicin de la sala y si se desplaza, tendr la sensacin de que la escena se
desplaza con l. En otras palabras, la perspectiva que observamos es la obtenida por el par de cmaras
al registrar la escena y nuestros movimientos no se corresponden con un cambio del punto de vista.

Los sistemas de espectador activo proporcionan una informacin ms completa de la escena por
cuanto no slo nos proporcionan una imagen binocular de la misma, sino que esta informacin se
ajusta a nuestra posicin relativa en la sala. Un ejemplo caracterstico de este tipo es el sistema
autoestereoscpico que acabamos de describir. Si disponemos de distintas cmaras alrededor de la
escena, separadas por una distancia igual a la separacin entre los ojos, podremos proporcionar un
punto de vista que depende de la posicin de espectador. En un sistema de estas caractersticas,
cuando el observador se desplaza experimentar cambios en el punto de vista de la escena, viendo
como pueden aparecer determinadas partes de algunos objetos que, en la perspectiva previa,
permanecan ocultos por otros.

En general, los sistemas de espectador activo pueden a su vez clasificarse en distintos subgrupos
dependiendo del tipo de informacin que aporten al espectador cuando ste cambia de posicin. El
sistema que estamos considerando debera denominarse parallax de movimiento horizontal, ya que
slo aporta informacin de cambio del punto de vista cuando el espectador se desplaza en sentido
horizontal. Ntese que debido a la simetra vertical de las pantallas lenticulares, el punto de vista de la
escena no se modificar cuando el espectador se mueva en esta direccin (p.ej. agachndose). En
general existen tres posibles parallax de movimiento: el horizontal, el vertical y el de profundidad,
que se corresponden con los posibles ejes de movimiento del espectador respecto al sistema de
representacin de imgenes. El parallax de movimiento horizontal se considera el ms importante, por
cuanto es el movimiento ms probable del espectador. El parallax de profundidad es proporcionado
parcialmente por casi todos los sistemas, pues si bien la perspectiva de la escena no cambia al
acercarnos o alejarnos de la pantalla, el tamao del display y su campo visual s que vara, con lo que
al acercarnos o alejarnos percibimos cambios significativos en el tamao de los objetos (se aprecia
principalmente en displays de dimensiones reducidas). En ocasiones es habitual en la literatura
referirse al parallax de un sistema estereoscpico, entendindose como el cambio sobre el punto de
vista de la escena que se obtiene al contemplar la pantalla con el ojo derecho o el izquierdo
manteniendo la cabeza quieta. Es importante distinguir entre este tipo de parallax y el parallax de
movimiento al que hacemos referencia en este apartado. El primero nicamente tiene en cuenta el
cambio en la perspectiva debido a la posicin distinta de cada uno de los ojos y es comn a todos los
sistemas de representacin en tres dimensiones por cuanto las imgenes captadas por cada ojo deben
ser distintas, mientras que el segundo considera el cambio de punto de vista debido al movimiento del
observador.

Es evidente que cualquier sistema que aporte parallax de movimiento requiere, si se mantiene la
calidad del sistema de reproduccin, soportar un considerable aumento de la cantidad de informacin
a transmitir o almacenar. El sistema que hemos descrito en la figura 1.40 no introduce ningn aumento
en la cantidad de informacin enviada al sistema de proyeccin, ya que la calidad de cada una de las
imgenes se ve reducida por el entrelazado de las imgenes correspondientes a cada una de las
cmaras, pero la variante basada en mltiples proyectores s que supone un considerable aumento de
informacin y en consecuencia de ancho de banda.

Un importante problema de los sistemas autoestereoscpicos para mltiples usuarios es que la calidad
con la que se observan las imgenes no es uniforme y depende de la posicin del usuario. As, cuando
ste se sita en posiciones intermedias entre los puntos en los que tericamente convergen las
imgenes, la alta directividad de la pantalla lenticular provoca una prdida considerable del nivel de
luminosidad. Adems, es posible que aparezcan cruces entre las imgenes correspondientes a distintas
cmaras, perdindose en algunos casos el efecto tridimensional. Otra particularidad inherente al
sistema es que la codificacin del parallax de movimiento horizontal tiene una naturaleza discreta (un
punto de vista por cada par de cmaras que estn separadas unos 6,5 cm) por lo que, cuando el
espectador se desplaza, percibir cambios discontinuos sobre la perspectiva de la escena que producen
una sensacin poco real.

La fatiga ocular

Uno de los problemas comunes a todos los sistemas presentados hasta ahora es que suelen producir
fatiga ocular en el espectador. Se supone que los mecanismos por los que se produce esta fatiga son
debidos a la falta de consistencia entre la acomodacin y la convergencia de los ojos, conceptos a los
que hemos hecho referencia anteriormente. En efecto, en el mundo real, cuando centramos la atencin
sobre un objeto, disponemos los msculos del cristalino en la posicin ptima para que ste quede
enfocado correctamente y orientamos los glbulos oculares para que los ejes visuales de los dos ojos
coincidan sobre el objeto. La acomodacin y la convergencia se corresponden con la posicin del
objeto en el espacio. Ambos ajustes se realizan sistemticamente y sin tener consciencia de ello. No
obstante, en un sistema estereoscpico, las imgenes correspondientes a cada ojo se proyectan o
representan sobre una pantalla plana situada a una determinada distancia del espectador. Cuando se
separan los dos pares de imgenes, el sistema visual percibe la sensacin de un espacio tridimensional
en el que los objetos parecen surgir de la pantalla y encontrarse en algn punto intermedio situado
entre sta y el espectador.

La tendencia natural es, pues, la de concentrarse en determinados objetos de la escena con lo que la
convergencia y la acomodacin tienden a centrarse en los puntos donde aparentemente est situado el
objeto. Sin embargo, la imagen sigue formndose sobre la pantalla, por lo que al acomodar los ojos al
punto donde aparentemente est situado el objeto, ste aparecer desenfocado. Para ver correctamente
las imgenes y percibir la sensacin tridimensional el sistema visual debe situar el punto de enfoque
sobre la pantalla, aunque la posicin aparente del objeto y por tanto la convergencia de los ejes
visuales se produzca en una posicin ms cercana al espectador. Esta incoherencia entre la
acomodacin y la convergencia supone la aparicin de una cierta fatiga ocular en el espectador que es
tanto ms importante cuanto mayor es la distancia entre los objetos tridimensionales y la pantalla. El
problema es inherente a la propia filosofa de los sistemas estereoscpicos y en principio no tiene una
solucin evidente.

En las secciones siguientes consideraremos dos posibles alternativas a los sistemas estereoscpicos
para la representacin de imgenes tridimensionales. La principal ventaja de estos dos sistemas es que
presentan al espectador prcticamente todos los tipos de informacin espacial que el sistema visual
utiliza para la percepcin del espacio, con lo que se reduce notablemente la fatiga. Estas alternativas
no son las nicas que estn siendo consideradas actualmente aunque, sin duda, son las que prometen
resultados ms alentadores y que, casi con toda seguridad, acabarn desplazando a los sistemas
estereoscpicos en algunas aplicaciones.

1.5.5 Displays volumtricos
Los displays volumtricos son sistemas en los que se reproduce fsicamente un volumen
tridimensional mediante la generacin de estmulos lumnicos que representan la escena. El recinto
utilizado para la representacin de la escena suele ser un espacio cerrado, de forma esfrica, parecido
al que se ilustra en la figura 1.41. La idea general consiste en, mediante algn mecanismo, generar
puntos de luz en el interior del recinto que reproduzcan una imagen volumtrica virtual de la escena,
de modo que el espectador disponga de prcticamente toda la informacin visual necesaria para la
percepcin tridimensional de los objetos. Los puntos de luz se denominan voxels, que corresponde a la
abreviacin de volumetric pxel. De acuerdo con esta filosofa, el sistema proporciona informacin
completa sobre el parallax de movimiento, ya que el observador puede situarse en distintos puntos del
espacio obteniendo una perspectiva distinta de la escena. Asimismo, la acomodacin y la
convergencia de los ojos coinciden con los puntos del espacio en los que se representa la imagen, por
lo que no aparece ningn tipo de fatiga ocular. El par de imgenes estereoscpicas, responsables
principales de la percepcin espacial, se forman en la retina de una manera natural como consecuencia
del distinto punto de vista de la escena que se obtiene con cada ojo.

La alternativa ms usada en la mayora de sistemas que se estn desarrollando actualmente para la
generacin de los voxels dentro del recinto se representa esquemticamente en la figura 1.42. El
sistema se basa en utilizar una superficie bidimensional que se desplaza mediante rpidos
movimientos peridicos barriendo todo el volumen en el que se representar la imagen. La superficie
ms comn suele ser una hlice que gira a gran velocidad sobre su eje segn el esquema mostrado en
la figura 1.42. La forma de la superficie y su naturaleza reflectante o traslcida es muy importante, por
cuanto determina las regiones que permanecern ocultas al espectador por ser tapadas por la propia
superficie. En general suele considerarse que la forma de doble hlice es adecuada para minimizar
estas regiones desde cualquier posicin del espectador.

Fig. 1.41 Displays volumtricos

Fig. 1.42 Esquema de un display volumtrico de barrido pasivo

Los voxels se generan dirigiendo los pulsos de luz del lser hacia los distintos puntos del volumen
cuando la hlice, que acta como pantalla, pasa por ellos. Evidentemente, para una correcta
representacin de los colores es necesario usar tres rayos lser con las longitudes de onda
correspondientes a los tres colores primarios. La velocidad de la hlice debe ser suficientemente
elevada para que el espectador no perciba la presencia de esta superficie. Los haces se controlan
mediante moduladores acustico-pticos, que presentan una rpida respuesta para modificar la
direccin del haz utilizando un barrido aleatorio, es decir, la secuencia de puntos a los que se dirige el
haz depende de la imagen a representar y slo se barren aquellas posiciones del espacio que aportan
informacin sobre la escena. Esto es as debido a que el nmero de voxels que deben generarse
depende de la imagen que se desee producir, representando generalmente una pequea porcin del
volumen total del display. La sincronizacin del sistema de exploracin de los haces lser y la
posicin de la hlice se suele realizar mediante la lectura ptica de la posicin de esta ltima.

Una alternativa a este procedimiento es utilizar una superficie en la que estn integrados los
elementos de luz, normalmente diodos electroluminiscentes (LEDs), y cuya activacin se controla
externamente. Este procedimiento se conoce con el nombre de barrido activo y su principal ventaja es
que mientras que en el sistema pasivo los voxels deben generarse de manera secuencial, en este caso
pueden generarse simultneamente todos los puntos de luz correspondientes a una determinada
posicin de la hlice. Actualmente se estn considerando otras variantes que no requieren emplear una
superficie de barrido y cuyo principio de funcionamiento est basado en excitar un gas fluorescente
controlando el punto de excitacin mediante la interseccin de dos haces lser infrarrojos.

Actualmente existen diversos prototipos operativos de estos sistemas entre los que destaca un display
de barrido pasivo desarrollado conjuntamente por el Naval Command, Control & Ocean Surveillance
Center, RGB Technology Inc. y NEOS Technologies y que se utiliza fundamentalmente para
aplicaciones de ayuda a la navegacin. Este sistema utiliza una superficie helicoidal en la que se
pueden representar hasta 800000 voxels por segundo dando un total de 40000 voxels por imagen si se
utiliza una frecuencia de refresco de 20 Hz. Este sistema se est probando en aplicaciones de control
de trfico areo combinando la informacin de posicin proporcionada por los sistemas de navegacin
convencional con la generacin de grficos por ordenador de los modelos de los vehculos, pudiendo
llegar a representarse simultneamente hasta 80 aviones. La generacin de las imgenes por ordenador
se realiza teniendo en cuenta el tipo de avin, su distancia, acimut y altura e incorporando opciones de
zoom de determinadas regiones del espacio areo. Parece ser que este tipo de representacin
tridimensional simplifica notablemente la tarea del controlador y est siendo bien aceptado.

Otras posibles aplicaciones en las que parece que estos sistemas pueden tener un considerable xito
son la navegacin submarina y la representacin de imgenes mdicas. En ambos casos se trata de
utilizar el sistema para representar informacin de carcter tridimensional que normalmente se
representa en displays planos. En el caso de la navegacin submarina, el sistema utiliza la informacin
proporcionada por el sonar para representar los distintos objetos detectados, su movimiento y posicin
relativa, la presencia de minas o torpedos, el suelo marino, etc. En las aplicaciones mdicas se
pretende que el sistema combine la informacin bidimensional obtenida por distintos sistemas de
escner del cuerpo humano para obtener imgenes tridimensionales de los rganos y partes de inters.

Si bien en las aplicaciones que hemos citado parece ser que estos sistemas pueden llegar a implantarse
con xito, es improbable que su uso se extienda a la televisin u otros sistemas parecidos, debido en
primer lugar a un problema de carcter tecnolgico, pero sobre todo porque parece que ser un
formato en el que ser difcil de aceptar la presencia de actores humanos. Desde el punto de vista
tecnolgico el problema principal radica en que parece difcil que a corto o medio plazo puedan
aparecer sistemas de exploracin tridimensional que aporten la informacin volumtrica necesaria
para codificar una escena real. Todos los sistemas desarrollados hasta ahora se basan en la sntesis por
ordenador de imgenes artificiales y en el mejor de los casos combinan fragmentos reales con
imgenes sintticas usando complejos algoritmos que requieren un tiempo de ejecucin elevado.

Sin embargo, el problema principal es que la reproduccin de una escena en este tipo de displays
acenta considerablemente el denominado efecto muequito (puppet effect). Este efecto se presenta en
general en cualquier sistema de representacin tridimensional y consiste en que, para dos
proyecciones de un objeto con dimensiones parecidas, la sensacin de volumen y tamao que inducen
en el espectador es mucho mayor en las imgenes que se presentan con sistemas 2D que en las de 3D.
No obstante, este efecto no es an bien conocido y, probablemente, para un anlisis riguroso del
mismo ser necesario que previamente se popularicen y perfeccionen los sistemas tridimensionales.

El problema se acenta notablemente en los displays volumtricos, ya que el recinto utilizado para la
representacin suele ser pequeo y se enfatiza la percepcin de que los actores parecen ser pequeos
muecos en un teatro de marionetas. Adems, en funcin del punto de vista, los objetos pueden tener
un cierto grado de transparencia, dejando patente la naturaleza lumnica mediante la que han sido
generados y provocando una cierta sensacin de espectros en el espectador.

1.5.6 Hologramas y displays hologrficos
El holograma de un objeto o escena es un registro plano, realizado sobre negativos fotogrficos de alta
resolucin, de la interferencia producida entre dos haces de luz coherentes cuando la luz de uno de los
haces se refleja en este objeto. Iluminando adecuadamente el registro fotogrfico de la interferencia,
puede reproducirse una imagen del objeto que induce en el espectador una sensacin de espacio
tridimensional.

El principio ptico del holograma fue propuesto por el cientfico hngaro D. Gabor en 1948 como un
mtodo para mejorar la resolucin del microscopio electrnico. Sin embargo, esta tcnica slo cobr
inters prctico a partir del desarrollo del lser en los inicios de los aos 60. E.W. Leith, J. Upanieks y
C.W. Stroke fueron los primeros en utilizar el holograma para el registro de imgenes en tres
dimensiones utilizando fuentes de luz lser. D. Gabor recibi el premio Nobel de fsica por sus
aportaciones tericas a las tcnicas hologrficas en 1971.

El procedimiento para el registro de un holograma se realiza siguiendo un esquema como el
representado en la figura 1.43. La luz emitida por un lser se descompone en dos haces mediante el
uso de un espejo semitransparente. Uno de los haces, denominado haz de referencia, ilumina
directamente el negativo fotogrfico. El haz objeto ilumina el objeto o escena de inters y la luz
reflejada y difractada por ste se dirige al negativo, donde se superpone con la luz del primer lser. La
superposicin entre los dos haces sobre el negativo fotogrfico produce la impresin de una trama de
franjas de interferencia cuyo aspecto visual no tiene ningn parecido con la imagen original. Sin
embargo, sobre el negativo ha quedado registrada informacin de amplitud y fase sobre la escena,
debido a que las franjas de interferencia indican cmo se han superpuesto en cada punto las luces
procedentes de ambos haces. As, cuando los dos haces estn en fase se registra un mximo de
amplitud en el negativo, mientras que cuando estn en contrafase se registra un mnimo. Los niveles
de amplitud tambin dependen de la porcin de energa que haya sido reflejada o difractada por el
objeto obteniendo un patrn interferente que aporta informacin sobre el volumen de la escena y que
puede ser recuperada mediante un proceso, que se representa en la figura 1.44, parecido al usado para
la obtencin del holograma. La idea general para la reconstruccin de la imagen tridimensional
consiste en iluminar el registro hologrfico mediante un haz lser de las mismas caractersticas que el
haz de referencia. Un observador que mire a travs del holograma ver, en su interior aparente, una
imagen tridimensional del objeto original. Esta imagen es real (se forma tambin una virtual que no
consideraremos), lo que significa que puede ser enfocada por sistemas pticos para ser fotografiada
con una cmara convencional o inspeccionada por un microscopio. De hecho, un mtodo habitual para
examinar cavidades dentro de un objeto que no permiten la insercin de sistemas pticos consiste en
realizar primero un holograma del mismo para posteriormente inspeccionar las zonas de inters, a la
profundidad deseada, utilizando la imagen del objeto. La imagen real aparece con una curvatura
invertida (pseudoscpica), aunque este problema puede solventarse realizando un segundo holograma
que se registra utilizando como objeto la imagen del primer holograma.

Fig. 1.43 Diagrama simplificado del registro de un holograma

Al tratarse de una representacin tridimensional del objeto, el punto de vista de la imagen vara
dependiendo de la posicin del observador, proporcionando informacin de parallax de movimiento.
Este cambio del punto de vista con la posicin del espectador proporciona tambin una imagen
distinta para cada ojo, por lo que la percepcin del espacio es muy real. Adems, la imagen se forma
en un espacio real por lo que la acomodacin y convergencia de los ojos coinciden y no produce
fatiga. No obstante, el parallax de movimiento slo est codificado en una determinada regin que se
depende de los lmites del clich fotogrfico y de la zona de imagen en que se ha podido registrar
correctamente la refraccin.

El registro hologrfico representa un ejemplo muy interesante, dentro de nuestra lnea argumental,
sobre el muestreo de la escena con el objeto de reducir sus variables independientes sin que se
produzca una prdida significativa de informacin. Hemos visto que en un holograma se puede
Objeto
Holograma
Cliche
Fotogrfico
Espejo
Espejo
Lente
divergente
Lente
divergente
Lser
Espejo
Semitransparente
Objeto
Holograma
Cliche
Fotogrfico
Espejo
Espejo
Lente
divergente
Lente
divergente
Lser
Espejo
Semitransparente
registrar gran parte de la informacin volumtrica de la escena en una nica proyeccin plana.
Adems, la codificacin del color es inmediata y puede realizarse en un nico holograma. En efecto,
para registrar la imagen en color basta con exponer el clich sucesivamente a tres lseres
monocromticos cuyas frecuencias correspondan con los tres colores primarios. Cuando el holograma
se expone simultneamente a los tres haces de referencia, la superposicin de las tres imgenes
produce la sensacin de color. La particularidad ms interesante de este proceso es que el holograma
puede registrarse en un clich de blanco y negro pudiendo recuperar la informacin de color completa,
lo que sin duda supone una codificacin muy eficaz de la imagen.

Fig. 1.44 Esquema simplificado para la reproduccin de hologramas

Aunque tanto el holograma como la fotografa convencional se registran sobre un material
fotosensible del mismo tipo, existen importantes diferencias entre ellos. La diferencia fundamental es
que la luz usada en fotografa convencional no es monocromtica y suele tener contenido espectral en
casi todo el margen visible. Por ello, sobre el negativo se obtiene la superposicin de un gran nmero
de componentes incoherentes, con lo que se pierde cualquier informacin relativa a la fase o los
retardos experimentados por las ondas al reflejarse en distintos puntos del objeto. El negativo
fotogrfico convencional slo contiene informacin de amplitud sobre la luz de la escena, mientras
que en un holograma, la interferencia producida entre los dos haces monocromticos permite registrar
tanto la informacin de amplitud como la de fase, siendo sta ltima fundamental para recuperar una
imagen tridimensional de los objetos.

Otra diferencia importante es que para realizar un registro hologrfico no se requiere el uso de lentes
que formen una imagen sobre la superficie del negativo, ya que basta con registrar las franjas de
interferencias en una regin cualquiera del espacio. En la reconstruccin de la imagen, la posicin del
holograma respecto a la escena durante su registro, determinar el punto de vista general de la escena.
En fotografa siempre es necesario utilizar un grupo ptico que enfoque la imagen sobre el negativo,
pues en caso contrario la imagen aparecer borrosa y poco definida.

Finalmente, el registro de las franjas de interferencia requiere que el clich tenga una resolucin
considerablemente superior a la requerida en fotografa convencional, ya que las franjas de
interferencias suelen estar muy prximas en el espacio. Esto exige usar material fotosensible de baja
Imagen
Objeto
Holograma
Espejo
Lente
divergente
Lser
Espejo
Observador
Imagen
Objeto
Holograma
Espejo
Lente
divergente
Lser
Espejo
Observador
sensibilidad ya que la resolucin de la pelcula fotogrfica aumenta al disminuir su sensibilidad o el
grano, lo que significa, debido a que la limitacin de potencia del lser, que los tiempos de exposicin
suelen ser elevados. En el caso en que los objetos a los que deseamos realizar una holografa tengan
movimiento, es necesario modificar ligeramente el sistema de registro utilizando un lser pulsado en
sustitucin de uno de onda continua. El lser pulsado puede usar una potencia muy superior al de onda
continua, permitiendo realizar instantneas hologrficas incluso de objetos que se muevan a gran
velocidad.

La extensin de las tcnicas hologrficas a los sistemas de vdeo no es trivial, aunque se supone que si
logran resolverse los retos tecnolgicos, ser probablemente el sistema utilizado en la futura televisin
tridimensional. Los problemas para el registro de escenas reales son evidentes, pues no slo se
requiere reproducir unas condiciones de iluminacin complejas, sino que tambin es necesario
disponer de dispositivos electrnicos capaces de sensar las franjas de interferencia con una resolucin
que est muy por encima de la tecnologa actual. Se estima que el nmero de muestras que deben
tomarse de un holograma para poder reproducir correctamente las imgenes registradas, con toda la
informacin de parallax existente, es de unas 10
11
muestras, lo que supondra utilizar sensores con
una resolucin inimaginable en la actualidad y, en cualquier caso, exigira emplear un elevadsimo
ancho de banda para la transmisin de la seal.

A pesar de todas estas dificultades tecnolgicas, se estn desarrollando diversos prototipos de vdeo
hologrfico con resultados prometedores. Uno de los sistemas ms avanzados es el Mark-II, realizado
en el Massachussets Institute of Technology (M.I.T.) por un equipo de investigacin dirigido por el
profesor S. Benton. Este sistema se basa en el clculo mediante ordenador de las franjas de
interferencia que produciran imgenes sintticas. Al sintetizar las franjas de interferencia mediante
modelos matemticos, puede conseguirse una importante reduccin en el nmero de muestras de los
hologramas sintticos restringiendo el parallax de movimiento a las direcciones que tienen ms
inters. En el Mark-II nicamente se codifica la informacin de parallax horizontal ya que se supone
que ste ser el movimiento ms realizado por el espectador. Con ello se consigue reducir el nmero
de muestras de las franjas de interferencia en un factor de aproximadamente 100.

Fig. 1.45 Esquema general del display hologrfico Mark II

En la figura 1.45 se muestra un esquema de este display en el que su configuracin ptica y
electrnica est adaptada para poder aplicar un mximo de paralelismo en la generacin de las
imgenes. La idea general del sistema es la de construir las imgenes mediante una exploracin
conjunta de varios haces lser cuya amplitud se modula de acuerdo con las franjas de interferencias
del holograma previamente calculado. La exploracin se realiza utilizando un conjunto de
moduladores acustico-pticos que barren diferentes franjas horizontales de la imagen. El sistema
puede presentar imgenes de 150 75 150 mm con un ngulo de visin horizontal (regin con
parallax horizontal de movimiento) de 36 y es capaz de presentar una imagen por segundo.

1.6 Limitacin de la imagen: tamao del sensor y relacin de aspecto
Hemos visto que el grupo ptico se encarga de proyectar la escena sobre el plano de imagen y que
sobre ste debemos situar un elemento sensor que nos proporcione informacin sobre las
caractersticas de la luz en una regin del plano de imagen. La informacin que nos proporciona el
sensor, en aplicaciones de TV, suele ser la cantidad de luz incidente en cada punto dentro de la zona
en la que est situado. Si la imagen se ha pasado a travs de un filtro dicroico, pueden utilizarse, como
ya se ha indicado en la figura 1.32, tres sensores para proporcionar informacin completa sobre los
niveles de luz de cada componente de color en la imagen. Analizaremos los principios de los
elementos sensores ms utilizados en sistemas de televisin en el captulo 5. En este apartado,
nicamente nos interesa evaluar cmo afecta a las caractersticas globales de la imagen que la regin
en la que estn definidos sea finita, delimitando, por tanto, una zona til en la imagen.

Desde un punto de vista analtico, podemos escribir esta restriccin como:

) ' , ' ( ) , ' , ' ( ) , ' , ' (
) ' , ' ( ) , ' , ' ( ) , ' , ' (
) ' , ' ( ) , ' , ' ( ) , ' , ' (
y x w t y x t y x
y x w t y x t y x
y x w t y x t y x
R FB
R FG
R FR
=
=
=
(1.53)

donde w(x,y) es una funcin que toma el valor unidad dentro de la regin F en la que est situado el
sensor y valor nulo fuera. En lo sucesivo designaremos a esta funcin como la ventana de
observacin.

=
valores otros
F y x si
y x w
0
) ' , ' ( 1
) ' , ' (
(1.54)

La regin F es, tanto en el cine como en la televisin, una zona con forma rectangular en la que la
dimensin de la componente horizontal es superior a la vertical. Podramos encontrar algunas
excepciones a esta regla general en algunas imgenes fijas (fotografas) donde el autor desea enfatizar
el contenido de la escena en el eje vertical o en sistemas de imgenes con propsitos cientficos en los
que, en ocasiones, las imgenes tienen una forma cuadrada. Otra excepcin son algunos sistemas de
cine envolvente en que, como veremos, el elemento de imagen bsico sigue siendo rectangular o, un
sistema del que no nos ocuparemos, la transmisin de grficos y documentos mediante imgenes
como es el caso del facsmil.
La razn por la que la ventana de observacin es ms ancha que alta se debe bsicamente a que el
campo de visin del ojo humano es ms grande en el eje horizontal que en el vertical. De hecho, la
retina no es perfectamente circular, sino que tiene una ligera forma de ovoide que probablemente se
debe a una adaptacin al medio, en la que la mayora de movimientos se producen en sentido
horizontal. Si bien el campo de visin humano tiene forma elptica, todos los sistemas de cine y
televisin han elegido imgenes rectangulares, por cuanto son mucho ms fciles de tratar, tanto a lo
que se refiere a su almacenamiento en una tira de pelcula como a su exploracin en sistemas de
televisin. Adems, el campo de visin humano tiene una forma imprecisa en la que se reduce
progresivamente su resolucin espacial a medida que nos acercamos a la periferia. En algunos
sistemas de cine en los que se pretende reproducir las escenas con un elevado realismo, se utilizan
pantallas de grandes dimensiones que pretenden cubrir todo el campo visual del espectador (de hecho
algunos sistemas sitan al espectador tan cerca de la pantalla que sta cubre una zona superior al
campo visual, por lo que el espectador debe incluso girar su cabeza para centrar la atencin en
determinadas partes de la imagen). No obstante, an en estos casos, las pantallas tienen forma
rectangular y la definicin de la imagen es uniforme en toda su extensin.

El hecho de limitar la imagen a una ventana de observacin finita es otra caracterstica de los sistemas
de televisin en la que se produce una reduccin notable de la cantidad de informacin a transmitir. El
tamao y forma de esta ventana suelen ser parmetros que condicionan en ltima instancia la calidad y
el realismo de las escenas transmitidas.

El tamao de la ventana no constituye una limitacin seria, en contra de lo que en un principio pueda
parecer, sobre la parte de la escena que se desea transmitir. En efecto, mediante el uso de lentes
adecuadas podemos hacer que la parte de inters de la escena quede perfectamente encuadrada en el
rea til del sensor de imagen independientemente del tamao que ste tenga. Para ello, dependiendo
de las dimensiones fsicas del sensor, necesitaremos utilizar grupos pticos con distintas distancias
focales para que los ngulos de visin de las imgenes se mantengan dentro de los lmites
establecidos. Analizaremos con detalle estos aspectos en el captulo 5, pero de momento adelantemos
que una ptica con una distancia focal de 55 mm en fotografa (pelcula de 35 mm de anchura) puede
producir el mismo tipo de imgenes (es decir, el mismo campo de visin) que una ptica de 24 mm
para cmaras de vdeo porttiles, en las que se utiliza un sensor del tipo CCD cuyo tamao es del
orden de pulgada. Esta es una justificacin de por qu los grupos pticos de las cmaras de cine son
mucho ms voluminosos que los de las cmaras de vdeo porttiles y de por qu en las cmaras de
vdeo domsticas una reduccin del tamao del sensor CCD supone tambin una reduccin del
volumen de la ptica. Sin embargo, no adelantemos excesivos resultados que podrn ser
adecuadamente justificados ms adelante y quedmonos con la idea de que el tamao del sensor no
condiciona en absoluto el encuadre de la escena, ya que est slo depende de la ptica.

Uno de los factores que s estn condicionados por las dimensiones fsicas de la ventana de
observacin es la resolucin de la imagen que, en general, y considerando una misma tecnologa,
mejora con el tamao del sensor. Definiremos ms adelante la resolucin de una imagen de manera
cuantitativa, pero de momento indiquemos que la resolucin est relacionada con el grado de detalle o
nitidez que puede llegar a representarse en una imagen. Decimos que puede llegar a representarse, ya
que es posible que el director decida presentar partes de las imgenes intencionadamente desenfocadas
o poco ntidas para generar determinados ambientes, aun cuando se est utilizando un sistema con una
resolucin excelente. La nitidez y la resolucin no son, por tanto, conceptos idnticos, aunque estn
relacionados de manera que no es posible obtener imgenes extremadamente ntidas en sistemas con
baja resolucin.

En cine y fotografa la resolucin depende de la emulsin fotosensible de la pelcula. En general, la
nitidez est limitada por el tamao de las partculas fotosensibles que se conocen con el nombre de
grano de la pelcula. Una pelcula con mucho grano indica que tiene una resolucin pobre. El grano
est relacionado con la sensibilidad de la pelcula, de modo que cuanto ms sensible a la luz es la
emulsin fotogrfica ms grano presenta. Para una sensibilidad fija, la calidad de la imagen
proyectada ser tanto mejor cuanto mayor sea el tamao del fotograma. As, supongamos un mismo
fotograma captado por una cmara de 16 mm y por una de 35 mm (dimensiones fsicas de la anchura
del fotograma en la pelcula), con pelculas de la misma sensibilidad y grano, que se proyectan en una
pantalla con las mismas dimensiones. Evidentemente, para que ambos fotogramas tengan el mismo
tamao en la pantalla deberemos utilizar pticas distintas, que amplen ms el fotograma de 16 mm
que el de 35 mm, por lo que tambin se ampliar ms el grano de la primera fotografa, obteniendo
una imagen final de menor resolucin. As pues, un formato de cine de 70 mm proporciona una
calidad de imagen muy superior al formato estndar de 35 mm.

En cmaras de televisin ocurre un fenmeno parecido, aunque en este caso, la rpida evolucin
experimentada en la tecnologa de los sensores CCD en los ltimos aos puede enmascarar
parcialmente este principio para el profano. Si comparamos dos chips CCD que utilizan la misma
tecnologa, es decir, que integran el mismo nmero de elementos de imagen por unidad de superficie,
es evidente que el dispositivo que disponga de mayor rea tiene ms elementos sensores, por lo que
ofrece una mejor resolucin. Ocurre, sin embargo, que podemos encontrar cmaras modernas que,
utilizando un dispositivo CCD de menor rea, ofrece una calidad de imagen superior a otras cmaras
con un rea sensora mayor, debido a que la primera utiliza una tecnologa ms avanzada en la que ha
sido posible integrar muchos ms elementos de imagen que en la segunda. No obstante, el principio
sigue siendo que cuanto mayor sea el sensor, si la tecnologa es comparable, mejor es la resolucin de
la imagen, y esto se aplica a cualquier tipo de tubos de imagen sean o no de tecnologa CCD. Esto
justifica nuevamente por qu las cmaras profesionales son mucho ms voluminosas que las
domsticas y las cmaras de cine mucho ms que las de vdeo. En efecto, una cmara de vdeo
profesional suele utilizar, para mejorar la resolucin de las imgenes, sensores de mayor tamao que
las cmaras domsticas. Adems, la distancia focal de la ptica necesaria (y en consecuencia su
volumen) tambin aumenta con el tamao del sensor, por lo que las cmaras profesionales tienen un
mayor volumen que las domsticas. En el caso del cine, la tecnologa para el registro de las imgenes
es distinta y requiere un mayor tamao de la ventana de observacin, por lo que el volumen asociado a
la ptica es an ms grande.

Otro aspecto ligado a la ventana de observacin es la relacin de aspecto de la imagen que se define
como el cociente entre la anchura y la altura de la ventana. En la figura 1.46 se representa una ventana
de observacin genrica en el que la relacin de aspecto es W:H, o bien, W/H:1.

Cuando se definieron los primeros sistemas de televisin comercial en blanco y negro, se eligi una
relacin de aspecto que coincida con la utilizada en el cine. De hecho, inicialmente se pens que
buena parte de la programacin de televisin estara formada por pelculas previamente realizadas
para el cine, por lo que resultaba conveniente que ambas relaciones de aspecto coincidieran. En la
poca en que se defini la televisin, la relacin de aspecto utilizada en el cine era, invariablemente,
de 4:3, es decir, la altura de la pantalla es partes de su anchura. Este formato es utilizado por todos
los sistemas de TV en color analgicos definidos durante los aos 50 y 60: NTSC, PAL y SECAM y
slo recientemente se han propuesto algunos sistemas con una relacin de aspecto distinta.

Fig. 1.46 Tamao de la ventana de observacin y relacin de aspecto

Uno de los parmetros directamente relacionados con la relacin de aspecto es la medida de la
diagonal que se utiliza para indicar el tamao de los monitores. As, cuando hablamos de un monitor
de 29 nos referimos a la longitud de la diagonal de la pantalla. Dado que la suma de los cuadrados de
las proporciones entre la altura y la anchura da un cuadrado perfecto, es fcil relacionar la altura, la
anchura y la diagonal del monitor. En efecto, la anchura y la altura pueden determinarse como 4/5 y
3/5 partes de la diagonal respectivamente, ya que esta ltima mantiene un factor de proporcionalidad
igual a 5:

k k k D 5 ) 3 ( ) 4 (
2 2
= + = (1.55)

De este modo, en un televisor de 29, la diagonal mide 29 2,54 cm/=73,6 cm, la altura es de 73,6
cm 3/5=44 cm y la anchura mide 73,6 4/5=59 cm.

La eleccin de una relacin de aspecto para la televisin idntica a la que se utilizaba en el cine fue,
sin duda, una decisin muy acertada por cuanto, an hoy en da, buena parte de la programacin
televisiva est constituida por cintas producidas previamente para el cine. Lo que no se poda prever
en el momento de definir la televisin es que las relaciones de aspecto utilizadas en el cine
experimentaran un importante cambio con la introduccin de los formatos panormicos. De hecho,
fue el propio xito de la televisin lo que origin que la industria cinematogrfica introdujera distintos
avances tecnolgicos con objeto de mejorar tanto la calidad del sonido como de la imagen para as
poder competir directamente con el medio televisivo ofreciendo al espectador un entorno audiovisual
de mucha mayor calidad que el que se ofreca en la televisin.
x'
y'
w(x',y')
0
x0
0
y0
Relacin de aspecto= W:H
H
W
D
A principios de los aos 50 se empiezan a introducir formatos cinematogrficos con relaciones de
aspecto ms anchas que la 4:3 (1,33:1). En Estados Unidos destaca el formato de la Academia, con
una relacin de aspecto de 1,85:1; mientras que en Europa se utilizan principalmente dos formatos con
relaciones de aspecto 1,67:1 y 1,75:1, de los cuales el primero tuvo un uso ms extendido. Todos estos
formatos mantenan el mismo tipo de pelcula que el formato 1,33:1, limitando la apertura vertical
durante el registro de la pelcula y utilizando lentes de menor distancia focal en la proyeccin para que
la anchura de la proyeccin fuera mayor. La verdad es que todos estos formatos se adaptan mejor al
campo de visin humano y permiten que ste se integre mucho ms en la escena, aumentando su
realismo.

En 1953 aparece el Cinemascope, cuya principal novedad tecnolgica es que introduce un sistema con
lentes anamrficas, que esencialmente consisten en un sistema ptico que durante el registro de la
pelcula comprime las imgenes en la direccin horizontal. Durante la proyeccin de la pelcula deben
usarse unas lentes inversas, que expanden la imagen en el sentido horizontal, recuperando el aspecto
original de los objetos. Este procedimiento permite registrar en una pelcula convencional un formato
de proyeccin panormico, aprovechando todo el negativo de la pelcula. La relacin de aspecto
obtenida con este sistema es de 2,35:1. Evidentemente, aunque no es apreciable por el espectador, la
resolucin en sentido vertical es mayor que en sentido horizontal, ya que este ltimo ha sido ms
ampliado por la lente que el primero. Si una pelcula registrada en cinemascope se proyectara
utilizando lentes convencionales, las imgenes apareceran alargadas y el rea de proyeccin tendra
una relacin de aspecto convencional. De hecho, en muchas de las primeras pelculas rodadas en este
formato deben de ponerse lentes convencionales durante la proyeccin de los ttulos iniciales y los
crditos finales. La razn es que en la edicin de estas pelculas se utilizaron los equipos de titulacin
convencionales, ya que muchos estudios no disponan de tituladoras especficas para este formato. Por
tanto, si se desea que los ttulos puedan leerse correctamente, es necesario utilizar una ptica
convencional al principio y al final de la pelcula. En las producciones en las que se superponen los
ttulos con imgenes filmadas, estas ltimas aparecen alargadas durante el inicio y final de la cinta,
constituyendo una de las estampas ms caractersticas de las pelculas en este formato.

Un ao antes de la aparicin del Cinemascope, Fred Waller, fotgrafo neoyorquino, propuso un
formato revolucionario que utilizaba tres proyectores simultneamente y que denomin Cinerama. La
pelcula deba grabarse con un complejo artilugio que agrupaba las tres cmaras con las que,
adecuadamente sincronizadas, se obtenan las tres partes de la escena. Los proyectores estaban
tambin sincronizados y cada uno proporcionaba 1/3 de la imagen en una pantalla muy ancha y
curvada. La primera pelcula que se produjo en este formato fue un documental de demostracin
titulado This is Cinerama. El sistema era extremadamente complejo y aunque se hizo bastante
popular, tena un coste prohibitivo. Tanto las cmaras como los proyectores deban estar
perfectamente calibrados durante la grabacin y la reproduccin, y frecuentemente aparecan
problemas de solapamiento entre las tres imgenes y de desadaptacin de brillo y contraste entre las
tres partes de la pelcula. El sistema se utiliz fundamentalmente para documentales y la primera
pelcula argumental registrada en este formato, How the West Was Won, no apareci hasta 1962. En
1963 se abandon este sistema que fue sustituido por el Cinerama moderno que utilizaba un sistema
de lentes anamrficas parecidas al Cinemascope, registrando la informacin en una pelcula de 70 mm
de anchura y utilizando una relacin de aspecto de 2,75:1. El formato estndar de 70 mm haba sido
introducido previamente en 1955 por Todd-AO Productions con las pelculas Oklahoma! (1955) y
Around the World in 80 Days (1956). La relacin de aspecto utilizada en 70 mm es de 2,20:1.

Tambin se han realizado algunos sistemas en los que la escena se proyecta sobre pantallas circulares
que envuelven completamente al espectador, con lo que se pretenden reproducir sensaciones de
elevado realismo. El primer sistema de cine envolvente se instal en 1955 en el parque de atracciones
de Disneyland y combinaba once pelculas de 16 mm en un sistema de proyeccin sincronizada
parecido al Cinerama original. Posteriormente el sistema se modific utilizando nueve proyectores
con pelculas de 35 mm. A pesar de que el espectador suele demostrar un elevado grado de
satisfaccin sobre la calidad y el realismo de estos sistemas, su uso se ha limitado la produccin de
documentales cuyas salas de exhibicin se encuentran en parques temticos, exposiciones
internacionales o ferias de muestras. Probablemente, no se han explotado comercialmente ya que la
propia libertad que otorgan al espectador para centrar su atencin en distintas partes de la escena no
facilita la exposicin de una trama argumental convencional.

Algunos sistemas, como el IMAX, con superficies de pantalla extremadamente grandes (IMAX-Port
Vell, 600 m
2
), utilizan relaciones de aspecto donde la altura de la pantalla es comparable o superior a
la anchura. Esto es debido en parte a que las grandes dimensiones de la pelcula requieren que sea
pasada por el proyector en sentido horizontal y en parte a que se pretende que la zona de proyeccin
sea superior al campo de visin del espectador, para crear as un efecto de mayor realismo. La
sensacin final es que el espectador debe mover la cabeza para centrar su atencin en diferentes partes
de la pantalla.

En la figura 1.47 se comparan las relaciones de aspecto ms habituales utilizadas en el cine y en la
televisin. Las grficas se han obtenido manteniendo constante el rea total de proyeccin para
comparar nicamente los aspectos de cada sistema.

Fig. 1.47 Relaciones de aspecto ms habituales utilizadas en cine y en televisin
4:3, TV
1,5:1; 35 mm
1,67:1; Europa
16:9; HDTV
1,85:1; Academia
2,20:1, 70 mm
2,35:1; Cinemascope
2,75:1; Cinerama
Ante la gran diversidad de relaciones de aspecto empleadas en los distintos formatos de cine cabra
preguntarse cul es, desde un punto de vista subjetivo, la relacin de aspecto ideal. La NHK,
organismo de radiodifusin de Japn, durante el desarrollo del MUSE, un sistema de televisin de alta
definicin analgico que hoy es operativo en Japn, elabor una serie de experimentos subjetivos para
determinar cul era la relacin de aspecto ideal. La BBC y el SMPTE han desarrollado experimentos
similares en los que en general se observa que las preferencias del espectador dependen del tamao de
la imagen. Se observa que cuando el rea de proyeccin aumenta el espectador tiende a exigir un
formato ms panormico, lo que justifica el uso de formatos ms panormicos en cine que en
televisin. No obstante, si sigue aumentndose el rea de proyeccin, se llega a un punto en que los
formatos panormicos saturan y son poco agradables, lo que justifica, aunque slo en parte, el uso de
relaciones de aspecto casi cuadradas en sistemas de grandes dimensiones como el IMAX.

Los resultados obtenidos por la NHK en el margen de superficies de proyeccin propias de un sistema
de televisin se representan en la figura 1.48, observndose que la relacin de aspecto que puede
considerarse como ideal es de 15:9 (1,67:1), que coincide con el formato cinematogrfico definido en
Europa en la dcada de los 50. Obsrvese que los test subjetivos rechazan relaciones de aspecto muy
panormicas para las dimensiones de una pantalla de televisin. No obstante, la relacin de aspecto
que finalmente eligi la NHK, y que actualmente es aceptada por todos los organismos internacionales
como idnea en sistemas con definicin mejorada o alta definicin, es de 16:9. Esta relacin de
aspecto es parecida a la 15:9 y ofrece importantes ventajas de compatibilidad con distintos formatos
cinematogrficos y con la relacin 4:3 utilizada en TV convencional. En la figura 1.47 podemos
comprobar que la relacin 16:9 es muy parecida al formato de la Academia y al Europeo, por lo que
este tipo de pelculas podrn adaptarse prcticamente sin utilizar zonas muertas en la pantalla a la
transmisin por televisin. Adems estos formatos cinematogrficos son muy utilizados. Los formatos
panormicos, sobre todo el Cinerama y el Cinemascope son an excesivamente anchos y estas
pelculas debern transmitirse con bandas negras en la parte superior o inferior de la pantalla (o bien
cortando los laterales). No obstante, actualmente el Cinerama y el Cinemascope prcticamente ya no
se utilizan por lo que, para pelculas nuevas el nico formato que seguir manteniendo baja
compatibilidad con la televisin 16:9 ser el de 70 mm.

Fig. 1.48 Pruebas subjetivas sobre preferencias en las relaciones de aspecto
MUY
PREFERIBLE
PREFERIBLE
DISCRETO
ALGO
DESAGRADABLE
MUY
DESAGRADABLE
16000 cm2
8000 cm2
4000 cm2
2000 cm2
Otra de las razones por la que se eligi la relacin 16:9 en los sistemas de TV de alta definicin o
sistemas de definicin mejorada como el PALplus es que este formato mantiene una relacin
cuadrtica con el formato convencional 4:3, que puede utilizarse para presentar simultneamente
varias imgenes 4:3 en una pantalla 16:9. Esta posibilidad se ilustra en la figura 1.49 y fue uno de los
principales atractivos en la seleccin del formato. Un espectador puede visualizar simultneamente
hasta 4 programas en formato 4:3, sin que se produzca ninguna prdida de informacin. El canal
principal ocupa partes de la pantalla mientras en uno de los laterales se presentan tres canales
auxiliares que pueden monitorizarse para ver la programacin o esperar un evento concreto. No
obstante, a pesar de que ste fue uno de los criterios ms importantes en la seleccin del formato
panormico de 16:9, prcticamente ningn receptor panormico incorpora la opcin de visualizar
cuatro canales simultneamente, ya que ello supone un aumento significativo del coste del equipo al
requerir cuatro sintonizadores y demoduladores distintos. En la prctica, los receptores de gama alta
incorporan, a lo sumo, un doble sintonizador que permite visualizar un canal principal y slo uno
auxiliar.

Fig. 1.49 Visualizacin simultnea de varios programas 4:3 en un monitor panormico 16:9

La compatibilidad entre los dos formatos es uno de los principales problemas con los que se enfrentan
los proveedores de seal de televisin a medida que empieza a popularizarse el uso de una relacin de
aspecto de 16:9. Los programas producidos con esta relacin de aspecto debern presentarse al
telespectador que tenga un monitor 4:3 en uno de las opciones indicadas en la figura 1.50.
Probablemente, el formato que ms se utilizar es el de la izquierda, ya que se presenta toda la
informacin disponible sin ninguna deformacin, al precio de que el espectador ve dos barras negras
en la parte superior e inferior de la pantalla. Este aspecto de la pantalla de televisin viene siendo
aceptado en la transmisin de pelculas, pero parece difcil que sea aceptado por el televidente en la
transmisin de acontecimientos deportivos, documentales o noticiarios. El formato representado en el
centro de la figura 1.50 pierde parte de la informacin lateral presente en la imagen 16:9, aunque
16
9
3x3
12 = 4x3 4
3
3
3
16
9
3x3
12 = 4x3 4
3
3
3
como el espectador no conoce el contenido de esta informacin parece que ser aceptado de buen
grado para algunos programas especiales como las noticias. Sin embargo, es un formato polmico,
sobre todo en pelculas, pues se pierde parte de la informacin que el autor ha decidido incluir en la
escena. Tampoco parece un formato que sea fcilmente aceptado en la transmisin de acontecimientos
deportivos, a menos que durante la produccin de los programas en formato 16:9 se tenga en cuenta
que el espectador 4:3 no pierda una parte importante de la informacin. Finalmente, la posibilidad de
la derecha es con mucho la menos aceptada, pues si bien no hay prdida de informacin ni aparecen
bandas negras en la pantalla, existe una deformacin importante de los objetos.

Fig. 1.50 Opciones de presentacin de imgenes 16:9 en un monitor 4:3

Un problema anlogo aparece cuando se reproducen programas producidos en formato 4:3 en un
televisor panormico, problema que actualmente afecta prcticamente a la totalidad de los usuarios
que disponen de este tipo de televisores. En la figura 1.51 se ilustran las distintas posibilidades que a
menudo, dependiendo del tipo de televisor, puede controlar el propio televidente. La opcin de la
izquierda permite ver la totalidad de la imagen 4:3 sin ningn tipo de deformacin, aunque supone
dejar dos bandas negras en los laterales del monitor. Es una opcin que no suele gustar al usuario de
un monitor panormico porque es consciente de que se desaprovecha la inversin en el televisor
panormico, aunque es la nica opcin vlida en determinados programas cuya informacin til se
distribuye a lo largo de toda la pantalla. La opcin central, en la que se pierde parte de la informacin
superior e inferior de la imagen, suele ser bastante utilizada sobre todo en noticiarios. Tngase en
cuenta que la prdida de la informacin superior e inferior no suele ser tan importante como la prdida
lateral que experimenta el usuario 4:3 en la transmisin de programas 16:9 ya que en la mayora de
programas la accin transcurre en el plano horizontal. La opcin de la derecha consiste en deformar la
imagen para que aparezca completa en toda la pantalla y es aconsejable no utilizarla.
Formato 16:9
TV Alta Definicin
Formato convencional 4:3
Formato 16:9
TV Alta Definicin
Formato convencional 4:3
De hecho, el problema de compatibilidad entre los formatos 4:3 y 16:9 constituye un serio problema
para la implantacin progresiva de sistemas panormicos. El PALplus, un sistema evolucionado del
PAL que permita transmitir seales en formato 16:9 compatibles con el PAL convencional, tuvo
serios problemas para implantarse en un mercado en el que el usuario an no estaba totalmente
dispuesto a adquirir televisores en formato panormico, tanto por razones econmicas (son bastante
ms caros) como por razones de compatibilidad, pues la mayora de programas se siguen produciendo
en formato 4:3. El sistema PALplus fue prcticamente abandonado con la aparicin de los sistemas de
televisin digitales que tienen la posibilidad de transmitir en los dos formatos. Parece que la
implantacin progresiva de sistemas de video como el DVD permitir la introduccin definitiva de
este tipo de monitores, para obtener unas caractersticas de reproduccin similares a las del cine
(Home Theater Systems). Las producciones de televisin tambin irn progresivamente adoptando los
formatos panormicos. Probablemente, ambos formatos compartan el mercado hasta la desaparicin
definitiva de los formatos de transmisin analgicos como el PAL y el NTSC, que se prev que se
produzca a mediados de esta dcada.

Fig. 1.51 Opciones de presentacin de imgenes 4:3 en un monitor 16:9

1.7 Muestreo temporal de las imgenes
El ojo humano es capaz de percibir el movimiento de los objetos en una escena aun cuando la
informacin visual se presente de manera discreta como una rpida sucesin de fotogramas. Este
fenmeno es conocido desde la primera mitad del siglo XIX y se debe fundamentalmente a dos
manifestaciones de la percepcin visual conocidas como el fenmeno phi y la persistencia, cuyos
principios sern descritos en esta seccin.

En esencia, el muestreo temporal de la escena consiste en sustituir la funcin:
Formato
convencional
4:3
Formato panormico 16:9
Formato
convencional
4:3
Formato panormico 16:9
) , ' , ' ( t y x
FX
(1.56)

por la secuencia de fotogramas:

) , ' , ' ( ) ' , ' (
0
) (
kT y x y x
FX
k
FX
= (1.57)

donde el subndice FX indica que se trata de las imgenes planas definidas en el margen de la ventana
de observacin (F), de cualquiera de las componentes de color o luminancia (X). El superndice k
denota que se trata del k-simo fotograma obtenido al particularizar la imagen original en el instante
kT
0
. En sistemas de TV cada una de las imgenes se denomina cuadro (frame). Ntese tambin que
suponemos que las muestras temporales de la escena se toman a intervalos regulares de muestreo cuyo
valor T
0
deberemos especificar para que la percepcin de continuidad en el desarrollo de la escena sea
apropiada. La secuencia de imgenes se representa esquemticamente en la figura 1.52, donde se
observa que la informacin de la escena ha sido discretizada en el tiempo y que nicamente se
presentar al observador la secuencia de fotogramas obtenidos de la escena original.

Fig. 1.52 Esquema del muestreo temporal de las imgenes

Es evidente que el muestreo de la escena definido en la ecuacin 1.57 representa un caso ideal en el
que es posible obtener un fotograma exacto de la escena en el instante kT
0
. En la prctica, todos los
dispositivos sensores requieren que la imagen est presente durante un tiempo determinado para que
los valores de iluminacin puedan ser adquiridos correctamente, por lo que los fotogramas se
correspondern con los valores promedios de la escena durante el intervalo de adquisicin.
Analizaremos con detalle estos efectos en el captulo dedicado a cmaras.
x
y
t
0
T
2T
3T
4T
1.7.1 Un poco de historia: del Phenakistoscope al Cinmatographe
Los primeros artilugios que utilizaron el principio de la rpida superposicin de imgenes
estacionarias para producir la sensacin de movimiento datan de la primera mitad del siglo XIX. El
Phenakistoscope (1832) y el Zoetrope (1834) eran juguetes pticos que se exhiban en ferias y que se
basaban en una serie de dibujos dispuestos en discos o tambores giratorios que producan la sensacin
de movimiento en el espectador. Estos dos ingenios, precursores del cine y la televisin, son incluso
anteriores a la aparicin de la fotografa, cuyos principios no fueron establecidos hasta 1839 con el
desarrollo de un proceso fotogrfico positivo, conocido como el daguerrotipo, elaborado por el pintor
francs Louis Jacques Mand Daguerre. Poco despus el britnico William H.F. Talbot desarrolla un
proceso que permite obtener mltiples copias positivas a partir de un nico negativo, sentando por
tanto las bases para la multidifusin de reportajes fotogrficos. Sin embargo, eran los albores de la
fotografa y los tiempos de exposicin eran de varios minutos, lo que haca impensable sustituir los
dibujos y grficos utilizados en los discos giratorios por fotografas reales. Hacia 1870, la evolucin
tecnolgica en la fabricacin de material fotosensible ya permita utilizar tiempos de exposicin del
orden de centsimas de segundo.

La primera secuencia de fotografas sobre una escena real fue realizada por el fotgrafo britnico-
americano Eadweard Muybridge. Este fotgrafo fue contratado por Leland Stanford, gobernador de
California y gran aficionado a las carreras de caballos, para demostrar que en algn punto del galope
de un caballo ste mantena sus cuatro patas en el aire. Evidentemente se trataba de una apuesta en la
que los resultados de las fotografas de Muybridge deban establecer el ganador. Despus de varias
pruebas y experimentos, en 1877, Muybridge consigui tomar una secuencia de 12 fotografas del
galope de un caballo. Para ello dispuso una batera de 12 cmaras fotogrficas a lo largo de la pista de
carreras, utilizando unos cables que estaban situados sobre la pista detectaban el paso del caballo y
disparaban la cmara asociada. La secuencia de 12 fotogramas se mont sobre un disco giratorio y se
proyect, reproduciendo en movimiento del caballo en la pantalla. Stanford result vencedor de la
apuesta.

Un experimento similar fue llevado a cabo por el fisilogo francs tienne-Jules Marey quien en 1882
obtuvo una secuencia de fotografas del vuelo de un pjaro. La principal innovacin introducida por
Marey es que us un artilugio de su invencin que permita realizar todas las instantneas mediante
una nica cmara. La cmara tena el aspecto (y la filosofa) de un rifle y llegaba a realizar un total de
12 fotografas por segundo. Marey tambin mont las fotografas sobre un tambor rotatorio para
sintetizar el movimiento obtenido. No obstante, tanto en el caso de Muybridge como Marey, el
objetivo principal de las experiencias no era la sntesis del movimiento, sino el anlisis cientfico de
movimientos que, por su rapidez, no podan ser observados con precisin con la simple inspeccin
visual.

En 1887, Hannibal Goodwin desarrolla un material fotosensible que puede ser enrollado en s mismo,
lo que permite realizar varias fotografas sin necesidad de sustituir el negativo. El uso de un carrete
permite simplificar notablemente la cmara respecto al complejo sistema de Marey, que necesitaba
cargar previamente, de manera independiente, todos los negativos. En 1888, George Eastman inicia la
produccin en masa de carretes para fotografa, cuyo uso se populariza rpidamente.

Tambin en 1888, Thomas Alva Edison propone a uno de sus ayudantes de laboratorio que investigue
con el objeto de desarrollar una cmara que sea capaz de registrar secuencias de fotogramas de
escenas reales para posteriormente sintetizar el movimiento. Inicialmente el objetivo de Edison es que
utilizar el sistema como acompaamiento visual del fongrafo, invento que l mismo haba
desarrollado un ao antes y que estaba teniendo un considerable xito comercial. La propuesta de
Edison es la primera en que la cmara se disea especficamente para la sntesis del movimiento y no,
como en el caso de Marey, para su anlisis.

William K.L. Dickson, el ayudante al que Edison haba encargado el trabajo, desarroll una cmara
que incorporaba un complejo sistema de relojera para garantizar que la frecuencia con que se
tomaban los fotogramas fuera constante. Adems, introdujo un sistema de perforacin en los laterales
del celuloide cuyo objetivo era sincronizar la toma de imgenes de la cmara con su posterior
proyeccin. Los resultados de estos trabajos cristalizaron en el Kinetograph, que se patent en 1893 y
que poda trabajar con rollos de celuloide de quince metros de longitud tomando un total de 40
fotogramas por segundo.

Como el objetivo fundamental del sistema era la realizacin de pelculas para acompaar al fongrafo,
Edison propone a Dickson que desarrolle un dispositivo para uso individual que permita visualizar las
pelculas obtenidas con el Kinetograph. El diseo final es un sistema de visionado personal formado
por una caja con un habitculo en el que se coloca la pelcula, una lmpara incandescente y un
obturador que permiten ver la secuencia de imgenes a travs de un visor. El sistema de visionado se
denomina Kinetoscope y se comercializa y distribuye fundamentalmente en hoteles, recintos feriales y
lugares ldicos.

Paralelamente, en Europa se disean y patentan sistemas parecidos que finalmente no son aceptados
por el pblico. Adems, Edison no realiza patentes internacionales sobre sus sistemas de cmara y
visor, por lo que aparecen varias copias, con ligeras modificaciones de estos sistemas, en Europa. Una
de las exhibiciones del Kinetoscope realizadas en Pars, inspira a los hermanos Auguste y Louis
Lumire para el desarrollo del primer sistema de cmara y proyector comercialmente viable. El 28 de
diciembre de 1895 se realiza la primera demostracin en Pars del nuevo invento de los hermanos
Lumire, el Cinmatographe, que suele ser considerado como el inicio del cine. Es famosa la frase de
los hermanos Lumire en la que aseguran que su invento es ciertamente curioso, que puede ser usado
durante algn tiempo como distraccin, pero que no tiene ningn futuro comercial.

La principal ventaja del Cinmatographe respecto al Kinetograph es que el sistema puede usarse como
cmara o como proyector y que es relativamente porttil. Mientras el Kinetograph requiere el uso de
bateras y pesa casi 500 Kg, el Cinmatographe se opera con el uso de una manecilla, slo utiliza 16
fotogramas por segundo, con lo que optimiza bastante el uso de la pelcula y tiene un peso de
alrededor de 8 Kg. Las diferencias entre los dos sistemas condiciona el tipo de pelculas que se
realizan con cada uno. En el caso del Kinetograph todas las filmaciones son escenas de circo o vodevil
que se realizan en un estudio, mientras que el invento de los hermanos Lumire se utiliza
fundamentalmente en la realizacin de reportajes y documentales filmados en exteriores. En este
ltimo caso, se envan reporteros con cmaras a todos los rincones del mundo, por lo que el
Cinmatographe se convierte rpidamente en un sistema muy popular que es adoptado como estndar
por la mayora de pases. Tanto en un caso como en otro, las pelculas se presentan siempre tal cual
han sido registradas, no aplicndose, por el momento ningn proceso de edicin.
En Estados Unidos, el mercado de Kinetoscope se satura rpidamente y la principal fuente de ingresos
para Edison es la produccin de pelculas, creando unos estudios especficos para ello. En 1896,
viendo que su sistema de proyeccin individual no tiene excesivo futuro, Edison adquiere los derechos
para la fabricacin de un proyector desarrollado por Thomas Armat y conocido como Vitascope. El
nuevo proyector incorpora un mecanismo para el movimiento intermitente de la pelcula y un sistema
para el enrollado y desenrollado de la pelcula en dos carretes durante la proyeccin. La primera
demostracin de este sistema se realiza el 23 de abril de 1986 en un teatro de Nueva York y supone
una nueva filosofa para el visionado de pelculas en salas especiales. Durante esta poca aparece en
Estados Unidos un gran nmero de sistemas de proyeccin alternativos con redes de exhibicin
itinerantes que utilizan teatros mviles. En Europa, la incipiente industria cinematogrfica britnica y
sobre todo la francesa empiezan a utilizar teatros fijos para la proyeccin de pelculas separndose los
procesos de produccin y exhibicin de una forma definitiva. Pronto surgen las primeras, pelculas
con edicin, superposicin de imgenes y trama argumental. El primer proceso fotogrfico en color
comercialmente viable para el cine se obtiene en 1908 (Kinemacolor), aunque no empieza a usarse
hasta mucho ms tarde. El resto de esta historia ya no tiene mucho que ver con los orgenes del
muestreo temporal de imgenes, por lo que dejaremos que el lector interesado la busque en textos
especializados sobre los orgenes del sptimo arte.

1.7.2 La persistencia, el parpadeo y el fenmeno phi
La sensacin de continuidad que se percibe cuando se nos presenta una secuencia de imgenes a una
frecuencia suficientemente rpida es debida a la accin conjunta de la persistencia de las imgenes en
la retina y al fenmeno phi. La persistencia consiste en que la percepcin de la imagen se mantiene
durante unas fracciones de segundo despus de que ha desaparecido la excitacin. En la figura 1.53 se
comparan dos grficos que intentan ilustrar esta sensacin visual en un experimento donde se
proyectan impulsos lumnicos de amplitud constante en una pantalla. La grfica superior representa la
energa lumnica proyectada en funcin del tiempo, mientras la inferior representa la sensacin de
iluminacin percibida por el sistema visual humano. Obsrvese que la respuesta del ojo no desaparece
inmediatamente despus de la excitacin sino que se mantiene durante unos instantes. Si la frecuencia
de la excitacin es lenta el sistema visual es capaz de discernir entre las distintas excitaciones
interpretando correctamente que la luz del proyector se apaga y se enciende alternativamente. Sin
embargo, si aumentamos la frecuencia de excitacin llegar un momento en que se percibe una
sensacin de iluminacin uniforme a lo largo del tiempo equivalente a la que obtendramos si el
proyector estuviera constantemente encendido. El nivel de iluminacin subjetivo que percibe coincide
con el valor medio de la seal utilizada para la excitacin y se conoce como la ley de Talbot-Plateau.
De acuerdo con esta ley, podemos controlar el nivel de luminancia de un proyector regulando el
tiempo relativo en que las imgenes se proyectan en la pantalla o permanecen ocultas, es decir, el
ciclo de trabajo sin necesidad de aumentar la potencia de la fuente de luz.

Entre la regin en la que discernimos correctamente el carcter pulsado del proyector y la regin en la
que tenemos una sensacin de continuidad completa, existe un margen de frecuencias en las que se
aprecia un parpadeo de la imagen que interpretaramos como si el nivel de iluminacin del proyector
no fuera uniforme. Este fenmeno se conoce en terminologa inglesa con el nombre de flicker, y
debido a su frecuente uso en la literatura sobre sistemas de televisin, ser usado a menudo en este
texto.

Fig. 1.53 Persistencia de las imgenes en la retina

La frecuencia a la que se empieza a desaparecer el parpadeo y las imgenes se funden en una
sensacin nica de continuidad se denomina frecuencia crtica de flicker y depende del nivel de
iluminacin de la pantalla. Esta dependencia es de tipo logartmico y se conoce como la Ley de Ferry-
Porter:

B f
crtica 10
log 6 , 12 37 + = (1.58)

siendo B el nivel de brillo de la pantalla medido en foot-lamberts. Para tener una idea de esta
magnitud diremos que con los niveles de iluminacin que se utilizan en el cine o en el monitor de
televisin para una visin cmoda, la frecuencia crtica es del orden de unos 40 Hz (es algo ms baja
en el cine debido a que las condiciones de iluminacin de la sala estn adecuadas al visionado de la
cinta, por lo que no se requiere tanta potencia de iluminacin de la pantalla).

El margen de valores de frecuencias crticas puede oscilar entre unos 60 Hz para condiciones de fuerte
iluminacin diurna hasta unos 4 Hz, en condiciones de iluminacin nocturna y visin fotpica. Estas
diferencias probablemente residen en el distinto comportamiento que presentan los conos y los
bastones. En el primer caso se trata de elementos especializados en detectar niveles de iluminacin
elevados, por lo que se supone que una vez activados inhiben su respuesta rpidamente para estar
preparados para recibir nuevos estmulos. En cambio, la respuesta de los conos es bastante lenta y
puede durar hasta de segundo, por lo que si reciben un nuevo estmulo mientras estn activados no
se produce ninguna respuesta nueva, simplemente tardan ms tiempo en desactivarse.

El fenmeno phi es el responsable principal de que el sistema visual humano sea capaz de interpolar
movimientos de los que slo dispone informacin fraccionada y producir la sensacin de que son
t
t
t
T 0 2T 3T
Excitacin proyector
Sensacin luminosidad
Aumento de la frecuencia
t
t
t
T 0 2T 3T
Excitacin proyector
Sensacin luminosidad
Aumento de la frecuencia
continuos. Un ejemplo caracterstico para ilustrar este tipo de respuesta del sistema visual consiste en
situar dos focos de luz, uno al lado del otro, que se encienden alternativamente de modo que mientras
uno est encendido el otro est apagado. Si la frecuencia a la que conmutan las luces es
suficientemente baja, el sistema visual interpreta correctamente la escena (alternancia del encendido
de las luces). Sin embargo, si la frecuencia aumenta ligeramente (bastante por debajo del margen de
flicker) el ojo interpretar que la luz se mueve hacia delante y hacia atrs. El mismo fenmeno es
responsable de que los carteles luminosos sean interpretados sistemticamente como un romntico
luces y figuras en movimiento en vez de, la ms fra pero racional, apagado y encendido de
elementos electroluminiscentes. El fenmeno se produce porque estas secuencias de imgenes parece
que activan las neuronas encargadas de la deteccin de movimientos en las escenas, ya que la
secuencia de imgenes obtenida, si bien en este caso es de naturaleza discreta, es parecida a la que se
obtendra si realmente las luces se estuvieran desplazando. El mismo sistema es responsable de
interpretar movimientos ms complejos cuando se suceden secuencias de imgenes fijas que contienen
informacin parcial sobre el movimiento, siendo este el principio que utilizaban los primeros discos y
tambores rotatorios como el Zoetrope. Para una correcta sensacin de continuidad del movimiento es
necesario disponer de aproximadamente de algo ms de 18 imgenes por segundo.

En este punto es necesario aclarar que aunque tanto la persistencia de la retina como el fenmeno phi
intervienen conjuntamente en la percepcin de continuidad de las imgenes, en sistemas como el cine
o la televisin son conceptualmente distintas. El primero es el responsable de que observemos un
nivel de iluminacin constante, no discriminando la discontinuidad en la informacin, mientras que el
segundo permite obtener la sensacin de que los movimientos son continuos. Probablemente, una
escena del cine de principios del siglo XX nos ayudara a aclarar las diferencias entre ambos
conceptos. En este caso, se presentaban 16 imgenes por segundo, con lo que apareca un considerable
parpadeo de la secuencia. Sin embargo, el movimiento poda ser interpolado con una precisin
razonable. La sensacin general era que los objetos se desplazaban de manera uniforme bajo una
iluminacin oscilante (el lector puede objetar que en muchas de las pelculas de esta poca el
movimiento parece excesivamente rpido y discontinuado. Esto es debido fundamentalmente a que las
pelculas originales han sido convertidas directamente al formato televisivo, que al utilizar un mayor
nmero de imgenes por segundo, produce la sensacin de acelerar la accin. Consideraremos el
problema de la conversin de pelculas de cine a seal de televisin en breve).

1.7.3 Frecuencia de imagen
Tanto en el cine moderno como en la televisin, los dos aspectos aparecen asociados al nmero de
imgenes por segundo que se toman de la escena y al nmero de imgenes por segundo que se
presentan al espectador; parmetros que, aunque en un principio pueda parecer que deberan de
coincidir, no necesariamente debe ser as. En efecto, hemos comentado que en principio basta con una
veintena de imgenes por segundo para poder estimar correctamente el movimiento de los objetos
mientras que, con los niveles de iluminacin utilizados en cine y televisin, se requieren ms de 40
imgenes por segundo para que no aparezca el parpadeo. Una solucin trivial al problema consiste
en elegir un nmero de imgenes por segundo superior a 40, con lo que se cubren ampliamente ambos
requerimientos. Sin embargo, en el cine, el precio del celuloide fue, y sigue siendo para la mayor parte
de producciones con presupuesto moderado, un factor considerable en el computo total del coste de la
pelcula. Esto significa que no resulta conveniente aumentar el nmero de fotogramas por segundo
ms all de lo estrictamente necesario para que el sistema visual interprete correctamente el
movimiento. En televisin el problema es parecido, aunque en este caso, el coste, ms que al
presupuesto, afecta al ancho de banda de la seal.

La solucin adoptada en el cine fue ciertamente astuta y, aunque adaptada a las caractersticas del
medio, se utiliz tambin como idea bsica para reducir el ancho de banda en la seal de televisin.
En el cine actual se realizan 24 fotogramas por segundo, lo que es ms que suficiente para
proporcionar una correcta sensacin de movimiento continuado al espectador. Sin embargo, la
presentacin directa de estos fotogramas producira una sensacin de parpadeo notable. La solucin al
problema consiste en presentar dos veces cada fotograma, con lo que, al doblar la frecuencia de
disparo del proyector se elimina completamente el flicker y se obtiene una sensacin de uniformidad
en la iluminacin de la pantalla. La solucin es simple y eficaz por cuanto basta con disponer de un
obturador frente al proyector que se dispare con una frecuencia del doble de la velocidad de la cinta.

En un primer anlisis parece que la solucin de repetir las imgenes pueda empeorar la calidad de la
reproduccin, ya que al encender y apagar un mismo fotograma dos veces, el tiempo total que este
permanece expuesto al espectador se reduce. Quiz podamos comprender de una manera ms intuitiva
este fenmeno si suponemos que realizamos el siguiente experimento: Disponemos de dos
ventiladores uno con cuatro aspas y otro con dos que estn girando a la misma velocidad (12,5 vueltas
por segundo) a travs de los cuales queremos observar una escena estacionaria. Al observar la escena
por el ventilador de dos aspas notaremos un efecto de parpadeo de la escena mientras que con el de
cuatro aspas este efecto desaparece. Podemos comprobar, por tanto, que aunque en el primer caso la
escena aparece durante ms tiempo expuesta al ojo, existe un parpadeo debido a que el nmero de
impulsos no es suficientemente elevado.

Algunos sistemas de cine han utilizado un nmero mayor de fotogramas por segundo, aunque su uso
no se ha generalizado. Un ejemplo son las primeras pelculas producidas en formato de 70 mm que
utilizaron 30 fotogramas por segundo, aunque posteriormente se volvi a los 24 fotogramas
convencionales. A principios de la dcada de los 80 apareci el sistema Showscan que utiliza 60
fotogramas por segundo. Este sistema se utiliza nicamente para documentales en salas de proyeccin
especiales y ha tenido poco xito.

La solucin adoptada al definir los primeros sistemas de TV comerciales sigui una filosofa similar.
En este caso, para simplificar el funcionamiento de algunos subsistemas, la frecuencia de imagen se
hizo coincidir con la mitad de la frecuencia de red. Por tanto, en pases como Estados Unidos o Japn
se transmiten 30 imgenes por segundo mientras en Europa se utilizan 25. Ambos valores son
suficientes para garantizar un flujo de informacin que permita reconstruir correctamente el
movimiento de los objetos. La seleccin de submltiplos de la frecuencia de red se debe
principalmente a dos motivos que permitieron simplificar bastante los primeros diseos. Por una parte,
la frecuencia de red se mantiene bastante estable, lo que permite que varios equipos la utilicen como
patrn o seal de referencia comn. As, cuando en un estudio de TV operan simultneamente varias
cmaras es necesario que stas realicen un muestreo sincronizado de las imgenes para que pueda
conmutarse entre distintas cmaras sin que se produzcan prdidas de informacin. Otra ventaja
derivada del uso de un submltiplo de la frecuencia de red es que de este modo consegua minimizarse
el efecto visual que produca la interferencia de la seal de red en la pantalla de televisin.
Analizaremos estos efectos en captulos sucesivos, aunque en cualquier caso conviene tener claro que
la eleccin de la frecuencia de imagen se realiz en los albores de la electrnica y que probablemente,
con la tecnologa actual, los criterios a valorar para la seleccin de este parmetro hubieran sido
distintos. El parpadeo de las imgenes se consigui evitar dividiendo cada imagen en dos mitades que
se transmitan una detrs de la otra utilizando una tcnica de exploracin conocida como entrelazado.
Describiremos con detalle este concepto en la siguiente seccin. Esencialmente consiste en que el
receptor realice dos barridos de la pantalla por cada imagen presentando la mitad de la informacin en
cada uno. Con ello se consigue que la frecuencia aparente de exploracin de la pantalla se doble,
desapareciendo el parpadeo de la imagen. Cada una de las mitades de la imagen se denomina campo
o, en terminologa anglosajona, field. As, en Europa la frecuencia de campo es de 50 Hz mientras que
en USA o Japn es de 60 Hz.

El entrelazado debe considerarse como una estrategia propuesta con el objeto de reducir la
complejidad tecnolgica empleada en los primeros receptores de televisin.Veremos que es
responsable de algunos de los problemas de calidad de imagen que tienen los sistemas de televisin
analgicos y que exige el uso de una compleja tecnologa digital para su resolucin en los monitores
modernos.

La diferencia entre el nmero de imgenes por segundo que se toman en el cine y en los sistemas de
TV requiere un tratamiento especfico para la conversin de un formato a otro. El equipo encargado
de realizar la conversin de pelcula de cine a seal de televisin se denomina telecine. La mayora de
telecines permiten trabajar con pelculas en formato de 16 mm o 35 mm siendo raros los equipos que
aceptan el formato de 70 mm. Normalmente, aunque se trate de pelculas rodadas en formato de 70
mm siempre existen copias en 35 mm, por lo que son estas ltimas las que se usan para realizar la
conversin de formatos. Bsicamente el telecine dispone de un sensor de imagen mediante el que se
convierte cada fotograma de la pelcula en una imagen de televisin. Una vez la imagen ha sido
adquirida, se separa en los dos campos y se transmite o se almacena en formato de vdeo sobre soporte
magntico para su posterior transmisin. El problema bsico es que el nmero de fotogramas por
segundo en el cine es inferior al de la televisin, por lo que deben aadirse los fotogramas que faltan.

En Europa, la diferencia entre las 24 y 25 imgenes por segundo no es excesivamente grave y
difcilmente se percibe por parte del espectador. Durante bastantes aos, muchas emisoras europeas no
disponan de equipos especficos para la conversin y estuvieron retransmitiendo pelculas asociando
los fotogramas uno a uno. Mediante la conversin directa, una pelcula de 120 minutos en su versin
cinematogrfica original, tendra una duracin de poco ms de 115 minutos en televisin. En otras
palabras, las pelculas duraban un 4 % menos en TV que en el cine (este clculo no tiene en cuenta,
por supuesto, la publicidad). La conversin directa tambin afecta al sonido por cuanto, al tener que
sincronizarse con la imagen, debe ser acelerado en la misma proporcin por lo que experimenta un
ligero incremento de tono que tampoco se percibe. No obstante, en los pases que utilizan un formato
de televisin de 30 cuadros por segundo, la conversin fotograma a fotograma de la pelcula es
totalmente inviable pues cambios temporales de un 20 % que seran perfectamente visibles y audibles.
La solucin adoptada en este caso depende del tipo de telecine. La ms habitual consiste en repetir 6
cuadros en cada grupo de 24 fotogramas de la pelcula original y distribuirlos de manera uniforme en
el tiempo. Otra solucin consiste en generar alternativamente 2 campos para los fotogramas impares y
3 para los impares. De este modo, de una secuencia de 24 fotogramas se generan 60 campos con lo
que ambos sistemas funcionan sincronizados. Los telecines actuales para formato de 25 imgenes por
segundo suelen repetir el primer fotograma de cada grupo de 24 con lo que, actualmente, la duracin
de la pelcula en ambos formatos coincide. La pista de audio, que en la mayora de casos se suministra
en una cinta magntica que acompaa a la pelcula, suele sincronizarse procesando digitalmente las
seales para corregir el tono o bien actuando sobre los silencios para mantener su sincronizacin con
la seal de vdeo.

1.7.4 Aliasing temporal en las imgenes
Uno de los fenmenos que puede introducir el muestreo temporal de la escena es la aparicin de
efectos visuales que falseen o desvirten el movimiento real de los objetos. Estos efectos son debidos
a que la frecuencia de muestreo elegida resulta ser insuficiente para una correcta interpretacin del
movimiento. As, tal y como establece el teorema del muestreo de seales, si los movimientos de los
objetos son excesivamente rpidos, pueden existir componentes de alta frecuencia que, al muestrear la
escena, se solapan con otras componentes desvirtuando el movimiento real de los objetos.

Uno de los ejemplos tpicos de este fenmeno aparece en muchas pelculas de accin y en ocasiones
es incluso provocado por el director para producir en el espectador la sensacin de movimiento. La
escena consiste en centrar la accin de la cmara en la rueda de un carro (en pelculas del oeste) o de
un automvil. Cuando el vehculo arranca el espectador observa e interpreta correctamente el
movimiento de la rueda, sin embargo, a medida que la velocidad aumenta se produce la sensacin de
que los radios de la rueda se paran o incluso giran en sentido contrario al de la marcha del vehculo.
Este efecto es debido, como se ilustra en la figura 1.54, a que el ojo interpreta el movimiento de la
forma ms simple posible a partir de los fotogramas que se le presentan. En la figura se representan
dos fotogramas consecutivos de la rueda del carro que corresponden a dos situaciones distintas pero
que, inevitablemente, sern interpretadas del mismo modo, ya que las imgenes que las definen son
idnticas. En la secuencia superior, la rueda del carro experimenta un giro de rads entre dos
fotogramas consecutivos, mientras que en la inferior el giro real de la rueda es de +/4 rads. El
sistema visual interpretar en ambos casos el mismo movimiento aparente de rads ya que la simetra
de la rueda no le permite distinguir entre las dos secuencias. En este ejemplo, si la velocidad angular
de la rueda fuera tal que entre dos fotogramas consecutivos se produjera un giro de /4, el espectador
no apreciara ningn movimiento, ya que todas las imgenes seran idnticas. Se produce un caso
curioso cuando el ngulo de giro entre fotogramas es ligeramente inferior a /4, ya que en este caso se
interpreta que el movimiento de la rueda es en sentido contrario al real. En este ltimo supuesto es
evidente que para el sistema visual resulta mucho ms factible interpretar que se ha producido un
pequeo movimiento de la rueda en sentido contrario al real que un movimiento considerable en el
sentido correcto.

Este efecto visual se conoce como el efecto estroboscpico y es a veces provocado para poder
observar movimientos de naturaleza peridica de algunos fenmenos fsicos cuya rapidez no permite
observarlos en condiciones normales. El instrumento utilizado para ello se denomina estroboscopio y
consiste simplemente en una lmpara (flash) que se ilumina a intervalos regulares y cuya frecuencia y
fase de disparo puede ser controlada externamente. El estroboscopio puede utilizarse, por ejemplo,
para observar detalladamente la deformacin que experimenta la membrana de un altavoz cuando es
sometido a distintas excitaciones peridicas. Para realizar el experimento deberemos alimentar el
altavoz con una seal sinusoidal a la frecuencia en la que deseemos realizar el anlisis. El sistema
debe situarse en un entorno con poca iluminacin, de modo que al disparar el estroboscopio a la
misma frecuencia a la que est vibrando el altavoz podremos observar una imagen estacionaria de la
deformacin de la membrana. Si modificamos la fase de los disparos, veremos las deformaciones
progresivas que va tomando la membrana del altavoz en las distintas fases de la vibracin. Incluso, si
seleccionamos una frecuencia de disparo del flash ligeramente distinta a la de la vibracin del altavoz
podremos ralentizar el movimiento de la membrana a la velocidad deseada. Se propone que el lector
se plantee que posibles frecuencias del estroboscopio utilizara para poder observar el movimiento de
una membrana que oscila a 300 Hz con una velocidad aparente de 0.1 Hz. Tngase en cuenta que por
una parte es conveniente que la frecuencia del estroboscopio permita observar el movimiento sin
parpadeo y por otra que la frecuencia de disparo no puede ser excesivamente elevada por la limitacin
propia del flash.

Fig. 1.54 Aliasing temporal de las imgenes. En ambas situaciones, las secuencias de imgenes obtenidas son
idnticas, por lo que el sistema visual interpretar el mismo movimiento

Experiencias parecidas pueden observarse en diversos museos cientficos, entre ellos el de Barcelona,
en los que se incluyen diversas aplicaciones y efectos visuales obtenidos mediante la ayuda del
estroboscopio. Una de las ms espectaculares consiste en ralentizar la cada libre de las gotas de
agua. En este caso, se utiliza una cmara cerrada en la que se provoca un goteo constante de agua. Al
iluminar el flujo de gotas de agua mediante un estroboscopio podemos provocar que ste se ilumine
siempre que una gota de agua pase por una posicin determinada, por lo que observaremos que la gota
permanece suspendida en el aire. Una ligera disminucin o aumento de la frecuencia de disparo
producir la sensacin de que la gota cae o sube lentamente en el medio. Pueden realizarse
experimentos similares para visualizar el vuelo de insectos, analizar las vibraciones de mquinas, etc.

1.8 Muestreo espacial de las imgenes: filas
Esta es ya la ltima fase de muestreo de la escena antes de poder convertirla a una seal elctrica
analgica que aporte la informacin necesaria para su transmisin y reproduccin. Adems, esta es
+ / 4
+ / 4
una de las pocas etapas de muestreo y proyeccin de las escenas que el cine y la televisin no
comparten, ya que el primer sistema finaliza sus fases de representacin de la escena con el muestreo
temporal comentado en el apartado anterior. De hecho, el soporte del cine es claramente
bidimensional (la pelcula es una secuencia finita de fotogramas planos), mientras que en televisin
necesitamos realizar un muestreo adicional para obtener una seal unidimensional que pueda ser
transmitida mediante un sistema de comunicacin convencional.

La idea bsica del muestro espacial se ilustra en la figura 1.55, donde se representa un fotograma en
blanco y negro que se explora en la direccin horizontal con un nmero de lneas predeterminado. En
este caso la imagen se ha descompuesto en 25 lneas con el objeto de que pueda apreciarse el efecto de
un muestreo inadecuado sobre la calidad de la imagen. El muestreo se ha simulado utilizando tcnicas
de procesado digital de imagen en cuyo estudio profundizaremos en captulos posteriores. La imagen
original que se muestra en esta figura est muestreada tanto en el eje vertical como en el horizontal, no
obstante, el nmero de muestras es muy elevado, por lo que puede considerarse como si tuviera
naturaleza continua.

Fig. 1.55 Muestreo de una imagen por filas

Siguiendo con nuestro modelo de la escena, cada uno de los fotogramas obtenidos en la expresin de
la ecuacin 1.57, puede descomponerse en un nmero prefijado de lneas:

) ' , ( ) ' , (
) ( ) (
y x m y m w
k
FX
k
FX
(1.59)

donde m=1,..,NL; siendo NL el nmero de lneas y x=H/NL donde H representa la altura de la
pantalla. Hemos sustituido el smbolo asociado a la escena por la variable w para indicar
0 100 200 300 400 500 600 700
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
Imagen Original
Imagen muestreada
25 lneas
L1
L2
L3
L4
L5
Forma de onda
de la seal en
una lnea
Nivel gris
Posicin horizontal
0 100 200 300 400 500 600 700
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
Imagen Original
Imagen muestreada
25 lneas
L1
L2
L3
L4
L5
Forma de onda
de la seal en
una lnea
Nivel gris
Posicin horizontal
explcitamente que la primera ha sido completamente transformada a un conjunto numerable de
funciones unidimensionales. En la misma figura 1.55 se ha representado la forma de onda asociada a
una de las funciones w
FX
(k)
(m,y), que en este caso concreto corresponde a la k-sima imagen en
blanco y negro (X=Y) representada en la derecha en la lnea m=17. Para representar esta funcin se ha
adoptado el convenio de asignar al negro un nivel de amplitud nulo y al blanco un nivel de amplitud
unidad. El resto de niveles de gris est uniformemente distribuido entre estos lmites.

Con esta ltima etapa de muestreo hemos conseguido expresar la escena en funcin de una nica
variable de naturaleza continua (y) y cuyo dominio de definicin es finito (entre 0 y W, la anchura de
la imagen). El resto de variables: m, k y la que indica la componente de color o luminancia X, son de
naturaleza discreta y sugieren la posibilidad de transmitir la informacin que de ellas depende de
manera secuencial, enviando la informacin hacia el receptor lnea a lnea e imagen a imagen. En el
caso de transmitir imgenes en blanco y negro, la secuencia natural para enviar la informacin al
receptor sera del tipo:

K K K ), ' , 2 ( ), ' , 1 ( ), ' , ( , ), ' , 1 ( ), ' , ( ,
) 1 ( ) 1 ( ) ( ) ( ) (
y w y w y NL w y m w y m w
k
FY
k
FY
k
FY
k
FY
k
FY
+ +
+ (1.60)

donde se establece claramente una posible cadencia para la transmisin de lneas e imgenes.

Esta idea se esboza en la figura 1.56, donde se observa como puede construirse una seal que aporte
toda la informacin contenida en una supuesta secuencia de imgenes en blanco y negro, encadenando
todas las formas de onda de las lneas en las que se divide una imagen y repitiendo posteriormente este
proceso para cada una de las imgenes. En este caso la informacin contenida en cada una de las
lneas es del mismo tipo que la lnea representada en la figura 1.55, aunque para simplificar el grfico
cada lnea se ha representado simblicamente como un pequeo hexgono alargado. Es importante
observar en este punto que la idea que estamos sugiriendo para la construccin de una seal que
represente a la escena es slo una primera aproximacin a la seal de televisin, pues no estamos
teniendo en cuenta, por el momento, aspectos como los sincronismos o el entrelazado.

En la figura 1.56 se ha realizado, implcitamente, una concatenacin de las distintas funciones de la
ecuacin 1.60 en el dominio temporal. Para ello, es necesario realizar un cambio de variable que
convierta las funciones que dependen de una variable espacial en temporal. Es importante observar
que si deseamos realizar una transmisin en tiempo real, es necesario que el tiempo que transcurre
entre la transmisin de la primera lnea de una imagen y la siguiente coincida con el periodo de
muestreo temporal de la escena T
0
, que en el caso de la televisin europea ser de 40 ms (25 imgenes
por segundo). Asimismo, la duracin de una lnea deber ser de T
0
/N
L
, donde N
L
es el nmero total de
lneas en el que se descompone la imagen. De este modo, todas las lneas pueden codificarse en el
tiempo que transcurre entre dos imgenes consecutivas.

As pues, suponiendo que redefinimos el origen de tiempo al inicio de cada lnea, el cambio de
variable a realizar sera:

' '
0
t W
T
NL
y
(1.61)
de modo que t=0 corresponde con el inicio de la lnea y el valor t=T
0
/NL (duracin de la lnea)
corresponde con el final de la lnea o la anchura de la imagen.

Fig. 1.56 Principio de codificacin de la escena en una seal unidimensional

La expresin general de la seal en funcin de una nica variable temporal global es algo ms
compleja y no es excesivamente importante, siempre el lector haya comprendido la idea intuitiva
sobre la construccin de esta seal. De todos modos, para completar nuestra particular notacin sobre
la escena y la seal de televisin diremos que en un instante genrico t, la seal tomar el valor:

) ' , (
) (
t m w
k
FY
(1.62)

donde los distintos parmetros pueden calcularse en funcin de t de acuerdo con las siguientes
expresiones:

) 1 (
) 40 (
) 1 ( ) 40 ( '
; 1 ,
40
int mod ; 1
40
int ) (

+
,
_
,
_
,
_
m
NL
ms
k ms t t
NL
ms
NL t
m
ms
t
k
(1.63)

En estas expresiones int(.) indica la parte entera, mod(n,m) el resto de dividir el entero n por m y 40
ms es el periodo asociado a una frecuencia de imagen de 25 Hz. Hemos supuesto que el origen de
tiempos se corresponde con la imagen k=1. Consideremos como ejemplo el instante de tiempo t=41,3
ms en un sistema con 80 lneas. En este caso, cada lnea debera tener una duracin de 0,5 ms, por lo
que para este valor de t habran transcurrido 1,3 ms de la segunda imagen y estaramos a 0,3 ms del
inicio de la tercera lnea. Para este valor de tiempo y con NL=80, podemos comprobar que los
parmetros de las ecuaciones anteriores valen: k=2, m=3 y t=0,3 ms que concuerdan con lo previsto.

Queremos insistir en que esta idea general sobre la construccin de la seal de televisin requiere an
varios refinamientos y consideraciones sobre los distintos parmetros que pueden afectar a la calidad
de la seal de televisin. A saber, cul es el nmero de lneas apropiado para que el sistema tenga una
L1 L2 L3 LN L1 L2
1/25 = 40 ms
Imagen M Imagen M+1
40 ms /n lneas
t
Nivel
gris
L1 L2 L3 LN L1 L2
1/25 = 40 ms
Imagen M Imagen M+1
40 ms /n lneas
t
Nivel
gris
calidad aceptable, cmo afecta a esta idea el querer transmitir una seal de color, cmo se informa al
receptor a qu parte de la imagen corresponde cada componente de la seal que se transmite, cmo
afecta el nmero de lneas al ancho de banda, cmo modificar esta representacin de la escena para
incluir el entrelazado de los campos necesario para evitar el parpadeo de la imagen, etc. El objetivo de
esta seccin es dar una respuesta de carcter generalista a todas estas cuestiones. Los detalles
concretos sobre formas exactas de la seal, modulaciones, etc., se dejarn para captulos posteriores.

Sin embargo, antes de empezar a considerar estos detalles, es el momento oportuno de realizar una
rpida revisin histrica sobre los orgenes de la televisin y los primeros prototipos que se
consideraron para la transmisin de imgenes.

1.8.1 Antecedentes de la televisin
El primer sistema para la transmisin a distancia de imgenes en movimiento fue desarrollado en 1879
por G.R. Carey y se basaba en enviar la informacin recogida en un panel de fotoclulas, que actuaba
como sensor de imagen, a travs de mltiples cables hacia una pantalla de lmparas en la que se
presentaba esta informacin al receptor. El prototipo original tena un total de 2500 elementos en cada
uno de los paneles, distribuidos en una matriz de 50 50. Es evidente que la resolucin obtenida era
bastante baja a pesar del gran nmero de cables utilizado que haca inviable la transmisin de la
informacin a grandes distancias, ya que el nmero de amplificadores requeridos sera muy elevado.
Por todo ello, este prototipo an no puede ser considerado como un verdadero sistema de televisin,
pues la naturaleza de la informacin no estaba todava adecuada a su transmisin a travs de un nico
canal.

En 1879, Constantin Senlecq propuso una importante modificacin sobre el sistema anterior, que
consista en conmutar rpidamente el canal activo de modo que slo se transmita simultneamente la
informacin recogida por un fotosensor, alternando stos en el tiempo para transmitir toda la imagen.
Esta idea se basaba en la persistencia del sistema visual humano, de manera que si el tiempo que
transcurra entre activaciones sucesivas de una misma lmpara era pequeo, el ojo no apreciaba la
interrupcin de la luz.

Esta propuesta supuso el verdadero origen de la televisin, puesto que a pesar de que los subsistemas
de exploracin y presentacin de imagen seguan teniendo serias limitaciones, la informacin se haba
adecuado a las caractersticas necesarias para su transmisin a distancia pudiendo transmitirse a travs
de un nico canal. Considrese como ejemplo, que si se desea transmitir la informacin a travs de un
cable, la atenuacin puede evitarse slo con introducir un nico amplificador en cada uno de los
tramos en que se requiera restaurar el nivel de la seal. Esto sin duda simplifica notablemente la
electrnica necesaria respecto a su precursor. La idea de Senlecq de transmitir la informacin de
manera secuencial se ha mantenido en todos los sistemas de televisin surgidos posteriormente y
probablemente se mantendr para todos los sistemas que surjan en el futuro. Pinsese que los primeros
sistemas de comunicacin a distancia surgieron para la transmisin de datos (telegrafa) o voz
(telefona); seales que son claramente funciones de una nica variable tiempo. La televisin fue el
primer sistema en el que la informacin a transmitir dependa de varias variables y aunque
seguramente hoy podran proponerse sistemas de gran elegancia analtica para transmitir todas estas
variables simultneamente, en la prctica, la filosofa utilizada es adecuada a las caractersticas de
nuestro sistema visual y tecnolgicamente viable desde hace varias dcadas. La propuesta de Senlecq,
a pesar de todo, no era simple para la tecnologa de la poca y el primer prototipo no se realiz hasta
cincuenta aos ms tarde. Este primer prototipo usaba 16 imgenes por segundo, que se presentaban
sobre un panel de 50 50 lmparas, por lo que la frecuencia de conmutacin del canal era de 16
2500 = 40 KHz.

La siguiente propuesta histricamente relevante surgi en 1884, cuando Pablo Nipkow propuso un
sistema mecnico que permita usar una nica clula fotoelctrica y que simplificaba
significativamente el sistema de exploracin de la imagen. Los sistemas de exploracin mecnica
tenan una resolucin bastante baja y fueron rpidamente sustituidos al aparecer los primeros sistemas
electrnicos. No obstante, tienen una considerable importancia histrica, ya que las primeras
transmisiones de televisin se realizaron mediante estos sistemas, por lo que expondremos brevemente
su principio de funcionamiento.

La primera implementacin prctica del sistema propuesto por Nipkow se realiz en 1925 y su
filosofa bsica se esboza en la figura 1.57. La escena se enfoca mediante un sistema ptico sobre una
regin plana del espacio con forma rectangular detrs del cual se encuentra una clula fotoelctrica de
selenio que recoge la cantidad de luz incidente en el rectngulo. En la zona en la que se forma la
imagen se inserta un disco giratorio que tiene practicados unos pequeos orificios distribuidos sobre
una lnea espiral como la indicada en la figura 1.57.

.
Fig. 1.57 Procedimiento mecnico para la exploracin de la imagen mediante el disco de Nipkow

Estos orificios slo dejan pasar hacia la clula fotosensible la parte de la imagen que se est
explorando, ocultando el resto. Existe un segundo grupo ptico situado entre la clula de selenio y el
disco que se encarga de asegurar que la luz que pasa a travs del disco se concentra en la superficie
sensora. La disposicin de los orificios permite realizar una exploracin de las lneas de la imagen tal
y como se indica en la figura 1.58. Cuando el primer orificio ha pasado completamente por la primera
lnea del rectngulo de exploracin, el siguiente orificio entra por la parte izquierda y explora la
siguiente lnea. La clula fotosensible, situada detrs del disco, slo recibe la luz que deja pasarse a
travs de estos orificios.
Motor
Clula
Fotoelctrica
Disco de Nipkow
Vista Lateral
Escena Optica
Optica
Regin rectangular en la
que se forma la imagen
Disco de Nipkow
Visin frontal
Orificios
Motor
Clula
Fotoelctrica
Disco de Nipkow
Vista Lateral
Escena Optica
Optica
Regin rectangular en la
que se forma la imagen
Disco de Nipkow
Visin frontal
Orificios

Fig. 1.58 Exploracin de las lneas mediante los orificios del disco de Nipkow

La velocidad de giro del disco determina el nmero de imgenes por segundo y la cantidad de
orificios, el nmero de lneas de cada imagen. El primer prototipo dispona de un total de 28 orificios
y el disco giraba a 12,5 r.p.m. Ntese que la seal que se obtiene en la salida de la clula tiene unas
caractersticas parecidas a la de la seal descrita en la seccin anterior, por lo que este curioso
mecanismo realiza directamente el muestreo temporal y espacial de la imagen y su posterior
conversin a una seal temporal.

Nipkow dise un sistema anlogo para la presentacin de las imgenes. En este caso, la seal
recogida por la clula sensora se utilizaba para activar una lmpara con una intensidad variable. El
disco usado en la reproduccin de las imgenes se encargaba ahora de proyectar la luz incidente sobre
una pantalla en la que el espectador poda ver la escena. El sistema de reproduccin no tuvo tanto
xito como el de exploracin debido a que anteriormente ya se haba desarrollado el tubo de rayos
catdicos, que tena unas prestaciones bastante superiores para la visualizacin de imgenes. El tubo
de rayos catdicos fue inventado por Braun en 1897 y posteriormente mejorado por Wehnelt, que
introdujo el can electrnico en 1903. Boris Rosing en 1907 fue el primero que logr usar el tubo de
rayos catdicos para la presentacin de imgenes de televisin.

El xito del sistema de exploracin mecnico de Nipkow se debe a que los primeros sistemas de
exploracin totalmente electrnica no aparecieron hasta 1932. En 1929 se realizaban transmisiones
espordicas de televisin, usando el sistema de exploracin mecnico de Nipkow y transmitiendo la
seal en onda media, en Alemania e Inglaterra.

La aparicin del iconoscopio, desarrollado por Vladimir Zworykin en 1932, supuso un importante
cambio en el sistema de exploracin de la imagen mejorando significativamente la calidad. El
iconoscopio utilizaba una hoja que contena un gran nmero de condensadores elementales sensibles a
la luz y que realizaban una funcin parecida a la de los receptores del sistema visual humano. Los
condensadores, al ser expuestos a la luz, adquiran una carga que dependa de la intensidad de luz
incidente. La lectura de la carga se realizaba utilizando un procedimiento de exploracin parecido al
de un tubo de rayos catdicos, de modo que la corriente generada cuando el haz se diriga hacia un
determinado punto de la hoja era proporcional a la luz incidente en esa regin. El sistema, que se
Regin donde se
enfoca la imagen
Primera lnea
Segunda lnea
Primer orificio
Segundo
orificio
Regin donde se
enfoca la imagen
Primera lnea
Segunda lnea
Primer orificio
Segundo
orificio
representa en la figura 1.59, tena suficiente sensibilidad para trabajar en condiciones de luz diurna
normal.

Fig. 1.59 Iconoscopio

La primera transmisin de televisin en blanco y negro fue realizada en 1936 con ocasin de la
inauguracin de los juegos olmpicos de Berln. Durante este mismo ao aparecen los primeros
programas comerciales transmitidos por la BBC en Gran Bretaa. En Estados Unidos, las primeras
transmisiones y programas regulares empezaron en 1939, con motivo de la Exposicin Universal de
Nueva York. En la figura 1.60 se muestra un equipo receptor de televisin del ao 1936.

Fig. 1.60 Receptor de televisin del ao 1936


Las primeras pruebas con seales en color se iniciaron en Estados Unidos en 1941. La calidad de las
imgenes era muy baja, pero estas pruebas favorecieron el desarrollo de los sistemas de color que
conduciran a la definicin del sistema NTSC en 1954. Los sistemas de televisin en color europeos
no aparecieron hasta los inicios de la dcada de los 60.

Anteriormente, en 1928, el ingeniero escocs John Baird haba construido un prototipo de televisin
en color que utiliza un conjunto de tres filtros, rojo, verde y azul, que giraban mecnicamente delante
de una pantalla de blanco y negro. Baird diseo un ingenioso sistema para sincronizar de las imgenes
con los filtros, demostrando los principios bsicos de la formacin del color. El tubo de rayos
catdicos para la presentacin de imgenes en color fue propuesto por el alemn Werner Flechsing en
1938. El primer tubo de cmara que almacenaba la informacin en elementos semiconductores fue
presentado por la RCA en 1952. Este tubo, denominado Vidicon, sustituy rpidamente a sus
predecesores y se convirti en un estndar durante bastantes dcadas.

El primer receptor de televisin realizado completamente con transistores fue realizado por Sony en
1960. En la dcada de los 60 se iniciaron las primeras transmisiones de seal de televisin va satlite.
Estas primeras conexiones se realizaban entre centros de distribucin de seal para realizar programas
o noticiarios de mbito internacional. Las seales se distribuan por va terrena a los espectadores. La
radiodifusin directa de seales de televisin por satlite se introdujo hacia 1980. Hacia finales de esta
misma dcada se presentaron los primeros sistemas de televisin de alta definicin en Japn. En
Europa se intent introducir un nuevo sistema de televisin, con una definicin mejorada, orientado a
las transmisiones va satlite y que permitiera una transicin gradual hacia la televisin de alta
definicin. El sistema, que se denomin D2-MAC, no tuvo excesivo xito y el proyecto fue
abandonado. Durante la dcada de los 90 aparecieron los primeros sistemas de radiodifusin de
seales de televisin en formato digital. El formato empleado para la codificacin de las imgenes se
conoce con el nombre de MPEG-2 y ha sido ampliamente aceptado. Actualmente el MPEG-2 se
utiliza en el sistema europeo para la radiodifusin de vdeo digital (DVB Digital Video
Broadcasting) en todas las variantes: va satlite, cable y terrena. Tambin se utiliza en la codificacin
de vdeo y audio en sistemas de disco compacto de alta densidad como el DVD (Digital Versatile
Disc). El MPEG-2 tambin contempla futuras evoluciones de los sistemas de televisin hacia el
concepto de alta definicin.

1.8.2 Nmero de lneas
El nmero de lneas en que se descompone cada imagen influye directamente en dos parmetros
bsicos de la seal de televisin: la calidad y grado de detalle de la imagen en el eje vertical y el ancho
de banda de la seal. Es evidente que para tener una buena percepcin de la imagen, el nmero de
lneas deber ser suficientemente elevado como para que el sistema visual no sea capaz de distinguir
entre la imagen original y la imagen muestreada. La situacin representada en la figura 1.55
corresponde a un claro ejemplo en el que, siempre que la imagen se observe a una distancia de lectura
normal, el nmero de lneas parece ser insuficiente, producindose una considerable prdida de
calidad respecto a la imagen original. Por otra parte, es conveniente mantener el nmero de lneas
dentro de unos lmites razonables, por cuanto su aumento tiene una incidencia directa sobre el ancho
de banda de la seal de TV. En efecto, podemos ver que un incremento del nmero de lneas supone,
de acuerdo con el diagrama de codificacin de la seal de TV de la figura 1.56, una reduccin del
tiempo asignado a la informacin de cada lnea, por lo que la cantidad de informacin a transmitir por
segundo y, por tanto, el ancho de banda de la seal, aumenta. As pues, el nmero de lneas deber
elegirse como un compromiso adecuado para conseguir una buena calidad en las imgenes
reproducidas y a la vez mantener el ancho de banda de la seal dentro de unos lmites razonables.

En la eleccin del nmero de lneas de un sistema de televisin intervienen diversos factores cuya
incidencia examinaremos detenidamente. Probablemente, el factor esencial es la propia capacidad del
sistema visual humano para discernir los detalles en una imagen bajo determinadas condiciones de
iluminacin. Es evidente, por tanto, que no tiene sentido aumentar el nmero de lneas de una imagen
ms all de lo que el ojo es capaz de discernir, ya que en este caso, un incremento de informacin en
la imagen no supone ninguna mejora subjetiva en su calidad.

1.8.3 Agudeza visual
La capacidad del sistema visual humano para distinguir el detalle en las imgenes suele medirse como
la capacidad de discriminar dos estmulos lumnicos prximos. En general, si presentamos a un
observador una retcula de lneas negras sobre un fondo blanco, ste ser capaz de identificar
correctamente la composicin de la imagen siempre que la distancia entre las lneas negras sea
superior a la resolucin del sistema visual. Sin embargo, si alejamos la retcula del observador, llegar
un punto en que ste ser incapaz de distinguir esta imagen de la de un papel gris, ya que el ojo
integrar el patrn reticular en una sensacin griscea uniforme en la que no se aprecia el detalle de su
composicin.

La medida de la capacidad de resolucin del ojo se realiza mediante retculas de estas caractersticas
bajo distintas condiciones de iluminacin. El poder de resolucin del sistema visual humano se define
como el ngulo subtendido por dos lneas negras en el ojo cuando el patrn reticular est situado a la
distancia lmite en la que an se aprecia el detalle de las lneas que lo forman. El inverso de este
ngulo expresado en minutos de grado se define como la agudeza visual del ojo. As, una agudeza
visual igual a la unidad indica que el sistema visual es capaz de distinguir dos estmulos separados por
un ngulo (con vrtice en el ojo) igual o superior al minuto de grado. Ambas definiciones se ilustran
en la figura 1.61, en donde, por simplicidad, nicamente se representan las lneas horizontales de la
retcula.

La agudeza visual muestra una fuerte dependencia con la iluminacin. As, cuando tanto la retcula
como el entorno tienen una fuerte iluminacin diurna, la agudeza visual puede llegar a un mximo de
hasta 2 unidades (es decir, 30 de poder de resolucin). Para condiciones de iluminacin diurna
normales, la agudeza visual se sita alrededor de la unidad, mientras que en condiciones de
iluminacin nocturna (visin escotpica) puede reducirse hasta 0,04 unidades, es decir, slo pueden
distinguirse dos lneas cuando estn separadas por un ngulo de 25 (casi grado). Para las
condiciones normales de visionado de la seal de televisin, suele suponerse que la agudeza visual
est situada alrededor del valor unidad.

Aparte de esta retcula de prueba, existen otras alternativas para medir la agudeza visual. La ms
usada en laboratorios es la medida a travs de la llamada C de Landolt. En este caso, se proyecta una
figura circular que tiene una discontinuidad en una determinada regin, por lo que adopta una forma
parecida a la C. Esta figura se presenta con diferentes tamaos y rotaciones al observador, pidindole
que identifique la posicin en la que se encuentra la discontinuidad. Cuando para un tamao arbitrario,
el porcentaje de errores al apreciar la posicin de la discontinuidad excede un umbral predeterminado,
se considera que se ha alcanzado el lmite de resolucin del ojo. En este caso, el poder de resolucin
se toma como el ngulo subtendido desde el ojo a los dos extremos de la discontinuidad. En el caso
del oftalmlogo o el optometrista, la agudeza visual se mide mediante el conocido patrn de Snellen,
que consiste en una serie de hileras con letras, cuyos tamaos se reducen progresivamente. La agudeza
visual del observador se obtiene para aquel tamao de letra en el que el observador es capaz de
distinguir claramente cinco letras sobre un total de seis. En este caso la medida de la agudeza visual se
presenta en una forma un tanto confusa, ya que se denota como cocientes en los que el numerador
indica la distancia en metros desde la que se observa patrn de letras y el denominador, la distancia a
la que los detalles de las letras corresponderan a un ngulo de un minuto de grado. Segn este
criterio, una medida de 6/6 corresponde con una agudeza visual de una unidad y una 6/12 a media
unidad, cuando el patrn de Snellen se sita a 6 metros del espectador.

Fig. 1.61 Poder de resolucin y agudeza visual

Desde un punto de vista fisiolgico, la resolucin del ojo est condicionada por la densidad de
sensores lumnicos en la retina y por el mecanismo de transmisin de las seales a travs del nervio
ptico. El ngulo subtendido entre dos conos contiguos, situados en la regin central la fvea y
medido desde el centro del cristalino, es aproximadamente de 30, lo que concuerda con la resolucin
mxima del sistema visual en condiciones de fuerte iluminacin. Sin embargo, los mensajes que
circulan a travs del nervio ptico hacia el cerebro suelen ser combinaciones de respuestas de varias
clulas sensoras, por lo que la resolucin efectiva del sistema suele ser inferior a la densidad de
elementos sensores. Recurdese que el nmero total de mensajes enviados al cerebro es mucho menor
que el nmero de elementos sensores, lo que indica que una parte importante del proceso y anlisis de
la informacin visual se realiza en las primeras etapas de la visin mediante la interconexin de
neuronas sensibles y neuronas de proceso que se canalizan a travs del nervio ptico hacia el cerebro.
De hecho, parece ser que los mensajes de las clulas situadas en la regin central de la fvea (las que
Observador
Retcula test

Poder resolucin: (minutos de grado)
Agudeza visual: 1/
Observador Observador
Retcula test

Poder resolucin: (minutos de grado)
Agudeza visual: 1/
se activan bajo condiciones de fuerte iluminacin diurna) se transmiten uno a uno a travs del nervio
ptico, lo que justificara que la agudeza visual conseguida cuando operan nicamente estos conos sea
muy elevada. Sin embargo, a medida que los conos se alejan de esta regin central, cada vez se realiza
un mayor tratamiento previo de la informacin, con lo que disminuye la resolucin a medida que
empiezan a intervenir este tipo de clulas. El caso lmite se produce en condiciones de muy baja
iluminacin, en la que se supone que la visin es debida a la contribucin simultnea de varios
bastones. Bajo este supuesto, la resolucin se reduce notablemente, ya que nicamente se envan los
mensajes combinados correspondientes a grupos de varios bastones, con lo que la densidad eficaz de
los mismos se reduce.

1.8.4 Distancia de visionado
El nmero de lneas necesario para que el sistema visual no pueda distinguir entre la imagen
muestreada y la original depender del ngulo vertical con el que se observe la imagen desde el ojo.
As, cuando observamos la imagen de la derecha en la figura 1.54 desde una distancia normal para la
lectura del texto, unos 40 cm, podemos apreciar que el muestreo realizado es insuficiente, ya que el
ojo percibe con claridad las discontinuidades verticales de la imagen. Sin embargo, si alejamos la
figura varios metros, llegar un punto en que seremos incapaces de distinguir entre la imagen de la
derecha y la de la izquierda. Esto ocurrir cuando la distancia a la que est situado el papel es tal que
el ngulo con el que se ve la imagen es de 25 minutos de grado, ya que a partir de esta distancia el
ngulo subtendido por cada una de las lneas de la imagen es inferior a la resolucin espacial del ojo.

En resumen, pues, el nmero de lneas de la imagen viene determinado, tal y como se indica en la
figura 1.62, por el ngulo vertical con el que se observar la altura de la pantalla de televisin.
Teniendo en cuenta que la resolucin espacial media del sistema visual humano en las condiciones de
iluminacin de una seal de televisin es del orden de un minuto de grado, el nmero de lneas
necesario para una correcta calidad de la imagen coincidir con el ngulo vertical de observacin de la
pantalla expresado en minutos. No tendr sentido superar este nmero de lneas, por cuanto supondra
un aumento del ancho de banda de la seal sin ninguna mejora apreciable en la calidad de la imagen.

Fig. 1.62 ngulo vertical de observacin y distancia de visionado
Distancia de visionado
H
d = 6,66 H
1
V
Angulo vertical de observacin
Distancia de visionado
H
d = 6,66 H
1
V
Angulo vertical de observacin
Queda por tanto establecer cules son los ngulos ms apropiados y agradables al espectador para
observar una pantalla de televisin. En los inicios de la televisin se realizaron diversos estudios para
determinar cul sera la distancia ms cmoda para ver la pantalla de televisin.

La decisin que finalmente se tom en los primeros sistemas de televisin fue disearlos para que
fueran observados desde una distancia que estuviera entre 6 y 7 veces la altura de la pantalla. Esta
decisin se basaba en estudios estadsticos sobre la distancia a la que, libremente, se sita un
espectador para contemplar una obra pictrica y que es, independientemente del tamao del cuadro, de
unas 4 veces la diagonal del marco. Dado que, para mantener compatibilidad con el cine, la relacin
de aspecto de la pantalla estaba fijada en 4:3; la relacin entre la distancia de visionado y la altura de
la pantalla ser:

H
H
H d
,
_
+ 66 , 6
3
4
4
2
2
(1.64)

De acuerdo con esta relacin, un televisor de 28 debera ser observado desde una distancia
aproximada de 3 metros.

1.8.5 Nmero mnimo de lneas
Al disear el sistema de televisin para que sea observado desde una distancia que mantenga una
relacin proporcional a la altura de la pantalla, el ngulo vertical con el que se observa el monitor, y
por tanto, el nmero de lneas que deben usarse para una correcta visualizacin de la imagen, son
independientes del tamao del televisor. El ngulo vertical de observacin de la pantalla vendr dado,
de acuerdo con la figura 1.63, por:

57 , 8
66 , 6
2 /
2
,
_

H
H
arctg
V
(1.65)

Finalmente, teniendo en cuenta que la resolucin espacial del sistema visual es del orden de 1 minuto
de grado, y que, por tanto, dos lneas debern situarse, como mximo, a una distancia angular de 1
minuto, obtenemos el nmero mnimo de lneas necesario para el muestreo espacial de las imgenes:

lneas
lnea
NL 69 , 514
/ ' 1
' 60 57 , 8
(1.66)

Este nmero de lneas debe tomarse como un valor aproximado que nos indica aproximadamente cul
es el valor aproximado que debe tomar este parmetro. El nmero de lneas visibles en el sistema PAL
es algo superior al obtenido en la ecuacin anterior, pero en el sistema NTSC se mantiene ligeramente
por debajo. Estas diferencias no constituyen, sin embargo, ningn inconveniente en el sistema NTSC
y simplemente indicara que la distancia de observacin ptima es ligeramente superior a la del PAL.
De hecho, la distancia de visionado es un parmetro de diseo del sistema que el propio usuario
adecua a las caractersticas de su visin y del entorno en el que observar la televisin. As, es habitual
que algunos espectadores se siten a distancias del televisor considerablemente inferiores a las
anteriores.

Fig. 1.63 Clculo del ngulo vertical de visionado

1.8.6 Seleccin del nmero de lneas
En la seleccin definitiva del nmero de lneas de la seal de televisin intervienen, adems de la
agudeza visual discutida en los apartados anteriores, dos factores relacionados con la tecnologa
electrnica existente en la poca en la que se definieron los primeros sistemas y que por conveniencia,
simplicidad y compatibilidad se han mantenido posteriormente. El primero es que para conseguir un
perfecto entrelazado entre las dos subimgenes es necesario, como analizaremos posteriormente, que
el nmero de lneas sea impar. El segundo factor es que para facilitar los circuitos electrnicos es
conveniente que pueda establecerse una relacin simple entre el nmero de lneas y el nmero de
imgenes por segundo. Esta relacin simple se traduce en que puedan obtenerse las distintas
frecuencias que intervienen en el proceso de exploracin de la imagen a partir de un nico oscilador
global, cuya frecuencia se divide en relaciones enteras simples para obtener las distintas seales de
barrido de lnea, campo, imagen, etc. Para ello, como justificaremos pronto, es til que el nmero de
lneas de la imagen pueda expresarse como un producto de nmeros primos cuyos valores absolutos
sean relativamente bajos.

En la tabla 1.1 se proporciona la descomposicin en nmeros primos de los valores impares
comprendidos entre 601 y 649 lneas. Todo este margen de valores proporciona un nmero de lneas
adecuado a la resolucin espacial del ojo. Puede observarse que de todos estos candidatos, el valor de
625 es el que tiene una descomposicin con unos nmeros primos ms bajos, resultando el elegido
como el nmero de lneas en los sistemas de televisin utilizados en Europa.

Observador

max
=1
H/2
6,66 H

V
/2=arctg(H/13,33H)
Observador Observador

max
=1
H/2
6,66 H

V
/2=arctg(H/13,33H)
Tabla 1.1 Descomposicin en nmeros primos de los nmeros impares comprendidos entre 601 y 649

601=601 603=67X3X3 605=11X11X5 607=607 609=29X7X3
611=47x13 613=613 615=41x5x3 617=617 619=619
621=23x3x3x3 623=89x7 625=5x5x5x5 627=19x11x13 629=37x17
631=631 633=211x3 635=127x5 637=13x7x7 639=71x3x3
641=641 643=643 645=43x5x3 647=647 649=59x11

Para justificar la idoneidad de esta seleccin, calcularemos las frecuencias caractersticas de una seal
de televisin con una frecuencia de imagen de 25 Hz, una frecuencia de campo de 50 Hz y que utiliza
un total de 625 lneas por imagen. En este caso, de acuerdo con la figura 1.56, el periodo de tiempo
asignado a cada lnea ser:

s s
imag lin
imag s
T
lnea
64
15625
1
/ 625
/ 25 / 1

(1.67)

obteniendo, por tanto, una frecuencia de lnea de 15625 Hz. Con estos guarismos es fcil ver que si
partimos de un oscilador de 31250 Hz, basta con pasar esta seal a travs de distintos divisores de
frecuencia para obtener cada una de las frecuencias de inters:

Frecuencia de lnea: f
Lnea
=f
osc
2
Frecuencia de campo: f
Field
=f
osc
(5 5 5 5) (Pasarla a travs de 4 divisores por 5)
Frecuencia de cuadro: f
cuadro
=f
Field
2

Con ello se simplifica notablemente el proceso de sincronizar las seales para la exploracin vertical y
horizontal de la imagen, pues todas las seales se obtienen de una misma referencia. El inters de que
el nmero de lneas tenga una descomposicin en nmeros primos relativamente bajos radica en que
es mucho ms simple y fiable implementar divisores o multiplicadores de frecuencia cuando los
factores de incremento o reduccin son enteros bajos. En la prctica slo se utilizan divisores de
frecuencia por 2, 3, 5, 7 y raramente por 11 o por 13. En los sistemas de televisin americanos y
japoneses se utilizan 525 lneas que tambin tienen una descomposicin en nmeros primos con
caractersticas similares (525=3 5 5 7). En Francia se utiliz durante algn tiempo un sistema de
819 lneas (819=13 7 3 3). Este sistema ya no se usa, habiendo sido sustituido por un sistema
convencional de 625 lneas.

Tabla 1.2 Caractersticas bsicas de los sistemas 525/60 y 625/50

IMAG/S CAMP/S LINEAS/IMAG TLINEA FLNEA TIMAGEN FIMAGEN TCAMPO FCAMPO
PAL 25 50 625 64 s 15625 Hz 40 ms 25 Hz 20 ms 50 Hz
NTSC 30 60 525 63,49 s 15750 Hz 33,33 ms 30 Hz 16,66 ms 60 Hz

En la tabla 1.2 se proporcionan los valores de frecuencia de cuadro, campo y lnea para los sistemas
europeo y americano. Estos valores son parmetros fundamentales de la seal de TV que conviene
recordar en todo momento.

1.8.7 Nmero de lneas en los sistemas de alta definicin
El nmero de lneas de los diversos sistemas de alta definicin que se estn proponiendo o que ya
estn operativos en algunos pases utilizan un nmero de lneas que, por regla general, es el doble del
que utilizan los sistemas de definicin convencional. El objetivo bsico de doblar el nmero de lneas
es acercar el espectador a la pantalla para integrarlo ms en la escena. Evidentemente, no tendra
sentido doblar el nmero de lneas si el espectador hubiera de mantenerse a la misma distancia del
televisor, ya que los sistemas de definicin convencional estn diseados para que el nmero de lneas
est de acuerdo con la agudeza del sistema visual. Si situamos a un espectador delante de una pantalla
de televisin a una distancia de unas 7 veces la altura de la pantalla, ste sera, en principio, incapaz de
apreciar ninguna diferencia si se utilizan 625 o 1250 lneas.

En los sistemas de alta definicin se pretende que el espectador perciba una mayor sensacin de
realismo en la escena aumentando el campo visual que ocupa la pantalla. Hemos visto que en un
sistema de definicin convencional, si se observa desde la distancia apropiada, el ngulo de
observacin vertical es de 8,57. Anlogamente, podramos calcular el ngulo de observacin
horizontal que, dado que la relacin de aspecto es de 4:3, sera de 11,42. As pues, en estos sistemas,
la pantalla cubre slo una pequea porcin del campo visual, por lo que el espectador es consciente
del medio de representacin y la escena pierde parte del realismo que se obtendra con un sistema que
cubriera un mayor ngulo de visin, como por ejemplo ocurre con el cine.

Al doblar el nmero de lneas podemos acercar el espectador a la pantalla doblando, en consecuencia,
su ngulo de visin vertical a unos 17. Adems, al usar una relacin de aspecto con mayor
panormica, 16:9, obtendremos un ngulo de visin horizontal de aproximadamente 30. Esta relacin
de ngulos de visin de la escena se adapta mejor al campo visual humano y, aunque slo representa
un 20 % de campo real, cubre la regin donde se concentra la mayor parte de informacin captada por
el sistema visual.

Es importante no confundir esta filosofa para la integracin del espectador en la escena usada en los
sistemas de alta definicin con algunos formatos de televisin, como el PALplus, en el que se utilizan
relaciones de aspecto de 16:9. En este caso, el nmero de lneas sigue siendo del mismo orden que en
los sistemas de definicin convencional, por lo que el espectador debe permanecer a una distancia
aproximada de 7 veces la altura de la pantalla. Por tanto, estos sistemas si bien aumentan el ngulo de
visin horizontal a unos 15, mantienen el mismo ngulo de visin vertical, por lo que la mejora no es
tan significativa.

1.8.8 Entrelazado de las imgenes
Hemos visto que para evitar el parpadeo de la pantalla es necesario aumentar la frecuencia de
presentacin de imgenes en el receptor. Una frecuencia de 25 imgenes por segundo resulta
insuficiente, con los niveles de brillo existentes en la pantalla de un televisor, para evitar el parpadeo.
La solucin adoptada consiste en realizar una doble exploracin entrelazada de las lneas de cada
imagen tal y como se representa en la figura 1.64. La imagen se divide en dos subimgenes o campos
explorando alternativamente las lneas pares y las impares. La proximidad entre lneas consecutivas
hace que el espectador integre las dos subimgenes y obtenga la sensacin de que stas se estn
renovando a una frecuencia doble de la real. Con ello se consigue mantener un caudal de informacin
reducido, suficiente para interpolar correctamente el movimiento sin que aparezca el fenmeno de
parpadeo.

Fig. 1.64 Divisin de la imagen en dos campos entrelazados

La necesidad de entrelazar las imgenes supone tener que modificar la estructura de la seal respecto
al diagrama que hemos esbozado en la figura 1.56, ya que las lneas debern transmitirse
alternadamente y en el mismo orden en que se realiza la exploracin del haz en la pantalla en el
receptor.

La transmisin secuencial de las lneas sugerida en la figura 1.56 slo puede usarse en sistemas de
vdeo que no utilizan el entrelazado de los dos campos. Estos sistemas se conocen como sistemas
progresivos o tambin como sistemas con una relacin de entrelazado 1:1 (1imagen, 1 campo). Si bien
la exploracin progresiva no se utiliza en los sistemas actuales de televisin comercial, su uso es
habitual en los monitores de ordenador. En este caso utiliza una frecuencia de imagen bastante ms
elevada que en televisin (72-90 Hz), por lo que no es necesario descomponer las imgenes en dos
campos para evitar el parpadeo. La ventaja principal es que se eliminan todos los problemas de
inestabilidad de la imagen que se producen con el entrelazado de los dos campos y que impediran una
cmoda lectura de los caracteres escritos que se presentan en un ordenador. El ancho de banda
asociado a la seal de vdeo es evidentemente mayor que en un sistema entrelazado aunque, como no
debe transmitirse, esto no supone una restriccin importante. La exploracin progresiva se ha
considerado para futuros sistemas de televisin digital, aunque su implantacin definitiva no ser
fcil, ya que todos los receptores de televisin actuales estn basados en sistemas entrelazados.

Para obtener una presentacin entrelazada de los dos campos con la tecnologa actual, sera posible
transmitir las lneas secuencialmente, almacenndolas en una memoria en el receptor, para
posteriormente presentarlas de forma alternada en la pantalla. Sin embargo, cuando se desarrollaron
los primeros sistemas de televisin era tecnolgicamente imposible almacenar parte de la seal en el
receptor, por lo que la seal transmitida deba adecuarse a las caractersticas de exploracin propias
del sistema de presentacin de imgenes. Por todo ello, es necesario que la seal de vdeo est
+ =
Campo
A
Campo
B
Imagen
completa
+ =
Campo
A
Campo
B
Imagen
completa
dividida en dos partes, que se corresponden con cada uno de los campos y en las que se transmiten
primero todas las lneas impares y despus, todas las pares. Con ello, la informacin se transmite en el
mismo orden en que se realiza la exploracin, por lo que la seal puede aplicarse directamente al tubo
de rayos catdicos siempre que el sistema de barrido del haz est correctamente sincronizado con la
trama de vdeo. Esta nueva estructura se representa en la figura 1.65, donde se indica explcitamente el
nmero de lnea de pantalla que se corresponde con cada componente de la seal. En la prctica, las
lneas de la seal de vdeo suelen numerarse atendiendo a su posicin en la trama de seal y no a su
posicin en la pantalla. Esto se indica en la misma figura 1.65 manteniendo, por el momento, una
notacin distinta para cada tipo de numeracin. En el futuro, mientras no se haga una referencia
explcita a la numeracin, entenderemos que las lneas estn numeradas secuencialmente atendiendo a
su posicin en la trama de seal.

Fig. 1.65 Intercalacin de las lneas en la seal de vdeo para el entrelazado de la imagen

Para un obtener un correcto entrelazado de los dos campos es necesario disponer de seales que
controlen con precisin el desvo del haz en el tubo de rayos catdicos. Para ello se utilizan dos
seales en forma de diente de sierra, cuya generacin requiere circuitos muy simples, que controlan la
desviacin del haz en sentido horizontal y vertical. La necesidad de que estas seales pudieran
generarse fcilmente en el receptor condicion, en el momento de definir el formato de la seal, que el
nmero de lneas de cada imagen fuera impar, ya que de este modo puede realizarse un cambio del
campo sin interrumpir la periodicidad de las seales de barrido. En efecto, cada vez que se produce un
salto de lnea en la exploracin de la pantalla, la seal de barrido horizontal debe producir un cambio
de nivel desde su valor mnimo al mximo. Durante la exploracin de la lnea el nivel de la seal debe
variar linealmente entre estos dos valores. Anlogamente, la seal de barrido vertical evoluciona
linealmente entre su valor mximo y mnimo durante la exploracin de un campo y se reinicializa a su
valor mximo cada vez que se empieza a explorar uno nuevo. De acuerdo con esta filosofa, si el
nmero de lneas de la imagen es impar, cada campo tendr asignadas un determinado nmero de
lneas completas ms media lnea adicional. Con ello, tal y como se indica en la figura 1.66, cada vez
L1 L5 L3 L4 L2
t
Nivel
gris
L1 L3
Campo A
Impar
Imagen M Imagen M+1
Campo A
Par
M1 M2 M3 MK M1
Nmero de lnea: posicin en la pantalla
Nmero de lnea
L1 L5 L3 L4 L2
t
Nivel
gris
L1 L3
Campo A
Impar
Imagen M Imagen M+1
Campo A
Par
M1 M2 M3 MK M1
Nmero de lnea: posicin en la pantalla
Nmero de lnea
que se produce un cambio de campo, la seal de barrido horizontal puede seguir manteniendo su
estructura peridica, continuando la exploracin de la pantalla a partir de la mitad de la lnea cuando
la transicin es entre un campo impar y uno par, o iniciando la exploracin de una nueva lnea cuando
se trata de una transicin entre campo par e impar.

Fig. 1.66 La seal de barrido horizontal mantiene su estructura peridica en las transiciones

Fig. 1.67 Discontinuidades en el barrido horizontal para un nmero par de lneas
Ultima lnea campo impar
Primera lnea campo par
Seal de barrido horizontal
Ultima lnea campo par
Primera lnea campo impar
Transicin campo impar a par Transicin campo par a impar
Ultima lnea campo impar
Primera lnea campo par
Ultima lnea campo par
Primera lnea campo impar
Transicin campo impar a par Transicin campo par a impar
Primera Lnea Campo 1
ltima Lnea Campo 1
ltima Lnea Campo 2
Transicin Campo 1 - Campo 2
ltima Lnea Campo 1
ltima Lnea Campo 2
Transicin Campo 1 - Campo 2
Esta estructura simplifica notablemente la sntesis de las seales de barrido, ya que si el nmero de
lneas fuera par sera necesario resituar la seal de barrido horizontal cada vez que se iniciara un
nuevo campo alterando su patrn de periodicidad. En la figura 1.67 se representa cmo deberan
entrelazarse los campos en el caso en que el nmero de lneas fuera par, observndose claramente la
prdida de periodicidad en el posicionamiento horizontal del haz. En este ejemplo hemos supuesto que
la primera lnea del campo impar inicia su recorrido con 1/3 de la posicin horizontal, mientras que la
primera lnea del campo par la inicia en 2/3 del extremo horizontal. Con ello, ambos campos podran
quedar perfectamente imbricados. El problema, como se observa en el dibujo, es que la ltima lnea
del campo impar finaliza en la misma posicin horizontal en que ha empezado el campo, por lo que
debe producirse un salto de posicin horizontal antes de iniciarse el segundo campo.

1.8.9 Problemas derivados del entrelazado de imgenes
El entrelazado de los dos campos permite reducir a un nivel aceptable el parpadeo de la pantalla,
aunque introduce, aun en el caso ideal en que no se produzca ningn desalineamiento de los haces
durante la exploracin, cierta degradacin sobre la calidad de las imgenes. Los efectos ms
conocidos son la aparicin de los denominados vibracin interlnea (interline twiter) y arrastre de
lnea (line crawl). El primero aparece en los contornos horizontales de imgenes estacionarias como
una pequea vibracin en sentido vertical del contorno debido a que en cada campo ste se representa
en una posicin vertical ligeramente distinta. El efecto de arrastre de lnea produce la apariencia de
que las lneas se desplazan verticalmente en la pantalla, debido a que cada campo se presenta al
espectador en instantes de tiempo distintos lo que puede inducir, para algunas imgenes, la sensacin
de que los contornos se desplazan en sentido vertical, cuando en realidad la imagen permanece
estacionaria.

Otro problema directamente relacionado con el entrelazado de las imgenes es el denominado efecto
Kell, que reduce la resolucin de las imgenes por debajo de lo que a priori podramos estimar
teniendo en cuenta el nmero de lneas. Describiremos este efecto, desde un punto de vista cualitativo,
en los siguientes apartados.

1.8.10 Insercin de seales de sincronismo en la seal de vdeo
Es evidente que la estructura de la seal de vdeo, con el entrelazado de los dos campos, exige que el
receptor mantenga un perfecto sincronismo entre la exploracin de la pantalla y la informacin
transmitida. Por ello, la seal propia seal de vdeo incorpora informacin sobre el inicio de cada lnea
y de cada campo. Estas componentes, convenientemente decodificadas, permiten garantizar que los
circuitos que generan las seales de desvo horizontal y vertical del haz se mantengan en perfecta
concordancia con la seal transmitida.

La insercin de sealizacin especfica para identificar el inicio de las lneas y los campos impone que
parte del tiempo, que en principio podra asignarse a informacin de imagen, deba utilizarse para estos
sincronismos. Esto significa que slo una parte del periodo de lnea y de campo se dedicarn a
informacin correspondiente a la escena, dejando el resto para incluir las seales de sincronismo. La
parte del tiempo de lnea dedicada a transmitir la luminancia se denomina lnea activa. Anlogamente,
la parte del tiempo de campo que se dedica a transmitir lneas con informacin de vdeo se denomina
campo activo. En la figura 1.68 se representa esquemticamente la filosofa general para la
transmisin de los sincronismos.

Fig. 1.68 Insercin de las seales de sincronismo en la estructura de la seal de TV

En el estndar de televisin europeo de 625 lneas y 25 imgenes por segundo, el tiempo de lnea es de
64 s, de los cuales 12 s se dedican a la seal de sincronismo, quedando los 52 s restantes para la
imagen. La parte asignada al sincronismo, cuyo contenido analizaremos en el siguiente captulo,
permite reinicializar los circuitos de generacin de seal de barrido horizontal cada vez que llega una
nueva lnea. El tiempo que transcurre entre el final de la parte activa de una lnea y el inicio de la
siguiente se utiliza para desplazar el haz desde la parte derecha de la pantalla al extremo izquierdo. Es
importante que durante este tiempo, la seal aplicada al tubo sea nula, pues en caso contrario el
retorno del haz se hara visible.

Para enviar el sincronismo de campo, se utilizan varias lneas consecutivas en las que se transmite una
seal fcilmente separable tanto de la informacin de imagen como de los sincronismos de lnea. En
los sistemas europeos analgicos, el sincronismo de campo se transmite aprovechando 25 lneas no
activas que se definen entre cada campo. Estas lneas se aprovechan adems para que el haz retorne
del extremo derecho inferior de la pantalla al extremo izquierdo superior y para transmitir informacin
de teletexto o seales de prueba que se utilizan para comprobar la correcta recepcin de la seal en
distintos puntos del rea de distribucin. Dejaremos los detalles de las formas de onda de todas estas
componentes para el captulo siguiente.

Debemos observar que buena parte del tiempo en la seal de televisin analgica se dedica a la
transmisin de sincronismos e informacin adicional que no se corresponde directamente con la
0 12 64
t ( s)
Sync.
lnea
luminancia
t
M1 M2 M3
Seal vdeo
Campo A
Impar
Imagen M Imagen M+1
Campo A
Par
M313 M1 M312
25 lneas
No activas
25 lneas
No activas
M625
0 12 64
t ( s)
Sync.
lnea
luminancia
t
M1 M2 M3
Seal vdeo
Campo A
Impar
Imagen M Imagen M+1
Campo A
Par
M313 M1 M312
25 lneas
No activas
25 lneas
No activas
M625
t
M1 M2 M3
Seal vdeo
Campo A
Impar
Imagen M Imagen M+1
Campo A
Par
M313 M1 M312
25 lneas
No activas
25 lneas
No activas
M625
Seal vdeo
Campo A
Impar
Imagen M Imagen M+1
Campo A
Par
M313 M1 M312
25 lneas
No activas
25 lneas
No activas
M625
escena. En efecto, de las 625 lneas de una imagen slo 575 son activas, por cuanto cada campo
dispone de 25 lneas reservadas para sincronismos, servicios de valor aadido como el teletexto o
informacin de control. Adems, slo un 81 % del tiempo de lnea se dedica a la parte activa. Esto
significa que aproximadamente un 25 % del tiempo de la seal se dedica a transmitir informacin que
no se corresponde directamente con la imagen.

1.8.11 Exploracin entrelazada de las imgenes en la cmara
Tal y como hemos planteado el muestreo temporal y espacial de las imgenes, todas las lneas
correspondientes a un mismo cuadro o imagen deberan corresponder al mismo instante de tiempo. El
proceso de lectura de las lneas debera realizarse una vez la imagen ha sido adquirida o memorizada
en algn dispositivo sensor. La exploracin de la seal obtenida en el sensor podra realizarse
entrelazando las lneas, siguiendo el mismo orden en que deben transmitirse en la seal de vdeo.

Sin embargo, esta filosofa slo se utiliza en algunos sensores de imagen de estado slido modernos.
En los tubos de cmara, la escena se expone al sensor durante un tiempo igual o inferior a la duracin
de un campo. La carga elctrica almacenada durante este tiempo de exposicin constituye la
informacin que se transmitir como uno de los campos. Posteriormente, la imagen vuelve a
exponerse durante otro periodo de tiempo igual, obteniendo la informacin asociada al segundo
campo. Con ello, las lneas correspondientes al campo par y al impar no se corresponden con la misma
imagen, sino con imgenes tomadas con una diferencia de tiempos igual al periodo de campo. La
razn de aplicar esta estrategia de exploracin a los tubos de imagen es que la carga del sensor,
despus de su exposicin a la luz, se reduce con el tiempo, por lo que, si mantuviramos la carga
durante todo el tiempo de cuadro, sera perceptible esta prdida de carga en las ltimas lneas. Por otra
parte, de este modo, la exploracin entrelazada de la imagen en la cmara se corresponde directamente
con el entrelazado de los dos campos en la pantalla del televisor.

La mayora de cmaras de vdeo actuales, basadas en sensores de estado slido, utilizan una filosofa
parecida exponiendo el sensor durante un tiempo determinado y construyendo la seal de uno de los
campos a partir de las seales almacenadas. Normalmente la seal del campo A se obtiene como el
promedio entre los pares de lneas (1, 2), (3, 4), (5, 6), etc; mientras que las del campo B se obtiene
promediando los pares (2, 3), (4, 5), (6, 7), etc. Una vez construida la seal de uno de los campos, se
anula la carga del sensor y se realiza la adquisicin de la imagen para el otro campo. Con esta
tecnologa, las imgenes de cada uno de los campos corresponden a instantes de muestreo distintos. El
efecto es muy notorio cuando existen objetos con movimiento horizontal en la escena. Si detenemos la
reproduccin de la secuencia en una imagen, veremos que los objetos en movimiento aparecen con
dos contornos diferentes, que corresponden a las posiciones que tenan en cada uno de los campos.
Generalmente, esto produce un efecto de serrado del contorno que slo resulta molesto cuando se
detiene la secuencia de vdeo para realizar el anlisis de un fotograma. En modo de reproduccin
normal, la resolucin del sistema visual de los objetos con movimiento es menor que la de los objetos
estticos por lo que, normalmente, no se aprecia la falta de definicin en el contorno.

Existen algunos modelos de cmaras, denominadas cmaras progresivas, que realizan la adquisicin
de todas las lneas de la imagen en un nico instante de muestreo. En principio estas cmaras estn
pensadas para aplicaciones de reconocimiento de imagen en escenas donde los objetos pueden tener
un movimiento considerable. Este tipo de cmaras tambin se pueden combinar con unidades de
memoria dinmica para construir la seal entrelazada a partir de la informacin recogida. Con ello, se
pueden obtener seales entrelazadas en las que los dos campos corresponden al mismo instante de
muestreo. Otro caso en el que la informacin de los dos campos proviene del mismo instante de
muestreo es en la conversin de formatos entre cine y televisin, donde cada fotograma original se
explora dos veces para obtener la seal de cada uno de los campos.

1.8.12 Receptores de 100 Hz
Aunque el entrelazado de los dos campos permite reducir el parpadeo a niveles aceptables, an es
perceptible, sobre todo en regiones uniformes de la imagen con rea considerable y que tienen nivel
de brillo elevado. Los modernos receptores digitales permiten aumentar la frecuencia de exploracin
del haz hasta 100 Hz. La idea bsica consiste en digitalizar los dos campos de la imagen y
almacenarlos en una memoria antes de presentar la informacin en la pantalla. Los subsistemas de
exploracin de la pantalla y digitalizacin de campos operan en paralelo, de modo que mientras se
recibe el campo par, se va actualizando la memoria de imagen asociada a este campo y
simultneamente se presenta en la pantalla la informacin correspondiente al campo impar obtenida
previamente.

El barrido de los campos se realiza a una velocidad doble de la normal, de modo que cada exploracin
dura 10 ms en vez de los 20 ms asignados en un receptor convencional. Esto permite presentar dos
veces la informacin almacenada en la memoria, aumentando la frecuencia de actualizacin de la
pantalla a 100 Hz, con la consiguiente reduccin en el parpadeo de la imagen. La secuencia de
digitalizacin y presentacin de las seales se representa en la figura 1.69.

Fig. 1.69 Principio de funcionamiento de los receptores de 100 Hz
0 10 20 30 40 10 20 30 40 10
AK BK AK+1 BK+1 AK+2
AK BK AK+1 BK+1
BK-1 BK-1 AK AK BK BK AK+1 AK+1 BK+1
Seal recibida
Campos
Digitalizados
Secuencia de Imgenes
presentadas
0 10 20 30 40 10 20 30 40 10
AK AK BK BK AK+1 AK+1 BK+1 BK+1 AK+2 AK+2
AK AK BK BK AK+1 AK+1 BK+1 BK+1
BK-1 BK-1 BK-1 BK-1 AK AK AK AK BK BK BK BK AK+1 AK+1 AK+1 AK+1 BK+1 BK+1
Seal recibida
Campos
Digitalizados
presentadas
Esta nueva frecuencia de refresco de la pantalla elimina prcticamente el problema del parpadeo que
aparece en las grandes reas de la pantalla que tienen un nivel de brillo considerable. Sin embargo, los
problemas de vibracin interlnea y arrastre de lnea se mantienen por cuanto la informacin de campo
se sigue actualizando, como en un receptor convencional, cada 50 Hz. Una alternativa que mejora
notablemente estos efectos son los receptores denominados Digital Scan, que son una variante del
sistema 100 Hz. La secuencia de digitalizacin y presentacin de las imgenes en estos receptores se
representa en la figura 1.70. En este caso, debemos disponer de un buffer de memoria que permita
almacenar los dos campos asociados a una imagen mientras el sistema de barrido intercala, con
frecuencia de exploracin doble, los campos correspondientes a la imagen anterior. La diferencia con
el sistema 100 Hz es que los campos, aunque se repiten, se actualizan a una frecuencia real de 100 Hz,
desapareciendo los efectos de vibracin de los contornos horizontales de la imagen.

Fig. 1.70 Principio de funcionamiento del sistema Digital Scan

Podra pensarse que una posible mejora de estos sistemas consiste en almacenar los dos campos de la
imagen en una misma memoria para posteriormente realizar una presentacin de toda la imagen con
un sistema progresivo, como en un monitor de ordenador. Las imgenes seguiran transmitindose a
25 Hz, pero podramos presentarlas 2, 3 o 4 veces en pantalla para eliminar completamente el
parpadeo. Todo ello sin que aparecieran los problemas de inestabilidad de imagen, propios de un
sistema de presentacin entrelazado. Con la tecnologa de monitores y memorias digitales actuales
esta solucin sera factible, de manera que el paralelismo con el sistema utilizado en cine sera
entonces completo. Sin embargo, el problema es ahora el tipo de exploracin realizado en la cmara
en la que los dos campos ya no se corresponden con una misma imagen, por lo que mantendramos
todos los problemas propios del entrelazado realizado en origen.
0 10 20 30 40 10 20 30 40 10
AK BK AK+1 BK+1 AK+2
AK BK AK+1 BK+1
AK-1 BK-1 AK-1 BK-1 AK BK AK BK AK+1
Seal recibida
Campos
Digitalizados
presentadas
0 10 20 30 40 10 20 30 40 10
AK AK BK BK AK+1 AK+1 BK+1 BK+1 AK+2 AK+2
AK AK BK BK AK+1 AK+1 BK+1 BK+1
AK-1 AK-1 BK-1 BK-1 AK-1 AK-1 BK-1 BK-1 AK AK BK BK AK AK BK BK AK+1 AK+1
Seal recibida
Campos
Digitalizados
presentadas

Normalmente, los receptores que incluyen alguna de las variantes que hemos descrito para aumentar
la frecuencia de refresco tambin incorporan algn tipo de filtro digital que permite mejorar la calidad
de las imgenes cuando las condiciones de recepcin de la seal no son las adecuadas. El hecho de
disponer de las muestras de los dos campos de la imagen en la memoria del receptor permite aplicar
sencillas operaciones digitales que pueden eliminar algunos tipos de ruido presentes en la seal. La
operacin ms habitual consiste en identificar zonas de la imagen que tienen un nivel o color uniforme
y sustituir con su valor medio aquellas muestras aisladas que presenten un valor muy distinto a ste
valor medio. Con ello se consigue eliminar los habituales picos que aparecen y desaparecen de manera
errtica en la pantalla cuando el nivel de seal es bajo o cuando se reproduce una seal procedente de
una cinta de vdeo vieja o de mala calidad.

Recientemente han aparecido receptores que utilizan las imgenes almacenadas en memoria para
realizar una interpolacin de lneas inteligente. Estos receptores, aparte de aumentar el nmero de
lneas con el que se realiza la exploracin, aplican tcnicas de tratamiento digital de imagen para
reducir los efectos de vibracin interlnea.

La memoria digital tambin suele aprovecharse para poder reproducir en la pantalla varios canales
simultneamente. El principio de funcionamiento de estos sistemas consiste en demodular y digitalizar
dos o ms canales, almacenando sus muestras en las direcciones de memoria adecuadas para que el
sistema de exploracin de imgenes las site automticamente sobre la pantalla. Normalmente esta
opcin se utiliza como canal en espera, por lo que la imagen secundaria, que slo ocupa una pequea
porcin de la pantalla, puede muestrearse a menor velocidad que el canal principal.

1.8.13 Ancho de banda aproximado de la seal de televisin
En este apartado realizaremos diversas consideraciones sobre el ancho de banda de la seal de
televisin en blanco y negro. Evidentemente, el ancho de banda de esta seal est directamente
relacionado con las variaciones de nivel que se producen en la luminancia. Cambios bruscos en la
luminancia, que se corresponden con contornos verticales en la imagen, exigen la presencia de
componentes de alta frecuencia, mientras que las regiones uniformes sern codificadas con un nivel
constante de la seal, por lo que son las responsables de la existencia de componentes continuas.

Es obvio, por tanto, que el ancho de banda depende de las caractersticas de la imagen y que variar en
funcin de sta. En general, cuando hablamos del ancho de banda de la seal interpretaremos que nos
referimos al valor mnimo necesario para que puedan transmitirse todo tipo de imgenes con una
calidad aceptable. Un sistema con un ancho de banda reducido limita la presencia de cambios de nivel
bruscos en la seal, por lo que, probablemente, los contornos de la imagen no quedarn bien definidos.
El ancho de banda adecuado es por tanto un compromiso entre la eficiencia espectral del sistema de
comunicaciones y la calidad con que pueden reproducirse las imgenes.

Para tener una primera idea sobre el orden de magnitud del ancho de banda, consideremos cul es la
frecuencia mxima que tiene sentido transmitir para imgenes estacionarias. Evidentemente, si la
imagen a transmitir tuviera un nivel de gris uniforme, la luminancia tendra un valor constante en
todas las lneas, por lo que la seal slo contendra componente continua. Si la imagen que
transmitimos est formada por barras negras y blancas en sentido vertical, la luminancia deber tomar
sus valores extremos a lo largo de una lnea, con lo que su frecuencia estar directamente relacionada
con el nmero de barras verticales, tal y como se ilustra en la figura 1.71.

Fig. 1.71 Seal de luminancia asociada a una imagen formada por barras verticales

La relacin entre la frecuencia fundamental de esta seal, el nmero de barras y el periodo de lnea
viene dada por:

Lnea
V
V Lnea
T
N
N T T
f

2 ) 2 / /(
1 1
0
0
(1.68)

que indica que esta frecuencia fundamental aumenta de manera proporcional con el nmero de barras
verticales. La aparicin del factor 2 es debida a que un ciclo de la seal de luminancia se corresponde
con una barra negra ms una blanca. En principio el periodo de lnea que deberamos utilizar en esta
expresin debera ser el tiempo de lnea activa, por cuanto todas las barras deben codificarse en este
fragmento de la lnea. Sin embargo, como nicamente se trata de un clculo aproximado del ancho de
banda, normalmente se utiliza el tiempo de lnea total.

Para estimar el valor mximo que puede tomar la frecuencia de esta seal deberemos considerar cul
es el nmero mximo de barras que tiene sentido representar en la pantalla del receptor. Es obvio que
este parmetro est relacionado con la agudeza del sistema visual, que ya hemos utilizado para
calcular el nmero de lneas de la imagen. Como la agudeza visual es igual en la direccin vertical que
en la horizontal (es algo ms reducida en el sentido diagonal), podemos expresar el nmero mximo
de barras verticales en funcin del nmero de lneas en que hemos dividido la imagen. En efecto, el
nmero mximo de barras horizontales que tericamente podran representarse en una pantalla sera
igual al nmero de lneas del sistema de televisin. Para ello, deberamos alternar el valor de la
luminancia entre su valor mximo y mnimo entre cada lnea.

Imagen de barras
verticales
N
V
barras
Nivel luminancia
en una lnea
t
T
Lnea
Imagen de barras
verticales
N
V
barras
Nivel luminancia
en una lnea
t
T
Lnea
Por otra parte, debemos tener en cuenta que la pantalla tiene una relacin de aspecto distinta de la
unidad por lo que, manteniendo la densidad de barras constante, el nmero de barras verticales ser
mayor que el nmero de lneas en un factor igual al de la relacin de aspecto. Por tanto obtenemos:

L V
N
H
W
N
max
(1.69)

Nuevamente, N
L
debera ser el nmero de lneas activas, aunque normalmente se sustituir por el
nmero total de lneas, ya que slo se trata de una primera aproximacin al problema.

Sustituyendo esta ltima expresin en la ecuacin 1.68 obtenemos:

Lnea
L
T
N
L
W
f
2
1
max 0
(1.70)

Podemos expresar el tiempo de lnea en funcin del nmero de lneas y de la frecuencia de
actualizacin de imgenes (f
I
), con lo que obtendremos la expresin de esta frecuencia mxima en
funcin de los parmetros bsicos de un sistema de televisin.

I L
f N
L
W
f
2
max 0
2
1
(1.71)

El valor de esta frecuencia para un sistema de 25 imgenes por segundo, 625 lneas y una relacin de
aspecto 4:3 es de aproximadamente 6.5 MHz. En el caso del estndar americano de 30 imgenes por
segundo y 525 lneas, se reduce a unos 5.5 MHz, mientras que para un hipottico sistema de alta
definicin analgico con 1250 lneas, 50 imgenes por segundo y relacin de aspecto 16:9, tomara un
valor aproximado de unos 70 MHz. En este clculo aproximado, debemos tener en cuenta que
nicamente consideramos la frecuencia fundamental de la seal, ya que al tratarse de una seal
cuadrada tendr armnicos con un contenido frecuencial importante.

Sin embargo, el valor obtenido mediante la ecuacin 1.71 suele considerarse como una cota superior
del ancho de banda requerido por un sistema de televisin, ya que la seal que hemos considerado
constituye un caso extremo que raramente se produce en escenas reales. Adems, no hemos tenido en
cuenta algunos problemas relacionados con el entrelazado de las imgenes que afectan a la resolucin
del sistema y que impediran representar una imagen con estas caractersticas.

R.D. Kell analiz en 1934 la resolucin vertical que poda obtenerse con un sistema de televisin
experimental, estableciendo que no era posible representar un nmero de barras horizontales igual al
nmero de lneas, debido, por una parte, a un problema de interferencia intrnseco al entrelazado de
las imgenes, y por otra, a la propia limitacin de la resolucin en el monitor. La experiencia de Kell
consisti en representar sobre un sistema de televisin de 100 lneas (50 lneas por campo) una
alternancia entre lneas blancas y negras (barras horizontales), intentando determinar el nmero
mximo de barras que podan visualizarse. En principio, el resultado que esperaramos sera de unas
100 barras, que corresponde con una seal en la que todas las lneas del campo par son blancas y las
del campo impar negras. Sin embargo, al presentar esta seal se obtiene una imagen gris uniforme en
la que no pueden distinguirse las barras horizontales. De hecho, para poder observar la presencia de
las barras es necesario reducir su nmero a unas 64.

Una de las razones de esta limitacin es que el haz de exploracin de la pantalla no es puntual, sino
que tiene un grosor finito, lo que produce cierto grado de superposicin entre lneas adyacentes,
limitando la resolucin del monitor. Este factor puede reducirse notablemente con los sistemas de
enfoque electrnico del haz actuales.

El otro factor responsable de la reduccin de resolucin respecto a su valor esperado se debe a la
propia estrategia de muestreo de la imagen que hemos utilizado como consecuencia directa de querer
entrelazar los dos campos. La resolucin vertical de la imagen se reduce debido a que el muestreo de
la imagen en dos campos introduce repeticiones peridicas del espectro que se superponen con las
componentes visibles, impidiendo representar seales de elevada frecuencia.

El problema es parecido al que se produce al muestrear seales unidimensionales con una frecuencia
inferior al doble del ancho de banda. En este caso, el muestreo supone la repeticin peridica del
espectro de la seal analgica en mltiplos de la frecuencia de muestreo. Si esta frecuencia no es lo
suficientemente elevada, el espectro original se superpone con las repeticiones peridicas provocando
el fenmeno del aliasing. La reduccin de la resolucin vertical observada en el efecto Kell tiene un
origen parecido, aunque en este caso debe considerarse el muestreo de funciones de varias variables.

La intercalacin de dos campos, uno con lneas blancas y otro con lneas negras, podra ser
interpretada de diversas maneras por el observador, constituyendo un claro ejemplo de aliasing. As,
una posible interpretacin de la seal presentada en la pantalla es que la secuencia obtenida
corresponde a una imagen estacionaria formada por lneas blancas y negras alternadas. Otra posible
interpretacin, coherente con la imagen percibida por el espectador, es que se trata de una imagen
intermitente que pasa de ser completamente blanca a completamente negra con una frecuencia igual a
la de cuadro. Finalmente, tambin es posible interpretar que se trata de una imagen formada por lneas
horizontales blancas que, sobre un fondo negro, se desplazan en sentido vertical. Esta diversidad de
posibles interpretaciones sobre el origen de la imagen indica la existencia de un fenmeno de aliasing,
ocasionado por la propia estrategia de muestreo de la escena, que el sistema visual interpreta de la
manera ms plausible integrando toda la informacin para obtener una imagen aparentemente gris.

Es importante notar que este efecto desaparece cuando se utiliza un sistema de televisin con
exploracin progresiva, tanto en la cmara como en el display. En este caso las imgenes presentadas
al espectador cumplen exactamente con los principios de muestreo adaptados a las caractersticas del
sistema visual que originalmente habamos propuesto, por lo que no se produce la prdida de
resolucin vertical. Sin embargo, si slo realizamos la exploracin progresiva en uno de los
subsistemas de adquisicin o representacin de la imagen, manteniendo el entrelazado en el otro, el
efecto Kell no desaparece. Por ello, no tiene sentido utilizar un receptor que digitalice los dos campos
y realice una exploracin progresiva mientras se mantenga la exploracin entrelazada en la cmara.

El efecto Kell suele tenerse en cuenta en la expresin de la frecuencia mxima de la seal mediante la
introduccin de un factor multiplicativo K, que adapta la ecuacin 1.71 a la resolucin vertical real del
sistema:

Lnea
L
T
N
L
W
K f
2
1
max 0
(1.72)

El valor de la constante K depende del sistema de televisin y de las caractersticas del sistema de
exploracin de la cmara y del display. En el sistema de televisin de 100 lneas utilizado
originalmente por Kell tena un valor de 0.64. En general, para sistemas entrelazados suele estar
comprendido entre 0.8 y 0.6. En sistemas de exploracin progresiva puede considerarse, a efectos
prcticos, igual a la unidad. Con la introduccin del factor de Kell, la expresin de la frecuencia
mxima puede tomarse como una medida estimativa del ancho de banda requerido por un determinado
sistema.

El hecho de que el factor de Kell sea la unidad para sistemas de exploracin progresiva indica que no
es necesario doblar el ancho de banda de un sistema entrelazado para convertirlo en uno progresivo
que tenga la misma resolucin. En efecto, el nmero de lneas horizontales que pueden visualizarse en
el sistema entrelazado puede considerarse que es aproximadamente KN
L
, de modo que para obtener la
misma resolucin en un sistema progresivo podemos reducir el nmero de lneas del sistema en un
factor K sin prdida de resolucin aparente.

De todos modos, la expresin 1.72 slo debe utilizarse como una medida aproximada del ancho de
banda, ya que la imagen que hemos utilizado en su clculo no puede entenderse como una de las ms
probables a transmitir. En general, las imgenes suelen tener un gran contenido energtico en la regin
de baja frecuencia y poco contenido en alta frecuencia. Esto es as debido a que la informacin
correspondiente a alta frecuencia est concentrada en los contornos, mientras que la de baja frecuencia
corresponde a las regiones con niveles uniformes. Es evidente que la proporcin entre las zonas de la
imagen que corresponden a un contorno y las que corresponden a una regin uniforme es muy
favorable a estas ltimas.

Fig. 1.72 Valoracin subjetiva de la calidad de imagen en funcin del ancho de banda
2 3 4 5 6 7 8
4.9
4.5
4
3
2
1.5
2.5
Ancho de banda (MHz)
V
a
l
o
r
a
c
i
n

s
u
b
j
e
t
i
v
a

c
a
l
i
d
a
d

i
m
a
g
e
n

(
1
-
5
)
2 3 4 5 6 7 8
4.9
4.5
4
3
2
1.5
2.5
Ancho de banda (MHz)
V
a
l
o
r
a
c
i
n

s
u
b
j
e
t
i
v
a

c
a
l
i
d
a
d

i
m
a
g
e
n

(
1
-
5
)
El elemento determinante para seleccionar el ancho de banda de un sistema de televisin son las
pruebas subjetivas sobre la calidad de la imagen en funcin de la banda de la seal. En la figura 1.72
se representan las medidas de calidad efectuadas con un gran nmero de espectadores en funcin del
ancho de banda. Las pruebas fueron realizadas por el ITU-R (Comit Consultivo Internacional de
Radiocomunicaciones) y se utilizan como referencia para establecer la relacin entre el ancho de
banda de la seal y la calidad de la imagen. Las curvas se obtienen presentando al espectador seales
con distinto ancho de banda, valorando ste su calidad con una calificacin entre 5 (calidad ptima) y
1 (psima). De acuerdo con estos resultados, un ancho de banda de 5 MHz obtiene una valoracin
media superior al 4,5, lo que suele considerarse ms que suficiente para aplicaciones de televisin
comercial. En el estudio de televisin suele trabajarse con un ancho de banda superior para garantizar
que la calidad de la seal no se degrada en origen. Para tener una idea general sobre esta calificacin
subjetiva tngase en cuenta que la valoracin recibida por un sistema de vdeo domstico como el
VHS es de unos 2,5 puntos, lo que correspondera a seales de televisin de unos 2,5 MHz de ancho
de banda.

1.8.14 Resolucin y factor de resolucin en un sistema de televisin
La resolucin es un parmetro de los sistemas de televisin directamente relacionado con el ancho de
banda de la seal. Se define como el nmero de lneas verticales que pueden representarse en una
distancia igual a la altura de la pantalla. Esta definicin puede parecer un tanto retorcida pero, como
todo en televisin, tiene su justificacin. En la figura 1.73 se ilustra grficamente la interpretacin de
este parmetro.

La resolucin se mide como el nmero mximo de lneas verticales que pueden visualizarse en una
regin horizontal de la pantalla igual a su altura y siempre tiene un valor entero. Es evidente que la
resolucin est ligada al ancho de banda global de la cadena de televisin, ya que ste determinar,
como hemos visto, la frecuencia mxima que puede transmitirse por el canal y representarse en el
monitor. Por otra parte, tambin es evidente, aunque en general no se haga una referencia explcita en
el nombre del parmetro, que se trata de una medida de la resolucin slo en el sentido horizontal. La
resolucin en sentido vertical depende exclusivamente del nmero de lneas y del factor de Kell del
sistema, quedando completamente especificada con estos dos parmetros. El hecho de contabilizar
nicamente las lneas en una anchura igual a la altura de la pantalla se debe a que de este modo
pueden compararse directamente la resolucin en el sentido vertical y horizontal sin tener en cuenta la
relacin de aspecto.

El factor de resolucin se define como el cociente entre la resolucin y el ancho de banda utilizado
para transmitir la seal de barras verticales asociada.

W
B
R
resolucin de Factor FR ) (
(1.73)

donde R indica la resolucin (en nmero de lneas) y B
W
el ancho de banda. El factor de resolucin se
mide por tanto en lneas/Hz. Este parmetro es una constante que depende exclusivamente del sistema
de televisin y que establece una relacin directa entre el ancho de banda del canal y el nmero de
lneas verticales que pueden visualizarse en el receptor.

Fig. 1.73 La resolucin es el nmero de lneas verticales en una anchura igual a la altura.

Para expresar el factor de resolucin en funcin de los parmetros bsicos del sistema de televisin
consideremos un hipottico sistema en el que pueden llegar a visualizarse un mximo de N
H
lneas
verticales en la pantalla. La resolucin del sistema ser:

W
H
N R
H

(1.74)

donde H/W representa el inverso de la relacin de aspecto, ya que R se corresponde con las lneas que
pueden representarse en una anchura de la pantalla igual a la altura.

Por otra parte, el ancho de banda de una seal de vdeo de N
H
lneas verticales se corresponde con la
frecuencia mxima asociada a la seal de luminancia. El periodo de la seal puede calcularse como el
cociente entre el tiempo de lnea activo y el nmero de ciclos en una lnea (N
H
/2):

2 /
min
H
activa Lnea
N
T
T
(1.75)

Por lo que el ancho de banda de la seal ser:

activa Lnea
H
W
T
N
T
f B

2
1
min
max 0
(1.76)

Sustituyendo esta expresin en la ecuacin 1.73 obtenemos:
H
H
W
N Lneas = Resolucin
H
H
W
N Lneas = Resolucin

W
H
T FR
activa Lnea
2
(1.77)

Si sustituimos estos valores para un sistema de televisin, como el estndar europeo, con una relacin
de aspecto 4:3 y un tiempo de lnea activa de 52 s, obtenemos:

Hz lneas Hz lneas FR / 10 78 ) / ( ) 4 / 3 ( 10 52 2
6 6
(1.78)

lo que permite establecer una relacin lineal entre ancho de banda y resolucin horizontal. Cada MHz
adicional de ancho de banda proporciona aproximadamente 80 lneas de resolucin.

Esta relacin puede usarse como alternativa para estimar el ancho de banda necesario para la seal de
televisin. Para un sistema como el europeo, que utiliza un total de 625 lneas, de las cuales 575 son
activas y, suponiendo que el factor de Kell es del orden de 0.7, obtenemos una resolucin vertical de
aproximadamente 400 lneas. Es evidente que no tiene sentido que la resolucin horizontal sea
superior a la vertical, por cuanto la agudeza visual del ojo es la misma en ambas direcciones. Por lo
tanto, un ancho de banda aproximado de 5 MHz proporciona una resolucin horizontal comparable a
la vertical, por lo que es suficiente para una correcta recepcin de la seal.

Fig. 1.74 Imagen de prueba para estimar el ancho de banda

La resolucin horizontal proporciona un mtodo simple y directo para medir aproximadamente el
ancho de banda equivalente del conjunto formado por el transmisor, el canal y el receptor. Para ello
basta con transmitir una seal de prueba, constituida por distintas frecuencias, cuya imagen en pantalla
permite comprobar qu componentes se transmiten correctamente a travs del sistema. Esta seal
suele incorporarse en una zona de la carta de ajuste de la mayora de emisoras y tiene el aspecto
representado en la figura 1.74. La imagen corresponde a franjas de barras verticales de distinta
resolucin. Normalmente se utilizan 5 franjas con resoluciones de 80, 160, 240, 320 y 400, que se
corresponden aproximadamente con las frecuencias de 1, 2, 3 4 y 5 MHz. Si en la pantalla puede
apreciarse el detalle de las barras verticales en todos los fragmentos, el sistema tiene un ancho de
80 160 240 320 400
1 MHz 2 MHz 3 MHz 4 MHz 5 MHz
Resolucin
Ancho de banda
80 160 240 320 400
1 MHz 2 MHz 3 MHz 4 MHz 5 MHz
Resolucin
Ancho de banda
banda mnimo de 5 MHz. Por el contrario, si el fragmento correspondiente a una resolucin de 400
lneas se visualiza como gris, significa que esta componente ha sido filtrada por el sistema de manera
que el ancho de banda es inferior a los esperados 5 MHz. Anlogamente, si el fragmento
correspondiente a una resolucin de 320 lneas no se aprecia correctamente, significa que el ancho de
banda del sistema es inferior a los 4 MHz, etc.

En la figura 1.75 se representa una alternativa a esta carta de ajuste. En este caso el ancho de banda
puede estimarse directamente observando la posicin en la que las distintas lneas aparecen
superpuestas. Esta imagen suele estar tabulada para simplificar su lectura.

Un mtodo ms preciso para estimar el ancho de banda del sistema consiste en transmitir una nica
lnea de test que est formada por distintas frecuencias, previamente calibradas en el centro difusor,
con una estructura parecida a la de la imagen de la figura 1.74. No obstante, en este caso la seal de
test se transmite dentro de la estructura de la seal de televisin en una de las lneas no visibles. La
medida del ancho de banda se realiza mediante monitores de forma de onda que permiten visualizar
cmo se han degradado las distintas componentes frecuenciales en el punto de recepcin.

Fig. 1.75 Elemento de una carta de ajuste para estimar el ancho de banda del canal

1.8.15 Insercin de la informacin en color
Hasta el momento slo hemos considerado la transmisin de una seal en blanco y negro. La insercin
de la informacin de color puede realizarse de muy diversas maneras dependiendo del sistema de
codificacin del color empleado. Desde un punto de vista puramente conceptual, una posible
propuesta, basada en la misma filosofa que hemos utilizado en la ecuacin 1.60 para definir la seal
de luminancia, podra ser la de transmitir secuencialmente las tres componentes de color R,G,B para
cada una de las lneas en las que se ha dividido la imagen. De este modo, la ecuacin 1.60 se
generalizara:

K K ), ' , 1 ( ), ' , 1 ( ), ' , 1 ( ), ' , ( ), ' , ( ), ' , ( ,
) ( ) ( ) ( ) ( ) ( ) (
y m w y m w y m w y m w y m w y m w
k
FB
k
FG
k
FR
k
FB
k
FG
k
FR
+ + + (1.79)
1
2
3
4
5
1
0
0
2
0
0
3
0
0
4
0
0
5
0
0
1
2
3
4
5
1
0
0
2
0
0
3
0
0
4
0
0
5
0
0

Es decir, tal y como se ilustra en la figura 1.76, este hipottico sistema de televisin multiplexara las
tres componentes de color en el tiempo, transmitiendo por tanto toda la informacin de color asociada
a imagen.

Sin embargo, es evidente que no estamos ante una buena estrategia para la transmisin de la
informacin de color por cuanto, tal y como hemos visto en la seccin 1.4.6, siempre es recomendable
transmitir la luminancia y las seales diferencia de color, tanto para obtener sistemas compatibles
como para reducir el ancho de banda necesario para transmitir la informacin.

Fig. 1.76 Multiplexacin de las componentes de color

1.8.16 Sistemas de vdeo en componentes
No obstante, la generalizacin de esta idea, sustituyendo las componentes de color R,G,B por la
luminancia y las seales diferencia de color, constituye la base para la codificacin del color en los
denominados sistemas de componentes de color. Pertenecen a esta categora distintos sistemas de
televisin y de registro de seal de vdeo en soporte magntico. Entre estos sistemas debe destacarse
el MUSE, sistema de alta definicin analgico japons operativo desde finales de los 80; el D2-MAC,
tentativa europea para la definicin de un formato analgico con definicin mejorada que finalmente
fue abandonado; la norma digital 4:2:2, sistema digital para el registro, produccin e intercambio de
material entre estudios; sistemas de registro de seal sobre soporte magntico analgicos como el
Betacam o digitales como los sistemas D1, D2, DVCam, DVCPro; el sistema MPEG-2, estndar para
la compresin de imgenes digitales; etc.
L1R
L1
1/25 = 40 ms
Imagen M Imagen M+1
40 ms /n lneas
t
Imagen
color
L1G L1B
L2 LN
L1R
L1
1/25 = 40 ms
Imagen M Imagen M+1
40 ms /n lneas
t
Imagen
color
L1G L1B
L2 LN
En general, la tendencia de todos los sistemas de televisin y vdeo es la de realizar una codificacin
en componentes de las seales de color. Evidentemente, todos estos sistemas son incompatibles con
los sistemas de televisin analgicos convencionales como el NTSC o el PAL.

La codificacin del color en componentes admite tambin diversas variantes dependiendo del sistema
considerado. La caracterstica comn de todos estos sistemas es que las seales de luminancia y las de
diferencia de color pueden ser fcilmente separadas sin la aparicin de cruces o interferencias entre
ellas. Normalmente, en los sistemas analgicos, la luminancia y las seales diferencia de color estn
multiplexadas en el tiempo. En la figura 1.77 se muestra una configuracin tpica de estas seales que
se utiliza en el sistema MUSE (tambin se usaba en el D2-MAC). La seal de luminancia ocupa 2/3
del tiempo de lnea activa, mientras que las seales diferencia de color se transmiten en lneas alternas
durante el 1/3 del tiempo restante. Ntese que esta codificacin aprovecha la menor resolucin del
sistema visual a las componentes de color mediante un doble artilugio. Por una parte, las seales
diferencia de color correspondientes a una lnea se comprimen en el tiempo y tienen una duracin
igual a la mitad que la seal de luminancia. Esto significa, que para un ancho de banda determinado de
la seal, las componentes de color tendrn una resolucin horizontal igual a la mitad que la
luminancia. Por otra parte, la resolucin vertical de las seales diferencia de color tambin se reduce a
la mitad, ya que la seal (R-Y) slo se transmite en las lneas impares y la (B-Y) en las pares. El
receptor, para decodificar el color asociado a la lnea k, utilizar sistemticamente la informacin de
las componentes de color correspondientes a la lnea k-1 y a la lnea k.

Fig. 1.77 Multiplexacin temporal de componentes de color

La codificacin utilizada en un sistema de registro de seal de vdeo analgico sobre soporte
magntico tiene unas caractersticas parecidas. En el sistema Betacam la seal de luminancia y las
seales diferencia de color se registran en pistas adyacentes, por lo que su separacin tambin es
simple y no existen cruces entre las seales. Las dos componentes de color se comprimen en un factor
2 respecto la luminancia y se registran en la misma pista. El ancho de banda asignado a la luminancia
es nuevamente el doble que el de las componentes de color.
Luminancia
lnea k
R-Y
lnea k
Luminancia
lnea k+1
B-Y
lnea k+1
t C
d
i
g
o
s
C
d
i
g
o
s
2/3 L act 2/3 L act 1/3 L act 1/3 L act
L act L act
Luminancia
lnea k
R-Y
lnea k
Luminancia
lnea k+1
B-Y
lnea k+1
t C
d
i
g
o
s
C
d
i
g
o
s
2/3 L act 2/3 L act 1/3 L act 1/3 L act
L act L act
Otro sistema de codificacin de vdeo que puede considerarse en componentes es el S-Vdeo. En este
caso, la componente de luminancia y las componentes de croma se proporcionan mediante cables
separados en paralelo. El S-Vdeo se utiliza como un formato domstico para la interconexin entre
equipos de vdeo analgico. Prcticamente todos los receptores modernos incorporan una entrada en
S-Vdeo que permite conectarlos directamente con una cmara de vdeo o un magnetoscopio. La seal
en S-Vdeo, al tener las componentes de luminancia y color separadas, proporciona una mayor calidad
de imagen que la seal de vdeo compuesto. Otra posibilidad es interconectar usando directamente las
tres componentes de color R, G y B por separado. En los equipos profesionales es habitual utilizar este
tipo de interconexin. En los modelos domsticos el Euroconector permite la interconexin entre
distintos equipos de vdeo mediante la transmisin de las tres componentes de color por separado y en
paralelo.

La codificacin de las componentes de luminancia y diferencia de color en sistemas digitales es algo
ms compleja y dejaremos su anlisis detallado para captulos posteriores.

1.8.17 Sistemas de vdeo compuesto
Cuando se introdujeron los primeros sistemas de televisin en color era muy importante mantener la
compatibilidad con los sistemas de blanco y negro ya operativos. Ello exiga, como hemos visto,
transmitir la seal de luminancia con el mismo formato que esperaban los receptores en blanco y
negro y superponer la informacin de croma de manera que pudiera ser decodificada por un receptor
en color, pero que tuviera una incidencia mnima sobre la calidad de la seal que se obtendra al usar
un receptor en blanco y negro. Estas condiciones imponen que la seal de color de un sistema
compatible debe tener la forma:

) ( ) ( ) ( t c t Y t x
r c
+ (1.80)

donde Y(t) representa la seal en blanco y negro y c
r
(t) la informacin de croma. Es evidente que
como la seal Y(t) se transmite durante todo el tiempo no es posible una multiplexacin temporal de
las dos seales, como ocurre en el caso de los sistemas de componentes de color. Por otra parte,
tampoco se consider apropiado multiplexar en frecuencia la seal de luminancia y las diferencias de
color, por cuanto el ancho de banda de las seales de televisin habra aumentado considerablemente
y adems, habra dificultado notablemente la retrocompatibilidad del sistema. En efecto, en este
supuesto, si una emisora transmitiese en blanco y negro, los receptores en color hubieran esperado la
seal de crominancia fuera de la banda de la seal de luminancia, por lo que la seal que finalmente
fuera demodulada sera imprevisible, a no ser que se asignaran guardas de transmisin considerables,
lo que hace inviable esta alternativa.

En consecuencia, las seales Y(t) y c
r
(t) deben compartir tiempo y banda de frecuencia, por lo que
debern imbricarse de manera que su interferencia mutua sea mnima y que, a su vez, la
decodificacin de la informacin de color pueda realizarse con sistemas electrnicamente simples. La
solucin adoptada por los sistemas NTSC y PAL consiste en modular en amplitud las componentes
diferencia de color utilizando dos portadoras ortogonales (modulacin en cuadratura). El sistema
SECAM utiliza una modulacin en frecuencia de las seales diferencia de color. En todos los casos,
las frecuencias portadoras de las componentes de color estn dentro de la banda til de la seal de
luminancia.
Tomemos como ejemplo el sistema NTSC, la seal de croma se obtiene como:

) ( ) ( ) cos( ) ( ) (
0 0
t sen t Q t t I t c
r
+ (1.81)

Las seales Q(t) e I(t) estn relacionadas con las componentes diferencia de color mediante una
relacin matricial que ya hemos establecido en el apartado 1.4.6 y que repetimos para mayor claridad:

1
1
1
]
1

1
1
1
]
1

1
1
1
]
1
) (
) (
414 . 0 478 . 0 0
269 . 0 783 . 0 0
0 0 1
Y B
Y R
Y
Q
I
Y
(1.82)

La estructura de Q(t) e I(t) es idntica a la de la seal de luminancia, es decir, cada una de estas
seales proporciona la informacin sobre el valor de las componentes de color en un punto de la
imagen, en una secuencia de lneas y campos, con las mismas caractersticas que la empleada para la
seal de luminancia. Las seales Y(t), Q(t) e I(t) estn pues perfectamente sincronizadas, de modo
que, al aplicarlas a un decodificador NTSC, obtendremos las seales R(t), G(t), B(t) que nos indicarn
las componentes de seal que debemos aplicar al tubo de color para obtener las imgenes en color.

Sin embargo, las seales Q(t) e I(t) son moduladas en cuadratura de acuerdo con la ecuacin 1.81,
para que no interfieran con la seal de luminancia. Un receptor en color debe demodular estas seales
antes de aplicarlas a la matriz de decodificacin 1.82. La modulacin en cuadratura de ambas
componentes permite recuperar ambas componentes siempre que el receptor disponga de una
referencia de fase de la portadora utilizada en el transmisor. Veremos los detalles del demodulador en
el captulo dedicado a los sistemas de color compatibles, pero ya podemos adelantar que ser
necesario transmitir, junto con las seales I(t) y Q(t) una seal de referencia que permita sincronizar la
fase del receptor con la del transmisor.

Fig. 1.78 Superposicin de las seales de luminancia y croma en el tiempo

Si un receptor en blanco y negro recibe la seal NTSC, slo ser capaz de interpretar la informacin
de luminancia, por lo que las componentes de color sern consideradas como una interferencia. En la
figura 1.78 se representa esquemticamente la forma de onda de la seal NTSC recibida en un
fragmento de lnea activa. De acuerdo con este esquema, a la seal de luminancia se superpone una
t Fragmento de una lnea de seal de televisin (NTSC)
Luminancia
Luminancia
+
Croma
Luminancia
Luminancia
+
Croma
componente de alta frecuencia que contiene la informacin sobre las componentes de color en su
amplitud y fase. Sin embargo, para el receptor en blanco y negro esta componente de alta frecuencia
se interpreta como la propia seal de luminancia, por lo que ser representada tal cual en la pantalla
del receptor.

Es importante, por tanto, elegir la frecuencia de la portadora de la seal de croma de manera que su
efecto visual en un monitor de blanco y negro sea mnimo. Por ello, la portadora de color es de alta
frecuencia (aunque dentro de la banda), para que sea el propio sistema visual humano el que integre
las rpidas variaciones de nivel que se superponen con la seal de luminancia. Adems, la frecuencia
portadora se elige de modo que en dos lneas sucesivas los efectos de la interferencia se cancelen. As,
si en una determinada posicin de la pantalla, la interferencia ha provocado un aumento del nivel de la
luminancia, en la posicin inmediatamente superior e inferior (lneas adyacentes) la seal de croma
provocar una disminucin de la misma. Adems, el signo de la interferencia tambin vara de cuadro
a cuadro, por lo que se obtiene un complejo patrn interferente que vara tanto en el espacio como en
el tiempo y que es apenas perceptible por el ojo que integra toda esta informacin.

Una posible frecuencia portadora, que permite obtener estos patrones de interferencia poco
perceptibles, es utilizar un mltiplo impar de la mitad de la frecuencia de lnea. En concreto, en el
sistema NTSC se toma como frecuencia portadora el valor:

) 578 , 3 ( 2 455
2
2
0
MHz
f
Lnea

(1.83)

Desde el punto de vista espectral, este valor de frecuencia portadora supone que las seales de
luminancia y croma quedan espectralmente entrelazadas con una interferencia mnima entre ellas. No
obstante, es evidente que esta codificacin de las componentes de color, compartiendo tiempo y
frecuencia con la seal de luminancia, introducir algunas limitaciones de calidad inherentes a casi
todos los sistemas de vdeo compuesto. Todas las hiptesis sobre la cancelacin e integracin del
patrn interferencias suponen que la seal de croma no presenta rpidas variaciones espaciales o
temporales. Justificaremos todos estos resultados y veremos un anlisis detallado de estos efectos en
captulos posteriores.

1.9 Muestreo espacial de las imgenes: filas y columnas
Las diferentes etapas de muestreo de la escena han permitido representarla como una seal analgica
que proporciona informacin sobre las componentes de luminancia y color en cada punto del espacio
y del tiempo. Si ahora aplicamos un muestreo temporal de esta seal y codificamos cada una de las
muestras con una palabra binaria, obtendremos una versin digital de la escena que permitir un fcil
tratamiento de la informacin con procesadores digitales o su transmisin mediante sistemas de
comunicacin digitales.

1.9.1 Conceptos bsicos
Consideremos en primer lugar el caso de una seal de televisin en blanco y negro. La propia
estructura de la seal indica que el procedimiento ms simple para su digitalizacin consiste en tomar
muestras equiespaciadas en cada una de sus lneas. Si las muestras se sincronizan con el inicio de las
lneas, se obtendr un muestreo de la imagen con estructura rectangular, en la que cada muestra
representa los valores de luminancia obtenidos sobre una retcula rectangular como la que se muestra
en la figura 1.79. De este modo, la imagen puede tratarse como una matriz u[n,m], donde el primer
ndice indica la fila y el segundo la columna a la que pertenece cada muestra. Estas muestras suelen
tambin denominarse elementos de imagen o pxeles (que se corresponde con la abreviacin
anglosajona de picture elements).

Fig. 1.79 Retcula de muestreo rectangular para la digitalizacin de las imgenes

El nmero de muestras que se toman en cada lnea de la imagen debe estar en consonancia con el
nmero de lneas con objeto de que la resolucin en ambas direcciones tenga valores parecidos. As
pues, en primera aproximacin (veremos los detalles ms adelante), en un sistema como el europeo
que utiliza 575 lneas activas, el nmero de muestras para tomadas en cada lnea debera ser de unas
(4/3)575 = 766 muestras, donde hemos multiplicado por la relacin de aspecto para tener en cuenta
que la imagen no es cuadrada. De acuerdo con esta propuesta, la distancia fsica entre los elementos
de imagen en la retcula de muestreo es idntica en ambas direcciones, por lo que a menudo se dice
que a esta estructura de muestreo le corresponde un pxel cuadrado. No obstante, a menudo nos
encontramos con sistemas que muestrean la seal de vdeo a una velocidad distinta, obteniendo un
nmero de muestras por lnea que puede ser mayor o menor que el propuesto anteriormente. En estos
casos se dice que se trabaja con sistemas con elementos de imagen rectangulares.

En la figura 1.80 se muestran distintas versiones de la misma imagen muestreada con distintas
resoluciones. En todos los casos, los elementos de imagen son cuadrados.

Por otra parte, es necesario establecer el nmero de bits con el que debe codificarse cada muestra, o lo
que es equivalente, el nmero de posibles niveles de luminancia que deben asignarse a la seal para
que el sistema visual humano sea incapaz de distinguir entre los niveles de gris originales y los
cuantificados.
Muestras
filas
columnas
u(n,m)
Muestras
filas
columnas
u(n,m)

Fig. 1.80 Versiones de una misma imagen con distintas resoluciones

Para determinar este parmetro debemos previamente caracterizar la capacidad del sistema visual para
diferenciar entre dos niveles de luminancia distintos. Se considera que para distinguir un circulo de luz
con una luminancia L
a
sobre un fondo con luminancia L
b
, es necesario que se verifique la siguiente
relacin numrica:

b
L
L
(1.84)

donde L representa la diferencia entre los dos niveles de luminancia y es una constante,
denominada fraccin de Weber, cuyo valor depende del observador y del nivel de iluminacin total al
que est sometida en la retina. En condiciones de luz diurna, el valor de esta constante est
comprendido entre 0.02 y 0.05.

Podemos utilizar la relacin anterior para calcular el nmero de niveles de gris que el ojo ser capaz
de distinguir en un sistema de televisin. Para ello supongamos que el sistema trabajar con unos
niveles de luminancia que estn situados entre L
max
y L
min.
. La relacin entre estos dos niveles se
define como el contraste (K) de la imagen:

min
max
L
L
K (1.85)

Los valores de contraste mximos que puede admitir la retina humana es del orden de 100 por lo que
no tiene sentido trabajar con valores de luminancia que vayan ms all de estos lmites.

Con estas hiptesis, el valor de luminancia que puede distinguirse inmediatamente despus del
mnimo ser, de acuerdo con la ecuacin 1.84:

min 1
) 1 ( L L + (1.86)

40x40 80x80 324x324 40x40 80x80 324x324
Anlogamente, el segundo nivel de luminancia que podremos distinguir ser:

min
2
1 2
) 1 ( ) 1 ( L L L + + (1.87)

Con lo que se infiere que el nmero mximo de niveles que podrn distinguirse puede obtenerse de la
ecuacin:

min max
) 1 ( L L
m
+ (1.88)

Tomando como valor mximo de contraste K=100 y un valor tpico de =0.05 obtenemos que el
nmero mximo de niveles de gris que pueden distinguirse es:

92
) 1 log(
) / log(
min max
L L
m (1.89)

Una alternativa, de carcter ms experimental, para determinar el nmero de niveles necesarios para
codificar las muestras consiste en presentar distintos tipos de imgenes a espectadores que deben
valorar cul es el nmero mnimo de niveles a partir del que no se aprecia ninguna mejora en la
calidad de las imgenes. Esta experiencia suele dar que el nmero de niveles de gris se sita entre los
45 y 60, lo que indica que la aproximacin realizada con el modelo anterior proporcionaba un
resultado algo sobreestimado. En la figura 1.81 se muestra una misma imagen representada con
distintos nmeros de niveles.

Fig. 1.81 Imgenes obtenidas utilizando distintos nmeros de niveles de gris

De los resultados anteriores se deduce que para codificar correctamente las imgenes se requiere un
nmero de niveles que requiere un mnimo de 6 o 7 bits. Debido a que toda la estructura de las
memorias estn basadas en palabras de 8 bits, se decidi cuantificar los niveles de luminancia con 8
bits, con lo que se obtiene un total de 256 niveles posibles, que cubren perfectamente las necesidades
del sistema visual.

4 niveles, 2 bits 8 niveles, 3 bits 256 niveles, 8 bits 4 niveles, 2 bits 8 niveles, 3 bits 256 niveles, 8 bits
En el caso en que se trate de imgenes en color, puede optarse por muestrear las 3 componentes de
color RGB o bien la luminancia y las seales diferencia de color. En el primer caso, la resolucin de
las tres imgenes debe ser la misma y cada muestra de las componentes de color se suele cuantificar
con 8 bits. En el caso de tomar la luminancia y las seales diferencia de color, es habitual muestrear
estas ltimas con una retcula de muestreo que incluya un menor nmero de muestras espaciales
debido a la menor resolucin del sistema visual al color. Normalmente la reduccin es en un factor 4,
que supone que se utilizan la mitad de filas y columnas. Tanto las muestras correspondientes a la
luminancia como a las seales diferencia de color suelen muestrearse con 8 bits.

1.9.2 Sistemas de adquisicin
Existen multitud de sistemas para la digitalizacin de imgenes, que en una primera aproximacin
podran clasificarse en sistemas que obtienen un nico fotograma de la escena o sistemas que
digitalizan ininterrumpidamente la secuencia de imgenes asociada a una seal de vdeo.

Entre los sistemas para la digitalizacin de un nico fotograma se incluyen los scanners, las cmaras
de fotografa electrnica y las tarjetas digitalizadoras de fotogramas a partir de una seal de vdeo. En
todos estos sistemas el formato digital de la imagen proporciona indudables ventajas tanto para su
almacenamiento masivo sobre soportes magnticos u pticos, como para su tratamiento y anlisis
mediante ordenador. Existe un gran nmero de programas tanto de mbito domstico como
profesional para el retoque y mejora imgenes en formato digital cuyo uso se ha popularizado.

Las dimensiones de la imagen que proporcionan estos sistemas dependen de la tecnologa utilizada.
En el caso de scanners y cmaras fotogrficas, suelen utilizarse sensores del tipo CCD que
proporcionan una excelente resolucin de la imagen, comparable, como mnimo, a la calidad de los
sistemas de televisin de radiodifusin. En los scanners se utilizan CCD que exploran las lneas de la
imagen de manera secuencial (CCDs de lnea), obtenindose resoluciones tpicas superiores a los 600
elementos de imagen por pulgada (d.p.i: dots per inch). En el caso de las cmaras de fotografa
electrnica se utilizan sensores CCD matriciales con caractersticas parecidas a los utilizados en las
cmaras de vdeo, obteniendo una calidad parecida. Una ventaja inherente al uso de sensores CCD es,
como veremos en el captulo dedicado a cmaras, que estos sistemas exploran la imagen sobre una
retcula de muestreo rectangular, por lo que la conversin a seal digital puede realizarse
directamente, direccionando cada uno de los elementos de imagen y convirtiendo el valor de carga
adquirido a una palabra binaria.

En las tarjetas digitalizadoras de seal de vdeo, la seal de partida suele ser de vdeo compuesto
(obtenido generalmente a partir de una cmara o de un reproductor de vdeo) o bien las componentes
de color RGB. El sistema identifica los impulsos de sincronismo de lnea y de campo propios de la
seal para determinar los instantes en los que debe realizar el muestreo de las lneas de la imagen. El
muestreo de un fotograma se realiza cuando el usuario activa una determinada funcin, que
normalmente puede controlar por software. El muestreo se inicia en el cuadro siguiente al instante
marcado por el usuario y el resultado se almacena generalmente en una memoria propia de la tarjeta
que en algunos casos permite la digitalizacin de varios fotogramas consecutivos. Una vez realizada la
adquisicin de la imagen, los resultados pueden transferirse a la memoria propia del ordenador.
Aunque generalmente permiten que el usuario defina la resolucin con la que se desea digitalizar la
imagen, la calidad final depende siempre del tipo de formato de entrada, que excepto para
aplicaciones profesionales especficas, suele ser PAL o NTSC. As, es posible encontrar en el mercado
tarjetas digitalizadoras que proporcionan resoluciones de 800 o 1000 lneas a partir de una seal PAL
que originalmente slo contiene 575 lneas activas. El procedimiento utilizado para obtener las lneas
restantes es, evidentemente, la interpolacin, que en la mayora de productos es, a lo sumo, lineal.

Los sistemas que digitalizan ininterrumpidamente la secuencia de imgenes suelen utilizarse en
equipos de televisin y vdeo digital. La secuencia de bits obtenida puede ser almacenada
directamente sobre cinta magntica, como es el caso de los magnetoscopios digitales profesionales, o
ser tratada mediante un potente procesador que se encarga de comprimir la informacin para poder
transmitirla en un ancho de banda razonable o almacenarla en soportes de acceso aleatorio (disco
duro, CD-ROM).

En general, el proceso de digitalizacin, almacenamiento y transmisin se realiza mediante sistemas
profesionales que slo se encuentran en estudios de televisin o productoras de vdeo en formato
digital. Recientemente han aparecido equipos domsticos que permiten realizar el proceso de
digitalizacin y edicin de la seal de vdeo con el uso de tarjetas especficas para ordenador. Estos
sistemas proporcionan actualmente una calidad de vdeo comparable al VHS, aunque se espera que
pronto puedan obtenerse mejores calidades.

Los formatos digitales ms extendidos actualmente en estudios de televisin, y que pueden
considerarse como el punto de partida de los distintos equipos para el registro o la transmisin digital,
son las normas 4:2:2 y 4:2:0, que definen la conversin a seales digitales tanto para los sistemas de
525lneas/60 Hz como para los sistemas 625 lneas/50 Hz, manteniendo un gran nmero de
parmetros comunes entre ambos formatos.

1.9.3 Formatos de televisin digital
En 1982, el ITU-R (anteriormente CCIR), en su recomendacin 601, desarroll un conjunto de
especificaciones para seales de televisin digital en estudios de televisin o de produccin de vdeo.
El objetivo de esta recomendacin era facilitar el intercambio de programas a escala internacional. Las
recomendaciones definen muchos parmetros comunes entre el formato americano y europeo con el
objeto de que los fabricantes puedan incluir varios mdulos comunes en equipos para 525 y 625
lneas. El uso de este formato permite la interconexin entre distintos equipos digitales.

Existen bsicamente dos variantes bsicas conocidas como 4:2:2 y 4:4:4, donde los dgitos indican la
proporcin entre las muestras dedicadas a la luminancia y las dedicadas a las componentes de color.
El sistema ms utilizado es el 4:2:2, en el que estn codificadas la luminancia y las seales diferencia
de color. El formato 4:4:4 puede utilizarse tambin con componentes RGB. En las tablas adjuntas se
detallan las caractersticas ms significativas de estos dos formatos.

Las componentes diferencia de color utilizadas en estos dos formatos han sido definidas previamente
en el apartado 1.4.19, en la ecuacin 1.51. Las componentes se registran con una correccin de
gamma para adaptarse a las caractersticas de los displays de representacin.
Tabla 1.3 Caractersticas del formato 4:2:2

ITU-601

Parmetros de codificacin en componentes 4:2:2

Parmetros

Sistemas 525/60

Sistemas 625/50
Seales codificadas: Y, C
R
,C
B
Las coordenadas utilizadas se denotan E
Y
, E
R-Y
y E
B-Y
. Su
relacin con las coordenadas del sistema NTSC se discute en
el texto.

Nmero de muestras por lnea
completa:
Luminancia
Seales diferencia de color

858
429

864
432
Estructura de muestreo La retcula de muestreo es ortogonal y se repite segn un
patrn de lnea, campo y cuadro. Las muestras de las
componentes diferencia de color se corresponden con las
muestras impares de la luminancia (1,3,5,...)
Frecuencias de muestreo:
Luminancia

13.5 MHz
6.75 MHz
La tolerancia para la frecuencia de muestreo debe coincidir
con la tolerancia para la frecuencia de lnea del standard de
televisin en color analgico de partida.
Las frecuencias de muestreo de 13.5 MHz y 6.75 MHz son
mltiplos enteros de 2.25 MHz, que es el mnimo comn
mltiplo de las frecuencias de lnea de los sistemas de 525 y
625 lneas.

Codificacin de las muestras Se utiliza un cuantificador uniforme de 8 bits por muestra del
tipo PCM, tanto para la seal de luminancia como para las
seales diferencia de color.

Nmero de muestras digitales por
lnea activa:
Luminancia

720
360
Relacin de tiempo horizontal
seales analgica y digital
Desde el fin de la lnea activa
a O
H

16 periodos de reloj de
luminancia

12 periodos de reloj de
luminancia
Correspondencia entre los niveles
de la seal de vdeo y los niveles
de cuantificacin:
Escala
Seal de luminancia

0 a 255
220 niveles de cuantificacin donde el nivel de negro se
corresponde con el nivel 16 y el nivel de blanco con el 235. El
nivel de la seal puede superar, ocasionalmente, el nivel 235.
225 niveles de cuantificacin situados en la parte central de la
escala del cuantificador con el nivel de seal cero asociado al
valor 128.
Uso de palabras cdigo Las palabras cdigo se corresponden con los niveles 0 y 255 y
se utilizan nicamente con propsitos de sincronizacin. Los
niveles 1 a 254 estn disponibles para la seal de vdeo.

Tabla 1.4 Caractersticas del formato digital 4:4:4

ITU R-601 Parmetros de codificacin en componentes 4:4:4

Parmetros

Sistemas 525/60

Sistemas 625/50
Seales codificadas: Y, C
R
, C
B
o
R, G, B
Las seales se denotan como E
Y
, E
R
-E
Y
,E
B
-E
B
o como E
R
, E
G
,
E
B
. Su relacin con las componentes RGB del sistema NTSC se
comenta en el texto.
Nmero de muestras por lnea
completa de cada seal
858 864
Estructura de muestreo Retcula de muestreo ortogonal con repeticin en base a la lnea,
el campo y el cuadro. La estructura de muestreo hace que las tres
componentes coincidan y que tambin coincidan con las
posiciones de las muestras de la luminancia en el sistema 4:2:2.
Frecuencia de muestreo para cada
seal
13.5 MHz
Tipo de codificacin Cuantificador uniforme de un mnimo de 8 bits tipo PCM. (8
12)
Duracin de la lnea activa
expresada en nmero de muestras
Mnimo de 720
Correspondencia entre los niveles
de seal de vdeo con los 8 bits
ms significativos
Escala
R,G,B o seal de luminancia

0-255
220 niveles de cuantificacin donde el nivel de negro se
corresponde con el nivel 16 y el nivel de blanco con el 235. El
nivel de la seal puede superar, ocasionalmente, el nivel 235.
225 niveles de cuantificacin situados en la parte central de la
escala del cuantificador con el nivel de seal cero asociado al
valor 128.
Para tener una idea general del volumen de datos binarios que supone la digitalizacin de una seal de
vdeo, consideremos como ejemplo el caso del estndar 4:2:2. La luminancia se muestrea a una
frecuencia de 13.5 MHz tomando 8 bits por muestra, lo que da un total de 108 Mbps. Adems, cada
una de las seales de diferencia de color se muestrean a 6.75 MHz, nuevamente con 8 bits por
muestra, lo que produce un nuevo flujo de 108 Mbps. En total tenemos un flujo de 216 Mbps
asignados exclusivamente a la seal de vdeo digital, sin tener en cuenta las componentes de audio o
de informacin adicional que pueden desear incluirse en la seal de televisin. Este flujo de datos, si
bien puede ser soportado en la transferencia de datos entre equipos de un estudio, es excesivo para su
transmisin directa al usuario, ya que requerira utilizar un considerable ancho de banda.

Por ello, en televisin digital es fundamental aplicar procedimientos y tratamientos especficos de los
datos que permitan comprimir la cantidad de informacin que debe transmitirse al canal.

Las dimensiones de la componente de luminancia en los formatos 4:4:4 y 4:2:2 son de 720x576 en los
sistemas de 625/50 y de 720x480 en los de 525/30. La diferencia en el nmero de filas entre ambos
sistemas se debe a los estndares de partida analgicos. En el sistema de 625 lneas slo son activas
575 que se reparten entre los dos campos. Esto da lugar a un total de 287,5 lneas activas por campo.
Al digitalizar cada uno de los campos, las medias lneas deben tomarse como una fila completa de la
imagen digital, por lo que obtenemos un total de 288 lneas por campo, es decir, 576 (288x2) lneas
por imagen. Para el sistema de 525 lneas puede aplicarse un razonamiento similar.

En el formato 4:4:4 se toma una muestra de las dos componentes de color por cada muestra de
luminancia. Esto significa que los tamaos de las matrices diferencia de color coinciden con los de las
matrices de luminancia. En cambio, en el sistema 4:2:2, las componentes de croma son
submuestreadas en un factor 2 dentro de cada fila. Esto significa que los tamaos de las matrices de
croma sern de 360x576 en los sistemas 625/50 y de 360x480 en los de 525/60. El submuestreo de la
informacin de croma resulta lgico, puesto que la resolucin del sistema visual es menor en la
informacin de croma que en la de luminancia. No obstante, en este formato, slo se reduce la
frecuencia de muestreo en el sentido horizontal. El nmero de muestras de croma en el eje vertical
sigue coincidiendo con el de la componente de luminancia, de modo que la frecuencia de muestreo de
la informacin de croma se mantiene constante a 6,75 MHz. En la figura 1.82 se representa cmo se
distribuyen las muestras de luminancia y croma en el formato 4:2:2.

Para reconstruir la informacin en un display es necesario recuperar todas las componentes R, G y B
en cada elemento de imagen. En el formato 4:4:4 no existe ningn problema, pues disponemos de la
informacin de croma y luminancia de cada pxel. En el formato 4:2:2 suele realizarse una
interpolacin lineal para obtener los niveles de croma que no han sido transmitidos o almacenados.
Una alternativa a la interpolacin lineal consiste en utilizar las mismas componentes de croma que el
pxel de la izquierda.

La recomendacin ITU-R 656 establece el estndar de interconexin entre dispositivos que utilizan el
formato 4:2:2 (bsicamente magnetoscopios digitales, editores y mesas profesionales). En la versin
en paralelo de la interficie se utiliza un conector del tipo DB25 por el que se van transmitiendo las
muestras de 8 bits de las componentes de luminancia y croma, multiplexadas en el tiempo. El orden de
transmisin, de acuerdo con la notacin de la figura 1.82, es C
r1
, Y
1
, C
b1
, Y
2
, C
r3
, Y
3
, C
b3
, Y
4
, C
r5
, Y
5
,
C
b5
, Y
6
, etc. Junto con los bits de cada una de las muestras se transmite un reloj de 27 MHz (un
periodo por muestra). Tambin est definida una versin en serie del interfaz que utiliza un cable
coaxial de 75 ohmios con conectores del tipo BNC. En este caso se utiliza una tasa de 243 Mbps,
debido a que, en este modo, se transmiten 9 bits por muestra.

Fig. 1.82 Distribucin espacial de las muestras de luminancia y croma en el formato 4:2:2

Formato 4:2:0

El formato 4:2:0 es una simplificacin del 4:2:2 que se utiliza en un gran nmero de aplicaciones para
el registro de vdeo en soporte magntico o en disco duro. Es el formato de entrada utilizado en la
versin de MPEG-2 que se utiliza en la transmisin de televisin digital (Main Level, Main Profile,
MP@ML). Se obtiene reduciendo a la mitad la frecuencia de muestreo de las componentes de croma
en el sentido vertical. Con ello, se iguala la densidad de muestras de croma en las dos direcciones. Las
muestras de croma se obtienen a partir de las muestras del formato 4:2:2, promediando dos filas
consecutivas. En la figura 1.83 se muestra la posicin de las muestras de croma respecto a las de
luminancia, indicando explcitamente que los valores de croma pueden asociarse a la posicin
intermedia entre dos lneas (promedio de los valores en cada una de las lneas).

En definitiva, en el formato 4:2:0 el tamao de las matrices de croma se reduce a 360x240 para el
estndar 525/60 y a 360x288 para el estndar 625/50, mientras que las matrices de luminancia se
mantienen con el mismo tamao que en los formatos 4:4:4 o 4:2:2.

Otras relaciones de submuestreo

Adems del formato 4:2:2 y el 4:2:0, tambin estn definidos otros formatos de submuestreo de la
seal de vdeo como el 4:1:1 y el 4:1:0, que a menudo se confunden con los primeros. En la tabla 1.5
se proporcionan los tamaos de las imgenes utilizados en cada uno de ellos y los factores de
diezmado de la seal de croma que se utilizan en cada caso. El formato 4:1:0 fue utilizado durante
bastante tiempo por Intel en el DVI (Digital Video Interactive). Actualmente, tanto el 4:1:1 como el
4:1:0 estn prcticamente abandonados. Tambin existe normativa definida para los formatos 3:2:2,
3:1:1 y 3:1:0, pero prcticamente no han sido utilizados.
Componentes
Y
k
, C
rk
, C
bk
Componente Y
k
Componentes
Y
k
, C
rk
, C
bk
Componente Y
k

Fig. 1.83 Distribucin de las componentes de luminancia y croma en el formato 4:2:0

Tabla 1.5 Formatos de submuestreo de las seales de crominancia

Formato Muestras Y
lnea
Muestras Y
columna
Muestras C
lnea
Muestras C
columna
Submuestreo
horizontal
Submuestreo
vertical
4:4:4 720 576/480 720 576/480 --- ---
4:2:2 720 576/480 360 576/480 2:1 ---
4:2:0 720 576/480 360 288/240 2:1 2:1
4:1:1 720 576/480 180 576/480 4:1 ---
4:1:0 720 576/480 180 144/120 4:1 4:1

Formatos reducidos

En algunas aplicaciones donde no resulta necesaria una excesiva calidad de la imagen de vdeo digital
suelen emplearse reducciones sobre el tamao de la imagen. Con ello, se consigue una importante
reduccin respecto a la tasa de bits original, que puede hacer factible la codificacin de la seal en
soportes de baja densidad o canales de reducido ancho de banda. Un ejemplo tpico de aplicaciones
que utilizan formatos reducidos son los ficheros de vdeo para Windows AVI. Otro ejemplo es el
MPEG-1, diseado para codificar seal de vdeo sobre un soporte CD-ROM, que en principio fue
diseado slo para almacenar informacin de audio. Todas estas aplicaciones suelen partir de una
reduccin del tamao de las imgenes y, adems, suelen aplicar codificadores que comprimen la
informacin de vdeo.

Uno de los formatos de vdeo reducido ms populares es el SIF (Source Intermediate Format) que,
esencialmente, consiste en un submuestreo de un factor 2 del formato 4:2:0 que se aplica tanto a las
componentes de luminancia como de croma. Los tamaos de las matrices de luminancia para el
formato SIF son de 360x288 para el estndar de 625 lneas y 360x240 para el 525 lneas. Las matrices
de croma tambin se submuestrean en un factor 2 en cada direccin respecto las matrices de croma del
4:2:0 (180x144 para 625 lneas y 180x120 para 525). Tambin se realiza una reduccin de la
Componentes C
rk
, C
bk
Componente Y
k
Componentes C
rk
, C
bk
Componente Y
k
frecuencia de imagen a 25 Hz para el sistema europeo y a 30 Hz para el americano. Con ello, las
imgenes resultantes no son entrelazadas. En estas condiciones, se obtiene una calidad equivalente al
formato de vdeo analgico VHS.

Las muestras espaciales del formato SIF se obtiene aplicando filtros espaciales y temporales sobre el
formato 4:2:0, para eliminar las componentes de frecuencia elevada y posteriormente submuestreando
las componentes de luminancia y de croma resultantes. La posicin relativa entre las componentes de
luminancia y croma, junto con las componentes descartadas se representan en la figura 1.84. La
posicin de las muestras de croma respecto a las de luminancia se debe a que se utilizan los puntos
centrales de las seales filtradas. Con ello se obtiene una muestra de croma centrada en cada cuatro
muestras de luminancia, que se utilizar para recomponer todas las componentes de color (RGB) de la
imagen.

Fig. 1.84 Disposicin de las muestras en el formato SIF respecto al 4:2:0

El formato CIF (Common Intermediate Format) es un compromiso entre el formato SIF para 625 y
525 lneas. Utiliza 360x288 muestras de resolucin de luminancia (europeo) y una frecuencia de
refresco de 30 Hz (americano).

Los formatos QSIF y QCIF (Quater) se obtienen reduciendo de nuevo la resolucin espacial en un
factor 4 (factor 2 en cada direccin) y la resolucin temporal en un factor de 2 o 4. Estos formatos
suelen utilizarse para la transmisin de seales de vdeo telefona con el estndar de compresin H261
o para la transmisin de vdeo en directo por internet. Los submuestreos espaciales se realizan
filtrando las seales SIF (o directamente la 4:2:0). Las posiciones espaciales de las componentes de
luminancia y croma resultantes son parecidas a las del formato SIF.

Formatos de pxel cuadrado

Todos los formatos digitales descritos corresponden a relaciones de aspecto 4:3 y se obtienen
submuestreando las componentes de croma y/o luminancia del formato 4:4:4. Recordemos que la
recomendacin ITU-R 601 estableca una nica frecuencia de muestreo para las seales procedentes
del NTSC o del PAL, por lo que el nmero de elementos en cada fila es idntico para ambos
estndares. El problema es que como el nmero de filas es distinto, el rea asociada a cada elemento
de imagen no es cuadrada, sino rectangular. En el sistema europeo, para que en una pantalla con una
Muestras de luminancia
Muestras de croma
Muestras descartadas respecto
al formato 4:2:0
Muestras de luminancia
Muestras de croma
Muestras descartadas respecto
al formato 4:2:0
relacin de aspecto 4:3 puedan presentarse 720 columnas y 576 filas, es necesario que los pxeles sean
algo ms anchos que altos (4/720 > 3/576). En cambio, en el sistema americano, los pxeles deben ser
algo ms altos que anchos.

En aplicaciones informticas es conveniente que los pxeles tengan una relacin de aspecto cuadrada,
ya que las tarjetas de visualizacin y los programas de tratamiento de imagen asumen esta propiedad.
Por ello, es conveniente redefinir unos formatos alternativos para poder gestionar las seales de vdeo
digital mediante ordenador. Los formatos utilizados en entornos informticos se suelen denominar
formatos de pxel cuadrado y son equivalentes a los formatos que hemos considerado hasta ahora, con
la salvedad de que se modifica el nmero de elementos por fila para forzar que la relacin de aspecto
del pxel sea cuadrada.

As, en el estndar de 625 lneas, el tamao de una imagen 4:2:0 ser de 768x576 pxeles (768 =
(4/3)x576) mientras que en el estndar de 525 lneas tendremos un tamao de imagen de 640x480
pxeles (640 = (4/3)x480). Este formato es conocido como VGA y, como vemos, proviene del
estndar americano. El resto de formatos SIF, CIF y QCIF de pxel cuadrado se obtienen dividiendo
las resoluciones espaciales por factores de 2. En la tabla 1.6 se comparan los tamaos de cada formato
en las versiones de 625 lneas, 525 lneas y formatos cuadrados.

Tabla 1.6 Comparacin entre formatos digitales

Europeo TV Americano TV Europeo Cuadrado Americano Cuad.
4:2:0 720x576 720x480 768x576 640x480
SIF 360x288 360x240 384x288 320x240
CIF 360x288 360x288 384x288 384x288
QSIF 180x144 180x120 192x144 160x120

Un formato adicional que se utiliza con bastante frecuencia es el SIF de 352x288 pxeles en el sistema
europeo y el de 352x240 pxeles en el sistema americano. Este formato se emplea en aplicaciones de
compresin de vdeo en MPEG-1 y es una reduccin del formato SIF convencional adaptada para
poder descomponer las imgenes en bloques de 16x16 pxeles, a los que se aplican tcnicas de
compensacin de movimiento entre fotogramas consecutivos. En este caso, 360 no es un nmero
divisible por 16, por lo que debe reducirse hasta 352 para que puedan fraccionarse las imgenes en un
nmero entero de bloques. Obsrvese que esta modificacin no es necesaria en el MPEG-2, que
usualmente trabaja en el formato 4:2:0, debido a que 720 s que es divisible por 16.

Formatos digitales de alta definicin

Tambin estn definidos los formatos de alta definicin digitales, que bsicamente consisten en doblar
el nmero de pxeles en cada direccin. En el estndar europeo el tamao de imagen de alta definicin
est definido en 1440x1152 para relaciones de aspecto de 4:3 y en 1920x1152 para relaciones de
aspecto panormicas.
2 La seal de televisin en blanco y negro 159

2 La seal de televisin en blanco y negro
2.1 Introduccin
En este captulo se exponen los detalles relativos a la forma de onda de la seal de televisin en
blanco y negro, tomando como base el sistema analgico de 625 lneas/50 Hz utilizado en Europa.
Aunque hoy en da prcticamente se ha abandonado la transmisin de seales en blanco y negro y el
parque de receptores monocromos es muy reducido, sigue siendo necesario comprender el formato de
esta seal, pues constituye la base sobre la que se definieron los sistemas de televisin en color
compatibles. Por otra parte, las componentes de la seal de televisin estn directamente relacionadas
con las caractersticas del tubo de imagen, por lo que ser necesario revisar sus principios de
funcionamiento para poder justificar los valores y niveles de algunos parmetros de la seal. As pues,
las formas de onda de la seal de vdeo compuesto pueden considerarse una herencia de la
restricciones tecnolgicas de los primeros receptores y tubos de imagen, por lo que resulta esencial
comprender sus caractersticas para poder interpretar y entender las seales de televisin analgicas.
Aprovechando este breve anlisis del tubo en blanco y negro, tambin veremos los principios bsicos
de los tubos de imagen de color.

Nuestro objetivo no es, ni mucho menos, realizar un anlisis detallado del receptor de televisin, sino
simplemente sentar las bases de la televisin analgica para posteriormente poder abordar los
modernos sistemas de televisin digital. Por ello, obviaremos, tanto en este captulo como en el
siguiente, cualquier comentario que haga referencia a aspectos circuitales del receptor o del
transmisor.

En la primera parte se examinan brevemente los elementos bsicos de un tubo de imagen,
estableciendo la funcin de cada uno de ellos. La relacin no lineal entre la tensin de control del tubo
y la intensidad del haz de electrones nos llevar a la necesidad de realizar una correccin de los
niveles de luminancia (tambin necesaria en los sistemas de color) denominada correccin gamma.
Posteriormente se analizarn las formas de onda que permiten controlar la posicin del haz en la
pantalla, considerando en primer lugar una respuesta ideal de los circuitos de generacin de las seales
y de las bobinas de deflexin del tubo. Una vez analizado el caso ideal, se evala la incidencia sobre
el sistema de televisin de los circuitos reales.

El cuerpo principal de este captulo se dedica a la definicin de las seales de sincronismo de lnea y
de campo que, por otra parte, son idnticas a las que se utilizan en los sistemas de color. Se ha
dedicado especial atencin a la seal de sincronismo de campo y a toda la secuencia de borrado de
campo, ya que debido a su complejidad, se ha credo conveniente justificar la presencia de cada una
de sus componentes en vez de, simplemente, indicar cul era su forma de onda.

2.2 Principios de funcionamiento del tubo de rayos catdicos en blanco y negro
El dispositivo ms utilizado para la representacin de imgenes de televisin es el tubo de rayos
catdicos. Recientemente han aparecido otros dispositivos para la representacin de imgenes como
son las pantallas de cristal lquido, de plasma, sistemas de retroproyeccin por tubos de imagen o
lser, etc., que aunque se prev que en un futuro cercano puedan sustituir al tubo de rayos catdicos,
por el momento su aplicacin en receptores de televisin domsticos es prcticamente testimonial.

En este apartado pretendemos proporcionar una perspectiva muy general de los elementos que
constituyen un tubo de rayos catdicos en blanco y negro y sus principios de funcionamiento. La
comprensin de este dispositivo de representacin de imgenes resulta fundamental para entender las
distintas componentes que se insertan en la estructura de la seal de vdeo. Tngase en cuenta que en
el momento de definir la forma de onda de la seal de vdeo en blanco y negro se tuvieron en cuenta,
sobre todo, los diversos aspectos tecnolgicos relacionados con el receptor de televisin y con el
sistema de representacin de imgenes. El objetivo fundamental era que la seal de vdeo
proporcionara informacin suficiente al receptor para mantener constantemente un correcto
sincronismo con el transmisor, y que todo ello pudiera implementarse con circuitos electrnicos
relativamente simples y econmicos. Veremos que los sincronismos se insertan dentro de la
informacin de vdeo de manera que sea muy simple su extraccin y separacin respecto a la
componente de luminancia. Asimismo, sus formas de onda estn diseadas para que sean fcilmente
separables los dos tipos de informacin de sincronismo. Algunas especificaciones y tiempos de guarda
en las seales de sincronismo pueden parecer excesivamente restrictivos desde el punto de vista de la
tecnologa actual, por lo que siempre deberemos tener presente el estado de la electrnica en el
momento en que fueron definidas.

En la figura 2.1 se representa esquemticamente una seccin transversal de un tubo de imagen
monocromo indicando sus componentes bsicos. A continuacin describimos brevemente la funcin y
caractersticas principales de cada uno de estos elementos.

2.2.1 Ctodo, filamento y rejilla
La funcin principal del ctodo es la de generar los electrones que formarn el haz. Normalmente, est
formado por un tubo de nquel recubierto por un material rico en bario y que es calentado mediante un
filamento de tungsteno. La temperatura alcanzada y el tipo de material utilizado para el recubrimiento
son los factores clave que determinan la temperatura del tubo de rayos catdicos. Algunos sistemas
proporcionan una reserva con un compuesto de bario que durante la vida del tubo va refrescando
constantemente el rea activa. Con ello se consigue aumentar la vida del tubo aproximadamente en un
factor tres. Sin embargo, la temperatura de este tipo de ctodos es superior a la de los sistemas
convencionales por lo que aumenta la probabilidad de fallo y se reduce la fiabilidad del sistema.
Recientemente, se estn introduciendo algunos sistemas con ctodos de estado slido que aprovechan
el efecto de inyeccin de electrones desde el silicio a un dixido de silicio. Este tipo de sistemas se
conocen con el nombre de ctodos fros y tienen la ventaja de que requieren niveles de tensin mucho
menores para controlar el haz, con lo que se reduce notablemente la complejidad del amplificador de
vdeo.

Los electrones generados por el ctodo son acelerados por la tensin positiva aplicada a la rejilla g2 y
pasan a travs de un pequeo orificio situado en la rejilla g1. La tensin de la rejilla g1 controla la
intensidad del haz. Cuanto ms negativa sea la polarizacin de esta rejilla menor ser la intensidad del
haz. La modulacin de la intensidad del haz siguiendo la seal de luminancia puede realizarse
modificando la tensin de la rejilla g1, o bien, como es habitual en los receptores modernos, actuando
directamente sobre la tensin del ctodo. En este ltimo caso, la tensin de la rejilla g1 determina la
intensidad global del haz actuando directamente sobre el brillo de la pantalla.

Fig. 2.1 Estructura y componentes bsicos de un tubo de imagen en blanco y negro

2.2.2 Rejillas de aceleracin y enfoque
Una vez los electrones que constituyen el haz han pasado a travs de la rejilla g1, son acelerados por
la segunda rejilla g2 (a veces denominada primer nodo) y penetran en la rejilla g3, cuya funcin es
tratar de enfocar el haz concentrando toda la energa en una pequea seccin de forma
aproximadamente circular. Posteriormente, los electrones son nuevamente acelerados hacia la pantalla
por la rejilla g4 y el nodo.

2.2.3 Deflexin del haz
La deflexin del haz puede realizarse mediante sistemas electrostticos o magnticos. La deflexin
electrosttica slo puede usarse para ngulos de deflexin pequeos, por lo que la mayora de los
Aluminio
Fsforo
Vidrio
Ctodo
Rejilla g1
Rejilla g2
Foco g3
Bobinas
deflexin
g4
EHT
Aluminio
Fsforo
Vidrio
Aluminio
Fsforo
Vidrio
Ctodo
Rejilla g1
Rejilla g2
Foco g3
Bobinas
deflexin
g4
EHT
tubos domsticos utilizan una deflexin magntica. Para ello se usan dos bobinas que controlan
independientemente la desviacin del haz en sentido horizontal (lneas) y vertical (campos).

2.2.4 Pantalla
El haz de electrones impacta contra la pantalla, donde activa los fsforos que convierten la corriente
de electrones en luz. Justo de antes de impactar contra los fsforos, el haz pasa a travs de una fina
capa de aluminio situada entre los fsforos y el cristal. La funcin de esta pelcula de aluminio es
doble. Por una parte protege a los fsforos de los posibles iones que hayan quedado remanentes en el
tubo despus de su sellado y que al ser bombardeados por el haz de electrones podran alcanzar altas
temperaturas y quemar los fsforos. Esta pelcula de aluminio es suficientemente fina para permitir el
paso de los electrones para disipar la energa de los iones. Adems, garantiza que toda la luz generada
por los fsforos es reflejada hacia el espectador y no hacia el interior del tubo.

En los tubos de color existe una mscara adicional que se encarga de asegurar que cada haz de color
impacta nicamente sobre el tipo de fsforos al que est destinado. El inconveniente principal de esta
mscara es que intercepta gran parte de la energa del haz, reduciendo por tanto la intensidad de luz.
Toda la superficie interior de la cavidad del tubo est recubierta con un material de grafito conductor,
que se interconecta con la pelcula de aluminio y el electrodo g4. Este sistema permite garantizar que
toda la corriente generada en el ctodo se retorna a la fuente de alimentacin.

2.2.5 Forma del raster
En televisin se denomina raster al trazado que realiza el haz de electrones cuando explora la pantalla.
Idealmente este trazado debera estar formado por lneas rectas (con una ligera inclinacin debida al
barrido vertical de la pantalla) que estn uniformemente separadas. Sin embargo, si el haz slo se
controla mediante sistemas de deflexin lineales, la forma del raster en la pantalla no sera lineal. Este
efecto, que se ilustra en la figura 2.2, produce una distorsin con forma de cojn en la pantalla y es
tanto ms importante cuanto ms plana es la pantalla.

Existen varios procedimientos para corregir esta distorsin. Una primera alternativa es controlando el
devanado de las bobinas de deflexin para que produzcan una distorsin de barril (inversa a la
distorsin de cojn, ver figura 2.3) que cancele la primera distorsin. Otra solucin consiste en
deformar las seales de corriente de deflexin electrnicamente para cancelar la distorsin. Este
sistema se utiliza sobre todo en tubos de color de tres ctodos. Otra posibilidad consiste en disponer
un conjunto de pequeos imanes permanentes, colocados sobre la periferia de las bobinas o en el
exterior de la cavidad de la pantalla, que distorsionan el campo de deflexin del haz y que cancelan la
distorsin de cojn. En los tubos actuales de blanco y negro o color suele utilizarse una combinacin
de todas estas alternativas.

2.2.6 Modulacin del haz mediante la seal de luminancia
La intensidad del haz de electrones se controla regulando la tensin existente entre el ctodo y la
primera rejilla g1. En la prctica, la modulacin de la intensidad del haz mediante la seal de
luminancia puede aplicarse a cualquiera de los dos terminales o incluso a ambos. Actualmente, la
tcnica ms utilizada es la modulacin de la tensin aplicada al ctodo, manteniendo fija la tensin de
la rejilla g1.

Fig. 2.2 Forma del raster en una pantalla plana: distorsin de cojn

Fig. 2.3 Distorsin de cojn y de barrl

La relacin entre la tensin aplicada al terminal de control de intensidad del haz y la iluminacin es,
sin embargo, fuertemente no lineal. Esta relacin se representa grficamente en la figura 2,4 y se
corresponde con la ecuacin:
Pantalla plana
Lnea
recta
Distorsin
de cojn
Plano deflexin
vertical constante
Origen
Pantalla plana
Lnea
recta
Distorsin
de cojn
Plano deflexin
vertical constante
Origen
Distorsin de cojn.
Obtenida sobre la pantalla si no se
aplican correcciones a los sistemas
de deflexin del haz
Distorsin de barrl.
Aplicada como predistorsin del
campo de deflexin para corregir
la distorsin de cojn.
Distorsin de cojn.
Obtenida sobre la pantalla si no se
aplican correcciones a los sistemas
de deflexin del haz
Distorsin de barrl.
Aplicada como predistorsin del
campo de deflexin para corregir
la distorsin de cojn.

( ) 2 / 3 / 1
) 1 (
2 / 3
3 3
co co dr
dr
haz
V V V D
V D K
I
+
+
= (2.1)

para el caso en que la tensin de control de intensidad se aplique en el ctodo y:

) 2 / 3 / (
3
co dr haz
V V K I = (2.2)

cuando se aplica sobre la rejilla. D representa el factor de penetracin en el fsforo, V
dr
la tensin
aplicada al terminal de control y V
co
la tensin de corte del haz. Esta no linealidad se conoce con el
nombre de gamma y desempea un papel muy importante en la configuracin de las seales a
transmitir que analizaremos con cierto detalle en el apartado siguiente.

Fig. 2.4 Relacin no lineal entre la intensidad del haz y la tensin aplicada al tubo de imagen

2.2.7 Principios de funcionamiento de los tubos de color
El principio de funcionamiento de un tubo de color es parecido al de un tubo de blanco y negro, con la
salvedad de que en vez de un nico haz que representa la informacin de luminancia, disponemos de
un can electrnico para cada componente de color. La formacin de imgenes en color se debe a
que cada uno de los haces incide sobre materiales electroluminiscentes (fsforos) con componentes de
radiacin en cada uno de los colores bsicos. Existen un gran nmero de alternativas tecnolgicas para
la formacin de imgenes en color, cuya descripcin detallada est ms all de los objetivos de este
texto. Los primeros tubos en color fueron propuestos por RCA y estaban basados en tres caones de
electrones dispuestos en una configuracin delta cuyos haces impactaban sobre los fsforos de color a
Tensin entre ctodo y rejilla V
C
o
r
r
i
e
n
t
e

d
e
l

h
a
z

d
e

e
l
e
c
t
r
o
n
e
s
Incremento
tensin rejilla 2
Tensin entre ctodo y rejilla V
C
o
r
r
i
e
n
t
e

d
e
l

h
a
z

d
e

e
l
e
c
t
r
o
n
e
s
Incremento
tensin rejilla 2
travs de una mscara que dispona de una rejilla de puntos. La disposicin de los caones en delta, la
mscara y la pantalla con los fsforos se representan en la figura 2.5. Si las seales que se aplican a
cada can corresponden a las componentes de seal R, G y B y los distintos haces se exploran a
travs de la pantalla de forma que cada haz, al pasar por la mscara incide sobre el fsforo de color
que le corresponde, obtendremos las imgenes en color. A pesar de que el principio de
funcionamiento de este tubo de color es muy simple, los requisitos y ajustes necesarios para que se
produzcan imgenes con la suficiente definicin y pureza son muy complejos. Actualmente, esta
tecnologa es totalmente obsoleta, aunque sus principios de funcionamiento no han variado
excesivamente. La mscara estaba situada unos 2,3 cm por detrs de la pantalla y era una placa
metlica con tantos agujeros como tradas de fsforos existen en la pantalla. La configuracin
geomtrica de los caones es tal que el haz de electrones slo puede impactar contra el tipo de fsforo
que le corresponde al pasar a travs de la mscara. Para que esto sea posible es preciso disponer de
diversos sistemas para controlar los sistemas de direccionamiento de los haces de forma separada.
Cada haz debe pasar a travs del centro de deflexin del tubo, para lo cual deben introducirse dos
magnetos, denominados anillos de pureza, que se montan aproximadamente sobre los primeros
nodos del tubo y mediante los que se corrige la posicin axial de los haces antes de iniciar su
deflexin. Las bobinas de deflexin pueden moverse hacia delante y hacia atrs del tubo para ajustarse
al centro de deflexin. El procedimiento de ajuste es complejo y requiere el ajuste individual de cada
componente de color hasta obtener una buena pureza. Adems, los haces deben converger en todos los
puntos de la pantalla, lo que slo se consigue mediante una combinacin de campos magnticos
estticos y dinmicos que se aplican de forma individual a cada haz.

Fig. 2.5 Principios del tubo de color con caones en delta

La disposicin de los caones en delta se sustituy por la disposicin en lnea, que simplificaba
considerablemente los problemas de convergencia, debido a la disposicin simtrica de los dos
caones que estaban fuera del centro del tubo. Adems, las mscaras evolucionaron hacia
perforaciones del tipo rectangular, lo que permita un mayor rendimiento lumnico del tubo (ms
brillo). La deposicin de los fsforos en la pantalla se realiz mediante bandas verticales continuas
Caones
en delta
Mscara
Fosforos
pantalla
R
G
B
G
R B
Caones
en delta
Mscara
Fosforos
pantalla
R
G
B
G
R B
que reducan la sensibilidad al polo magntico terrestre, aumentando la pureza y permitiendo un
procedimiento de desmagnetizacin ms simple. En la figura 2.6 se muestra un esquema con tres
caones en lnea que utiliza fsforos rectangulares.

Fig. 2.6 Principios del tubo con caones en lnea y mscaras rectangulares

Fig. 2.7 Comparacin entre un tubo convencional y un tubo Black-Matrix

Otra mejora introducida en los tubos es el denominado sistema de black-matrix, que permite obtener
pantallas con menor ndice de reflexin de la luz. En una pantalla convencional, cuando est apagada
se observa un tono grisceo, que es el color de los fsforos y que adems refleja bastante la luz
ambiente. Cuando la pantalla est encendida, el nivel de negro de la imagen queda representado por
este color grisceo y las reflexiones del ambiente que producen los fsforos. Para obtener un elevado
contraste es necesario que las partes de la imagen que estn activas produzcan una cantidad de luz
muy superior a la que reflejan los fsforos. El sistema black-matrix, que se obtiene insertando bandas
negras entre los fsforos, tal y como se ilustra en la figura 2.7, permite mejorar la relacin de contraste
reduciendo la luz reflejada por la pantalla. En una pantalla que tenga una distancia entre tradas de 0.6
Caones
en lnea
Mscara
Fosforos
pantalla
R G B
G
R B
Caones
en lnea
Mscara
Fosforos
pantalla
R G B
G
R B
R G B R
R G B R
Hi- bri Black-Matrix
R G B R
R G B R
Hi- bri Black-Matrix
mm, las bandas negras son de 0.08 mm, lo que proporciona un total de banda negra por tripleta de
0.24 mm, es decir, un 40 % del ancho de la tripleta. Esto significa que con esta tcnica se absorbe un
40% de la luz incidente, proporcionando una menor intensidad de luz reflejada y por tanto un aumento
considerable del contraste que puede obtenerse con el tubo. Adems, la insercin de las bandas negras
proporciona una distancia de guarda entre los fsforos que aumenta la pureza y reduce la sensibilidad
del sistema al campo magntico terrestre.

La introduccin del tubo Triniton supuso un avance muy significativo en la produccin de tubos en
color, ya que se trataba de un tubo muy estable y que requera muchos menos ajustes. Esta tecnologa
fue desarrollada por Sony en 1968 y sigue siendo la base de los tubos Black-Triniton (Triniton con
Black-Matrix) y Flat-Display actuales. La idea bsica se representa en la figura 2.8 y consiste en que
en vez de tres caones electrnicos, existe uno solo con tres ctodos, los cuales se encuentran
alineados horizontalmente a una distancia inferior a la que se obtiene mediante la configuracin de
tres caones en lnea. A continuacin existe un sistema de electrodos que hacen de lente electrnica
mediante la que se realiza el enfoque de los haces que se cruzan en el centro del tubo. El haz verde
sigue una trayectoria recta, mientras que los otros dos son deflectados por la placas a4 de modo que
cuando atraviesan la mscara van a parar sobre su fsforo correspondiente. La mscara en estos tubos
est formada por tiras verticales metlicas continuas, curvada por una sola direccin (curvatura
cilndrica) y sujeta mediante un bastidor mediante el que se consigue mantenerla en tensin. En la
pantalla se depositan tiras de fsforos verticales y las bandas negras que las separan y absorben la luz
ambiental. La disposicin cilndrica de la pantalla reduce las deformaciones de la imagen. La nica
convergencia necesaria es la dinmica horizontal, que adems se corrige fcilmente actuando de forma
electrnica sobre las bobinas deflectoras.

Fig, 2.8 Principios de funcionamiento del tubo triniton

2.3 Correccin gamma
La relacin no lineal entre la tensin aplicada al ctodo y la iluminacin de la pantalla es un problema
propio del receptor que de algn modo debe ser corregido, pues en caso contrario la iluminacin que
observar el espectador no se corresponder con la de la escena. La razn de que esta relacin no
Ctodos
g1 a1 a2 a3 a4
-
-
+
+
Bobinas
deflectoras Mscara
Pantalla
Ctodos
g1 a1 a2 a3 a4
-
-
+
+
Bobinas
deflectoras Mscara
Pantalla
lineal reciba el nombre de gamma se debe a que, en general, las expresiones anteriores pueden
simplificarse y expresarse como:

= ) (
dr haz
V K I (2.3)

donde en general el valor del parmetro gamma depende del tipo de control de haz que se implemente
y del tipo de fsforos utilizados. Los valores ms tpicos de gamma estn situados entre 2 y 3.

La solucin ms obvia parece, en principio, corregirla en el propio receptor, pues se trata de un
problema originado en ste y que no se produce en las cmaras (que por lo general presentan una
excelente linealidad entre la tensin sensada y la cantidad de luz incidente). Sin embargo, ya estamos
acostumbrados a que, a veces, en televisin no suelen primar las soluciones ms obvias, sino las ms
econmicas. Por ello, para no encarecer el receptor mediante la introduccin de circuitos no lineales,
se decidi realizar esta correccin en el transmisor, pasando las seales de luminancia o de croma a
travs de unos sistemas no lineales que realizaran una transformacin inversa, de modo que cuando
esta seal se aplicara directamente al tubo de imagen, se obtuviera una iluminacin proporcional a la
que originalmente haba en la escena.

Fig. 2.9 Principio de la correccin gamma en el transmisor

La idea general se representa en la figura 2.9 donde se indica que la seal de luminancia originada en
la cmara se pasa a travs de un dispositivo no lineal (implementado mediante diodos y transistores
que, por supuesto, trabajarn en zona no lineal) que modifica su amplitud de acuerdo con la relacin:

=
/ 1
) ( ' Y A Y (2.4)

donde A representa un factor de ganancia constante.

Al aplicar esta seal de luminancia corregida directamente al tubo de imagen se obtiene una corriente
del haz que tiene una relacin de proporcionalidad con la luminancia original:
Y Y
Correccin gamma
Y
Respuesta
del tubo
Y
Y=A (Y)
(1/ )
Ihaz=K (Y)
( )
Y Y
Correccin gamma
Y
Respuesta
del tubo
Y
Y=A (Y)
(1/ )
Ihaz=K (Y)
( )

Y cte Y K I
haz
= =

) ' ( (2.5)

De este modo, podemos garantizar que la imagen que finalmente ser visualizada por el espectador se
corresponder con la luminancia original de la escena.

El valor de la constante gamma que debe utilizarse est normalizado por el ITU a un valor de 2.2 para
los sistemas de televisin en blanco y negro y a un valor de 2.8 para los sistemas en color. En este
ltimo caso, las seales a las que se aplica la correccin de gamma son las componentes R, G y B
obtenidas en la cmara. Con ello, se obtienen las componentes:

); ( '
); ( '
); ( '
/ 1
/ 1
/ 1
=
=
=
B A B
G A G
R A R
(2.6)

que posteriormente se combinan, de acuerdo con las ecuaciones presentadas en el captulo anterior,
para obtener la seal de luminancia y las componentes diferencia de color que deben transmitirse en el
sistema de color. As, en el caso del sistema PAL, las seales que finalmente se transmiten vienen
determinadas por las expresiones:

; ' ' )' (
; ' ' )' (
; ' 11 . 0 ' 59 . 0 ' 3 . 0 '
Y B Y B
Y R Y R
B G R Y
=
=
+ + =
(2.7)

Sin embargo, como probablemente el lector ya habr observado, el uso de una constante gamma
distinta para los sistemas en blanco y negro y los de color supone una cierta prdida de compatibilidad
entre ambos. En efecto, cuando se transmite la seal de color y se visualiza en un receptor en blanco y
negro, la luminancia que se aplica al tubo de imagen se ha obtenido corrigiendo las componentes R,
G, B mediante una gamma de valor 2.8, mientras que la no linealidad del tubo monocromo tiene un
valor de gamma de 2.2. As pues, la seal de luminancia que se aplica al receptor en blanco y negro ha
sido sobrecorregida, con lo que la informacin que recibe el espectador no se corresponde con los
valores originales de la cmara. El efecto global es que la imagen obtenida es algo ms clara que la
original. No obstante, esta no linealidad es tolerable.

Otro problema derivado de la correccin de gamma aparece en sistemas para la representacin de
imgenes basados en pantallas de cristal lquido (L.C.D.). En estos sistemas la linealidad entre la
tensin de control y la iluminacin de la pantalla es excelente, por lo que no requeriran ninguna
correccin. No obstante, al haberse aplicado una correccin de gamma en la transmisin, es necesario
introducir en estos receptores un sistema no lineal que elimine la primera transformacin y restaure las
seales de luminancia o de color originalmente obtenidas en la cmara. Vemos pues que, desde el
punto de vista de estos monitores, la correccin de gamma realizada en el receptor no parece una
decisin muy acertada. Por todo ello, es muy posible que los futuros sistemas de televisin no realicen
la correccin de gamma y dejen esta tarea, si es necesaria, al receptor.

2.4 Seales de deflexin del haz
2.4.1 Caso ideal
Las seales que se aplican a las bobinas de deflexin del haz tienen, en el caso ideal, una forma de
diente de sierra. El periodo de las seales coincide con el periodo de lnea para la corriente de
deflexin horizontal y con el de campo para la vertical. As pues, para el estndar europeo la
frecuencia de la seal de barrido horizontal es de 15625 Hz, mientras que la de barrido vertical es de
50 Hz. Su amplitud oscila entre unos valores mximo y mnimo que se corresponden con las
corrientes que deben aplicarse a las bobinas de deflexin para posicionar el haz en los extremos de la
pantalla. Las formas de onda se representan esquemticamente en la figura 2.10, donde hemos
supuesto que la corriente horizontal mnima se corresponde con la posicin del haz en el extremo de
izquierdo de la pantalla y el mnimo de la corriente vertical con la posicin del haz en el extremo
superior. Este convenio a veces se intercambia, por lo que en algunos textos las formas de onda
pueden aparecer invertidas. Es evidente que en la prctica estas formas de onda slo podrn ser
aproximadas, pues la corriente en una bobina no puede cambiar bruscamente. Sin embargo,
supongamos por el momento que estas seales son ideales y que la desviacin del haz es lineal con la
corriente aplicada.

En este supuesto, al aplicar estas corrientes a las bobinas de deflexin, el haz realiza una exploracin
de la pantalla de acuerdo con el patrn indicado en la figura 2.11. Suponiendo que el primer campo se
iniciase en el extremo superior derecho de la pantalla, el haz ira explorando cada lnea hasta el
extremo derecho, tras lo cual retornara inmediatamente hasta el extremo izquierdo. Ntese que la
lnea no es perfectamente horizontal, sino que tiene una pequea inclinacin debido a que la corriente
de deflexin vertical disminuye ligeramente durante la exploracin de la lnea. Esta inclinacin ha
sido exagerada en la representacin de la figura 2.11 con objeto de poder observar las transiciones
entre lneas y campos con mayor claridad. El desplazamiento vertical entre los dos extremos de una
lnea debera de ser de 2H/N
L
ya que la seal de barrido vertical debe realizar la exploracin completa
de la pantalla (es decir, toda su altura: H) en el tiempo asignado a N
L
/2 lneas.

Fig. 2.10 Seales ideales de deflexin del haz en un tubo de imagen en blanco y negro
Campo A Campo B
A
B
C
A
B-C
D-E
D
E
F
F
G
Seal barrido haz horizontal
Seal barrido haz vertical
Campo A Campo B
A
B
C
A
B-C
D-E
D
E
F
F
G
Campo A Campo B
A
B
C
A
B-C
D-E
D
E
F
F
G
Seal barrido haz horizontal
Seal barrido haz vertical

Fig. 2.11 Exploracin del haz en la pantalla con seales de barrido ideales

Este ligero desplazamiento vertical permite que la exploracin de la siguiente lnea se inicie en una
posicin vertical situada algo por debajo de la lnea precedente. En las figuras 2.10 y 2.11 se
representan las posiciones sobre la pantalla y las tensiones asociadas a estos puntos caractersticos con
los smbolos A (punto de inicio de la exploracin), B (punto final de la primera lnea) y C (punto
inicial de la siguiente lnea, que est situado en la misma posicin vertical que el punto B).

Por otra parte, como el nmero de lneas de los sistemas de televisin analgicos es, como ya se haba
argumentado en el captulo anterior, impar, el final del primer campo se produce cuando la seal de
barrido horizontal se encuentra en la mitad de la pantalla (posicin correspondiente a media lnea).
Esto significa que el haz retorna al extremo superior de la pantalla con una posicin horizontal
centrada, tal y como se ha representado en la figura 2.11. Los puntos y las tensiones asociadas al final
del primer campo y el inicio del segundo se representan respectivamente con las letras D y E. La
posicin en la pantalla de esta primera media lnea se trazar justo por encima de la primera lnea del
campo anterior. Adems, esta nueva lnea alcanza el extremo derecho de la pantalla en una posicin
vertical (punto F) de valor mitad al que le corresponda en el punto B, de modo que el inicio de la
siguiente lnea (punto G, que se encuentra situado en la misma posicin vertical que el F) se
representar entre las dos primeras lneas del primer campo. De esta forma, las lneas correspondientes
a cada uno de los dos campos quedan perfectamente imbricadas, obteniendo un correcto entrelazado
de las imgenes.

2.4.2. Seales de deflexin del haz: aproximacin al caso real
En principio, si las seales de deflexin del haz fueran ideales podramos transmitir la informacin de
luminancia en todo instante de tiempo, sin necesidad de proporcionar los tiempos de guarda definidos
por las partes activa y no activa de las lneas y los campos. Sin embargo, la desviacin de los
A
C
B
G
F
E
D
A
C
B
G
F
E
D
generadores de diente de sierra respecto al supuesto ideal impone que no pueda transmitirse la seal
de luminancia durante el periodo de tiempo en el que se produce la conmutacin del generador. Sin
embargo, estos tiempos de guarda se utilizan, tal y como hemos visto en captulo anterior, para
transmitir la informacin de sincronismo, por lo que no son totalmente desaprovechados.

La forma exacta de las seales de deflexin del haz es difcil de predecir, ya que dependen del circuito
electrnico utilizado para su sntesis, que, como es obvio, presenta diferencias significativas
dependiendo tanto del modelo de receptor como del fabricante. Adems, los circuitos de deflexin
horizontal y vertical suelen ser muy distintos, ya que las frecuencias que deben generar son muy
dispares (50 Hz y 15625 Hz). Tngase en cuenta que el modelo circuital de las bobinas de deflexin
depende de la frecuencia, por lo que las cargas de los circuitos de barrido horizontal y vertical son
considerablemente diferentes, lo que exige el empleo de filosofas de generacin de la seal distintas.
En nuestro caso tan slo nos interesa tener una idea general de cmo las formas de onda reales se
apartan del caso ideal y de cmo sta desviacin influye en la definicin de los parmetros de la seal
de televisin. Por ello, obviamos el problema circuital de la generacin de las seales y nos
referiremos a una hipottica forma de onda no ideal, que se representa en la figura 2.12 y que
aplicaremos tanto para el barrido vertical como el horizontal.

Fig. 2.12 Forma de onda no ideal de un generador en diente de sierra

Esta seal genrica tiene una zona lineal que se corresponde con la exploracin uniforme del haz
sobre la pantalla que se obtena con el diente de sierra ideal. Sin embargo, la discontinuidad del diente
de sierra, que permita el retorno inmediato del haz para iniciar la exploracin de una nueva lnea o
campo, desaparecer y, aunque es posible obtener un tiempo de conmutacin reducido, es importante
tener en cuenta este aspecto y, como mnimo, definir una seal de televisin que permita que los
fabricantes puedan utilizar generadores de diente de sierra simples y econmicos. Obsrvese que las
bobinas de deflexin representan una carga inductiva importante que limita la capacidad del generador
Zona lineal Conmutacin y
transitorio
t
I
deflexin T (lnea o campo)
Zona lineal Conmutacin y
transitorio
t
I
deflexin T (lnea o campo)
de conmutar rpidamente. Esta zona de transicin suele ser no lineal y vara notablemente de un
generador a otro. Su efecto sobre la exploracin del haz en la pantalla es que el retorno al inicio de la
lnea o del campo no se realiza inmediatamente, sino que se invierte un cierto tiempo finito. Durante
este periodo de tiempo es importante garantizar que la energa del haz sea prcticamente nula, puesto
que de lo contrario el retorno del haz sera visible en la pantalla. Ntese que debido a la variabilidad
que presenta esta regin para distintos generadores, es absurdo intentar aprovecharla para volcar parte
de la informacin de luminancia.

Otro aspecto que se ha indicado en la figura 2.12 es la aparicin de un rgimen transitorio, con
oscilaciones amortiguadas, que aparecen antes iniciar la zona lineal y que se conocen con el nombre
de oscilaciones de Barkaunsen. Estas oscilaciones, cuyo nivel ha sido exagerado en la grfica, son
comunes a todos los generadores de diente de sierra y suele considerarse que han desaparecido
completamente despus de un tiempo de aproximadamente un 10 % del periodo de la seal. Como en
el caso anterior, es importante garantizar que no se transmite informacin de luminancia durante el
tiempo en que ste se mantiene transitorio. Por tanto, la seal de televisin deber proporcionar un
tiempo de guarda, durante el que no se transmite informacin de luminancia y que permite que el haz
retorne a su posicin de origen. Este tiempo de guarda ser distinto para el retorno de lnea y el de
campo, ya que los dos generadores tienen caractersticas diferentes. En el caso de la seal de
desviacin horizontal, el tiempo de guarda es de unos 12 s, dejando por tanto un total de 52 s para
la transmisin de la informacin de luminancia. Los 12 s de guarda se aprovechan para enviar la
seal de sincronismo de lnea y, en el caso de televisin en color, para transmitir una referencia de
fase de la portadora de la informacin de croma.

Durante el cambio de campo, la seal de luminancia deja de transmitirse durante un tiempo de 1,6 ms
(25 lneas). Nuevamente, durante este periodo de tiempo se transmiten las seales de sincronismo de
campo y en este caso, se utilizan algunas lneas para la transmisin de la seal de teletexto y para la
transmisin de lneas de prueba (test), cuya posicin exacta indicaremos ms adelante. Es importante
observar que slo una parte de estos tiempos de guarda se corresponden con el retorno horizontal o
vertical del haz. Los tiempos de guarda o, en otras palabras, las partes no activas de la seal de
televisin, estn sobredimensionados para permitir acomodar distintos tipos de circuitos de barrido y
proporcionar tiempo suficiente para garantizar que el receptor est en condiciones de detectar el envo
de las seales de sincronismo o iniciar una nueva exploracin de una lnea o campo. Veremos los
detalles de las distintas componentes que se transmiten durante estos periodos en las secciones
siguientes.

2.5 Sincronismo de lnea
El sincronismo de lnea se transmite con el objeto de informar al receptor de la ocurrencia del final de
una lnea e inicio de otra. Esta seal debe poder ser separada con facilidad de la seal de luminancia,
por lo que se transmite con una polaridad invertida respecto a la primera. En la figura 2.13 se
representa la forma de onda de la componente de sincronismo de lnea, junto a una hipottica
informacin de luminancia asociada a las lneas entre las que est situado el pulso de sincronismo.

La amplitud del impulso de sincronismo representa aproximadamente un 30 % de la excursin total de
la seal de televisin y se sita por debajo del nivel de referencia o de cero voltios. Es decir, si
normalizamos la excursin de esta seal a 1 voltio pico a pico, obtendremos que las tensiones de la
seal de luminancia van desde 0 voltios (nivel de negro) a 0.7 voltios (nivel de blanco), mientras que
los impulsos de sincronismo se situaran a un nivel de 0.3 voltios. Debemos comentar, no obstante,
que los niveles indicados se corresponden con una seal de televisin normalizada a 1 voltio y que en
la prctica es habitual disponer de est seal atenuada o amplificada. Por otra parte, tambin es
frecuente encontrar representaciones de la seal de televisin en las que los niveles de los pulsos de
sincronismo y la seal de luminancia estn invertidos respecto a las formas de onda de la figura 2.13.
La diferencia entre las dos representaciones es una inversin de la seal que puede producirse en
cualquier punto de la cadena de transmisin, por lo que no debe ser significativa. En este texto
usaremos indistintamente las dos representaciones, por lo que es importante que el lector identifique
por el contexto cul de las dos estamos utilizando. En general, cuando hagamos referencia a las
seales de sincronismo, stas se representarn como positivas, mientras que si el aspecto central de la
discusin es la seal de informacin de luminancia o color de la escena, se tomarn los sincronismos
como negativos.

Fig. 2.13 Insercin del sincronismo horizontal entre las lneas de la seal de TV

Aunque, como veremos, la forma de onda de la seal de sincronismo vertical es bastante ms
compleja que la de sincronismo horizontal, los niveles utilizados para transmitir este tipo de
sincronismo son tambin de signo opuesto al de la luminancia y del mismo nivel que los impulsos de
sincronismo horizontal. Por ello, la separacin de las componentes de sincronismo y de luminancia
puede realizarse de manera muy simple, ya que basta con comparar la seal recibida con el nivel de
negro (0 voltios).

Un posible diagrama de bloques genrico para el control de las seales que se envan al monitor se
representa en la figura 2.14, donde vemos que la seal de luminancia se aplica al tubo de imagen para
modular la intensidad del haz, mientras que las seales de sincronismo se envan como referencia a los
Luminancia
lnea k
Luminancia
lnea k+1
Sincronismo
horizontal
t
0 V
Nivel de blanco
Nivel sincronismos
Nivel de negro
70 %
30 %
Luminancia
lnea k
Luminancia
lnea k+1
Sincronismo
horizontal
t
0 V
Nivel de blanco
Nivel sincronismos
Nivel de negro
70 %
30 %
circuitos de generacin de las seales de deflexin del haz. La perfecta coordinacin entre estas tres
seales permite visualizar la imagen en el monitor.

Fig. 2.14 Diagrama de bloques del sistema de separacin de sincronismo y luminancia aplicado al tubo

Fig. 2.15 Detalle del impulso de sincronismo horizontal

En la figura 2.15 se representa un detalle del fragmento de seal correspondiente al impulso de
sincronismo horizontal donde se indican tres partes diferenciadas, cumpliendo cada una de ellas una
misin especfica. El impulso de sincronismo tiene una duracin de 4.7 s y est precedido por una
zona denominada prtico anterior, que tiene el mismo nivel que el negro y una duracin de 1.7 s. La
Comparador
de niveles
Seal luminancia
Tubo de
imagen
Sincronismos
Separador
sincronismos
Generador
deflexin
horizontal
Generador
deflexin
vertical
Comparador
de niveles
Seal luminancia
Tubo de
imagen
Sincronismos
Separador
sincronismos
Generador
deflexin
horizontal
Generador
deflexin
vertical
1.5 s 4.7 s 5.8 s
12 s
Prtico
anterior
Prtico
posterior
I mpulso
sincronismo
horizontal
Lnea k
Lnea k+1
1.5 s 4.7 s 5.8 s
12 s
Prtico
anterior
Prtico
posterior
I mpulso
sincronismo
horizontal
Lnea k
Lnea k+1
misin del prtico anterior es garantizar que el impulso de sincronismo est precedido por una zona
con nivel de negro constante para eliminar cualquier dependencia del inicio del pulso de sincronismo
con el nivel de luminancia con que finaliza la lnea. Esta utilidad se ilustra en la figura 2.16, donde se
indica que si una lnea termina con un nivel de gris prximo al blanco, se requiere de un cierto tiempo
para que el nivel de la seal retorne al negro. Si se recibiera el pulso de sincronismo durante esta
transicin, podra ocurrir que no fuera detectado o que fuera detectado con retardo. La funcin del
prtico anterior es por tanto la de garantizar que el receptor se encuentra en ptimas condiciones,
independientemente del nivel de gris con el que finalizan las distintas lneas, para detectar el impulso
de sincronismo de lnea, que ser utilizado como referencia temporal para reinicializar el generador de
barrido horizontal.

Fig. 2.16 Ilustracin de la misin del prtico anterior

En principio, la deteccin del sincronismo suele realizarse mediante un filtro paso alto, detectando la
primera transicin del impulso. Este momento es, en principio, el punto en que el generador de diente
de sierra conmuta para reinicializar la exploracin del haz. El tiempo restante desde este momento y
hasta que se recibe la informacin asociada corresponde al propio impulso de sincronismo y al prtico
posterior. Todo este periodo de tiempo, que se extiende hasta 10.5 s, se utiliza como guarda para
garantizar que el generador de la seal de barrido ha tenido tiempo suficiente para situarse en la zona
lineal y puede aplicarse la seal de luminancia.

Consideraremos ahora, con algn detalle, cmo afectara a la imagen que se visualiza en la pantalla el
uso de dos generadores de barrido horizontal que tuvieran unos tiempos de transicin distintos. Para
ello supongamos que se dispone de dos generadores que entregan unas seales como las que se
representan en la figura 2.17. Es importante observar que los dos generadores cumplen con las
condiciones exigidas por la seal de televisin, ya que aunque uno de ellos conmute mucho ms
Lnea
k+1
Lnea
k
La lnea acaba con un
nivel prximo al blanco
nivel prximo al negro
Los tiempos para el retorno al
nivel de negro dependen del
nivel con el que acaba la lnea
Lnea
k+1
Lnea
k
nivel prximo al blanco
nivel prximo al negro
Los tiempos para el retorno al
nivel de negro dependen del
nivel con el que acaba la lnea
rpidamente que el otro, los dos estn dentro de los lmites esperados. Si no fuera as, ya hemos
comentado que las no linealidades y transitorios del generador seran visibles en la pantalla
deteriorando gravemente la imagen.

Fig. 2.17 Efectos de las diferencias entre generadores de barrido de pantalla

Fig. 2.18 Imgenes obtenidas con los dos generadores de barrido considerados

En la figura 2.18 se representan las imgenes que se obtendran en el supuesto de que la excursin de
seal de los dos generadores fuera idntica y que se aplicaran a un mismo tubo de rayos catdicos.
Ntese que cuando se recibe la seal de luminancia, el generador ms rpido tiene un nivel de tensin
superior al del otro generador, por lo que la presentacin de la imagen se empezar en una posicin
horizontal ms avanzada, tal y como se ha indicado en el grfico. Sin embargo, es evidente que este
problema no es, en absoluto, grave, por lo que puede solventarse controlando el nivel de continua
Luminancia
lnea k
Luminancia
lnea k+1
t
0 V
t
M
i
s
m
a
e
x
c
u
r
s
i
n
Luminancia
lnea k
Luminancia
lnea k+1
t
0 V
t
M
i
s
m
a
e
x
c
u
r
s
i
n
La imagen correspondiente al
generador que conmuta ms
rpidamente se genera ms
hacia la derecha de la pantalla.
El segundo generador tiene un
nivel de tensin ms bajo cuando
se recibe la luminancia por lo que
la exploracin se inicia ms hacia
la izquierda.
La imagen correspondiente al
generador que conmuta ms
rpidamente se genera ms
hacia la derecha de la pantalla.
El segundo generador tiene un
nivel de tensin ms bajo cuando
se recibe la luminancia por lo que
la exploracin se inicia ms hacia
la izquierda.
(offset) y la amplificacin de las seales de barrido. En efecto, en la figura 2.19 se han representado
las mismas seales de barrido que las consideradas en la figura 2.18, pero con unos niveles de
continua y excursiones adaptadas para que ambas seales permitan un barrido del haz desde un
extremo a otro de la pantalla.

Fig. 2.19 Ajuste de las seales de barrido para explorar todo el ancho de la pantalla

Fig. 2.20 Efectos del control de continua y amplificacin sobre la imagen
t
M
i
s
m
a
e
x
c
u
r
s
i
n
Nivel de tensin correspondiente al extremo derecho de la pantalla
Nivel de tensin correspondiente al extremo izquierdo de la pantalla
t
M
i
s
m
a
e
x
c
u
r
s
i
n
Nivel de tensin correspondiente al extremo derecho de la pantalla
Nivel de tensin correspondiente al extremo izquierdo de la pantalla
Variacin del
nivel de continua
de la seal de
barrido horizontal
Variacin del
nivel de amplificacin
de la seal de
barrido horizontal
Variacin del
nivel de continua
de la seal de
barrido horizontal
Variacin del
nivel de amplificacin
de la seal de
barrido horizontal
El cambio de nivel de continua de la seal de barrido produce un desplazamiento horizontal de la zona
de la pantalla en la que se presenta la imagen, mientras que la amplificacin o atenuacin de los
niveles representa una ampliacin o reduccin del tamao horizontal de la imagen. Ambos efectos se
ilustran en la figura 2.20. Los efectos que sobre la imagen introduce la amplificacin de la seal de
barrido o el offset son, evidentemente, generalizables al subsistema de barrido vertical, por lo que no
repetiremos estos argumentos cuando consideremos los sincronismos verticales.

Los receptores antiguos solan proporcionar al usuario controles para el ajuste de los niveles de
continua y amplificacin de las seales de barrido. Estos ajustes se han suprimido en la mayor parte de
receptores actuales que, ya vienen preajustados de fabrica o, incluso, son capaces de realizar un ajuste
automtico de estas seales cada vez que se conectan. No obstante, en los monitores para ordenador es
habitual que el usuario tenga acceso a estos controles.

La sincronizacin de los generadores de barrido puede realizarse en principio de dos maneras:

a) Disparo directo.
b) Disparo controlado (Line Flywheel)

El primer mtodo consiste en disparar el generador de barrido cada vez que se detecta la llegada de un
impulso de sincronismo de lnea. Fue un sistema que se utiliz slo en los primeros receptores y que
est en desuso, por cuanto es muy sensible al ruido (disparos no deseados) y es posible que algunos
pulsos no sean correctamente detectados, con lo que se perdera la informacin correspondiente a esa
lnea.

El sistema utilizado en prcticamente todos los receptores se basa en un sistema PLL (Phase Locked
Loop) simple o dual, de modo que la informacin de sincronismo se utiliza nicamente para ajustar la
frecuencia interna de la seal de barrido que se est generando. En el caso de que aparezcan ruidos
espurios que activan el sistema de deteccin de sincronismos, stos slo modifican ligeramente la
frecuencia del sistema sin que se produzcan efectos visibles. Anlogamente, si se pierde alguno de los
impulsos, el sistema interno sigue generando la seal de barrido sin que el error sea observado por el
espectador.

En la figura 2.21 se representa el diagrama de bloques de un sistema de generacin de seal de barrido
horizontal que utiliza esta tcnica. La seal de sincronismo se pasa a travs de un bloque encargado de
detectar los pulsos de sincronismo de lnea y que normalmente es un filtro paso alto o derivador que
recorta una de las polaridades de la derivada. Esta seal se introduce, junto con una seal parecida,
pero generada internamente, a un comparador de fase cuya tensin de salida controla la frecuencia de
un oscilador (oscilador controlado por tensin V.C.O.). En la salida del VCO existe un conformador
de onda que obtiene la seal en diente de sierra a partir de la seal proporcionada por el oscilador.
Esta seal, que se amplifica y a la que se aade un nivel de continua adecuado, se aplica a las bobinas
de deflexin horizontal. La referencia de sincronismo interna se obtiene derivando la seal obtenida
en la salida de este conformador.

La polaridad de seal en la salida del comparador de fase depende de cul de los dos impulsos se
recibe antes, y su nivel es proporcional a la diferencia de tiempos. En el supuesto de que el impulso
procedente del sincronismo externo se recibiera antes que el interno, indicara que la frecuencia de las
seales de barrido internas es ms baja que el ritmo con la que recibimos las lneas, por lo que el
comparador de fase generar una tensin positiva que provocar un aumento, proporcional a la
diferencia de tiempos, de la frecuencia de la seal interna. Esta filosofa de control de la frecuencia del
generador de barrido converge, siempre que los parmetros del bucle de realimentacin estn
correctamente diseados, en una situacin en la que la seal de barrido coincide, en frecuencia y fase,
con la cadencia con la que se transmiten las lneas de la seal de televisin.

Fig. 2.21 Sistema de control de frecuencia del generador de barrido horizontal

2.6 Sincronismo de campo
La seal de sincronismo de campo es considerablemente ms compleja que la de sincronismo de lnea,
pues la seal de luminancia deja de transmitirse durante un total de 25 lneas en cada campo, tiempo
que se utiliza no slo para insertar el pulso de inicio de campo, sino todo un conjunto de componentes
que se encargarn de asegurar que los circuitos que deben detectar esta seal estn en las mismas
condiciones iniciales y finales en los dos campos. Adems, algunas de estas 25 lneas, que se denotan
con el nombre de lneas de borrado de campo, se aprovechan para transmitir seales de prueba y de
teletexto. Las formas de onda correspondientes al periodo de borrado de campo se representan en las
figura 2.22 y figura 2.23, donde se indica la secuencia exacta de impulsos de sincronismo y las
seales que se producen en cada campo. En estas grficas los impulsos de sincronismo se han
indicado con polaridad positiva, mientras que la seal de luminancia se representa con valores de
tensin negativos. Esta representacin es justamente la inversa que la utilizada en la figura 2.13. Sin
embargo, ya all habamos comentado que, a menudo dependiendo del contexto, las polaridades de la
luminancia y los sincronismos pueden aparecer invertidas. En este caso, estamos centrando la atencin
sobre los impulsos de sincronismo, por lo que nos resultar algo ms cmodo suponer que estas
seales son positivas.

La estructura de la seal de borrado de campo no resulta aparentemente trivial. Examinaremos con
detalle y justificaremos cada una de sus componentes dentro de poco, pero por el momento
describamos las distintas partes en las que se descompone.

Consideremos inicialmente el campo impar (ver figura 2.22). Aunque el inicio del campo se produce
en la lnea 1, la seal de luminancia deja de transmitirse un poco antes, en la mitad de la lnea 623, con
el objeto de disponer de tiempo suficiente para que los circuitos de deteccin de sincronismo de
campo estn preparados para su correcta recepcin. En la mitad de la lnea 623 se inicia una secuencia
Detector
sincronismo
horizontal
V.C.O Conformador
Derivador
Comparador
de fase
Barrido Horizontal Sincronismos
Detector
sincronismo
horizontal
V.C.O Conformador
Derivador
Comparador
de fase
Barrido Horizontal Sincronismos
de impulsos con los mismos niveles y duracin que los impulsos de lnea, pero que tienen una
cadencia doble. Estos impulsos se conocen con el nombre de impulsos de pre-igualacin y su funcin
es que las seales que reciben los circuitos de deteccin de sincronismo de campo sean iguales, tanto
para el caso de que se trate del campo par como del impar, sin que ello suponga una prdida de los
impulsos de sincronismo horizontal. Hay un total de cinco impulsos de pre-igualacin que se
extienden durante dos lneas y media.

El impulso de sincronismo de campo propiamente dicho se inicia en la lnea 1 y se extiende
nuevamente durante 2 lneas y media (hasta la mitad de la lnea 3). Este impulso est caracterizado por
tener, durante la mayor parte del tiempo, una tensin positiva. Sin embargo, durante este periodo se
siguen enviando los pulsos de sincronismo de lnea, aunque ahora se sealizan invertidos y
ligeramente adelantados, utilizando, como en el caso de la pre-igualacin, una cadencia doble de la de
la frecuencia de lnea.

Una vez finalizado el impulso de sincronismo de campo, se envan cinco impulsos de post-igualacin,
que se extienden desde la mitad de la lnea 3 hasta el final de la 5, cuya forma de onda es idntica a la
de los impulsos de pre-igualacin. La funcin de estos impulsos no es tan importante como la de los
de pre-igualacin, y se encargan de que, una vez detectado el sincronismo de campo, las seales
aplicadas a los circuitos de deteccin sean iguales en los dos campos, por lo que ambos se restauran a
unas condiciones iniciales parecidas. Adems, estos impulsos garantizan que la forma de onda sea
simtrica respecto al centro del impulso de sincronismo de campo.

Despus de los impulsos de post-igualacin se incluyen un total de 17,5 lneas en negro. Su funcin es
la de garantizar que los circuitos de barrido han tenido tiempo para conmutar la seal de diente de
sierra y que se genera una seal estable que permite aplicar la seal de luminancia al tubo. Estas 17,5
lneas se extienden desde el inicio de la lnea 6 hasta la mitad de la lnea 23 y contienen los impulsos
de sincronismo horizontal a la cadencia propia de la frecuencia de lnea. Algunas de estas lneas se
aprovechan para transmitir otro tipo de seales que no corresponden a informacin de vdeo. Entre
estas seales se incluye la informacin de teletexto (entre las lneas 11 a 15), cdigos identificativos
de la emisora y seales para el control de la calidad de recepcin de la seal en distintos puntos de la
red de distribucin (lneas 16 a 19).

Estableciendo un paralelismo entre la seal de sincronismo de lnea y la de sincronismo de campo,
podramos decir que los impulsos de pre-igualacin cumplen una funcin similar a la del prtico
anterior, mientras que el conjunto formado por los impulsos de post-igualacin y las 17,5 lneas en
blanco tienen una funcin anloga a la del prtico posterior.

La forma de onda de la seal de borrado del campo par tiene unas caractersticas parecidas a las
descritas para el impar. En este caso el impulso de sincronismo de campo se inicia en la mitad de la
lnea 313 y se extiende hasta el final de la 315. Est precedido por cinco impulsos de pre-igualacin
por lo que la seal de luminancia correspondiente al campo impar deja de transmitirse al final de la
lnea 310. Entre la lnea 316 y la mitad de la 318 estn situados los impulsos de post-igualacin a los
que siguen las 17,5 lneas en negro. La seal de luminancia vuelve a transmitirse al principio de la
lnea 336, utilizando las lneas 324 a 328 para la informacin de teletexto y las 329 a 332 se usan para
transmitir informacin de control.


Fig. 2.22 Detalle de las seales de sincronismo de campo impar

Fig. 2.23 Detalle de la seal de sincronismo de campo par
622 623 624 625 1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20 21 22 23 24
Inicio campo
impar
Impulsos
preigualacin
Impulsos
postigualacin
Seales de
teletexto
Seales de
test
622 623 624 625 1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20 21 22 23 24
Inicio campo
impar
Impulsos
preigualacin
Impulsos
postigualacin
Seales de
teletexto
Seales de
test
310 311 312 313 314 315 316 317 318 319 320 321 322 323
Inicio campo
par
Impulsos
preigualacin
Impulsos
postigualacin
324 325 326 327 328 329 330 331 332 333 334 335 336 337
Seales de
teletexto
Seales de
test
310 311 312 313 314 315 316 317 318 319 320 321 322 323
Inicio campo
par
Impulsos
preigualacin
Impulsos
postigualacin
Inicio campo
par
Impulsos
preigualacin
Impulsos
postigualacin
324 325 326 327 328 329 330 331 332 333 334 335 336 337
Seales de
teletexto
Seales de
test
324 325 326 327 328 329 330 331 332 333 334 335 336 337
Seales de
teletexto
Seales de
test
Las formas de onda de las seales de borrado correspondientes a los campos par e impar son por tanto
muy parecidas, resultando incluso difciles de identificar en la pantalla de un osciloscopio o monitor
de forma de onda, en los que, por lo general, no se dispone de las etiquetas que identifican los
nmeros de lnea de la seal de televisin. El procedimiento ms fcil para determinar si se trata del
campo par o del impar es ver si el campo anterior acaba en una lnea completa o en media lnea de
luminancia (campo par e impar, respectivamente).

Una vez descritas las distintas componentes de la seal de barrido de campo, procederemos a justificar
el por qu estas seales adoptan estas formas de onda que en un principio pueden parecer un tanto
caprichosas. Para ello seguiremos un razonamiento natural y progresivo, intentando introducir el pulso
de sincronismo de campo de una forma muy sencilla y viendo las medidas que deben tomarse para
garantizar que los circuitos de deteccin de sincronismo de lnea y de campo sean lo ms simples
posibles. En general, podramos decir que la complejidad de la seal de borrado de campo est
condicionada por la restriccin de que los circuitos de deteccin deben ser simples y econmicos.

En la figura 2.24 se han representado los impulsos de sincronismo de lnea que se obtendran en la
salida del separador de sincronismo y los puntos en los que corresponde insertar la seal de
sincronismo de campo. Como estamos considerando un sistema de 625 lneas, cada uno de los campos
debe tener una duracin de 312,5 lneas. Esto significa que si suponemos que el campo impar se inicia
en la lnea 1, el par debe iniciarse en la mitad de la lnea 313, es decir, cuando han transcurrido 312
lneas completas ms media lnea adicional.

Fig. 2.24 Puntos de insercin de la seal de sincronismo de campo par e impar

Por otra parte, hemos visto que para simplificar el circuito separador de sincronismos, los impulsos de
inicio de lnea tenan una polaridad distinta a la de la seal de luminancia, por lo que parece lgico
que la seal de sincronismo de campo tambin deba seguir manteniendo esta misma polaridad. Con
ello, todos los sincronismos podrn aislarse de la seal de luminancia mediante un nico circuito. Sin
embargo, esto plantea el problema de cmo separar las componentes correspondientes al sincronismo
de lnea y las asociadas al sincronismo de campo. La forma que en principio parece ms evidente es
utilizar un filtrado de la seal de sincronismo, tal y como se simboliza en la figura 2.25. Los impulsos
622 623 625 1 624 2 3 4 5 6 7 9
310 311 313 314 312 315 316 317 318 319 320 321
Inicio campo impar
Inicio campo par
622 623 625 1 624 2 3 4 5 6 7 9
310 311 313 314 312 315 316 317 318 319 320 321
Inicio campo impar
Inicio campo par
de sincronismo de lnea tienen una duracin corta, por lo que podrn detectarse sin problemas si se
utiliza un filtro paso alto. El impulso de sincronismo de campo podra ser de mayor duracin, de
hecho la cadencia con la que transmiten los campos es muy lenta si se compara con la de las lneas,
con lo que podran ser detectados mediante un filtrado paso bajo o integrador. Utilizando esta sencilla
filosofa, podramos pensar en introducir un impulso de larga duracin (en concreto se define una
duracin de dos lneas y media) como sealizacin para el impulso de sincronismo de campo.

Fig. 2.25 Diagrama de bloques del subsistema de separacin de sincronismos

Fig. 2.26 Seales en la salida de los detectores de sincronismo para un impulso de campo directo

Esta sencilla propuesta de sealizacin se ilustra, para el campo impar, en la figura 2.26, donde se
observa la respuesta que se obtendra al aplicar un filtro paso bajo y uno paso alto a la seal de
sincronismos. En principio, la respuesta obtenida parece satisfactoria y sin duda nos indica que
Separador
sincronismo
Filtro paso
alto
Filtro paso
bajo
Luminancia
+
Sincronismos
Luminancia
Sincronismos
Sicronismo
horizontal
Sicronismo
vertical
Separador
sincronismo
Filtro paso
alto
Filtro paso
bajo
Luminancia
+
Sincronismos
Luminancia
Sincronismos
Sicronismo
horizontal
Sicronismo
vertical
622 623 625 1 624 2 3 4 5 6 7 9
Integrador
Derivador
Prdida sincronismo lnea
Umbral deteccin sincronismo lnea
622 623 625 1 624 2 3 4 5 6 7 9
Integrador
Derivador
Prdida sincronismo lnea
Umbral deteccin sincronismo lnea
estamos en el buen camino. La integracin de la seal produce un resultado que permitir detectar la
presencia del impulso de sincronismo de campo utilizando un simple comparador de nivel. En efecto,
el nivel de la seal en la salida del filtro paso bajo slo exceder el umbral prefijado cuando estemos
en presencia de un impulso de baja frecuencia, ya que los impulsos de sincronismo de lnea no tienen
la duracin suficiente como para obtener un nivel elevado de seal en la salida.

Por otra parte, la seal en la salida del filtro paso alto mantiene un nivel elevado cada vez que se
recibe un impulso de lnea, por lo que, mediante otro comparador de nivel, puede mantenerse la
sincronizacin con los circuitos de barrido horizontal. Sin embargo, la introduccin directa del pulso
de sincronismo de campo impide la transmisin del sincronismo de lnea en toda la extensin de esta
seal. En principio, este problema no es grave, por cuanto hemos comentado que la mayora de
receptores slo utilizan los impulsos de sincronismo de lnea para corregir las posibles desviaciones
del circuito de generacin de barrido horizontal. Por ello, el generador de barrido interno podra
mantenerse sin ningn problema durante estas 2,5 lneas sin que se produjeran desajustes importantes
y, en todo caso, utilizar los impulsos de sincronismo de lnea posteriores para cancelar cualquier
desalineamiento que se haya producido.

No obstante, la seal de televisin debe contemplar una amplia gama de filosofas de recepcin de la
seal y es posible, sobre todo en los primeros receptores de televisin, que existan fabricantes que
prefieran utilizar circuitos de generacin de la seal de barrido horizontal que se activen directamente
mediante la seal de televisin. En estos sistemas, es necesario que la salida del filtro paso alto siga
manteniendo los impulsos de sincronismo horizontal durante la recepcin del sincronismo de campo,
pues en caso contrario podran producirse desviaciones importantes y sobretensiones en los circuitos
de generacin de barrido.

Fig. 2.27 Introduccin de los pulsos de sincronismo de lnea dentro del impulso de campo

Una primera propuesta para mantener la deteccin de los impulsos de sincronismo de lnea durante la
transmisin del sincronismo de campo se ilustra en la figura 2.27. La sealizacin del sincronismo de
lnea se realiza desactivando el pulso de sincronismo de campo durante el tiempo correspondiente a un
Detalle del sincronismo de campo
1 2 3 4
Derivador
Umbral
Detalle del sincronismo de campo
1 2 3 4
Derivador
Umbral
pulso de lnea. La salida del filtro paso alto detectar esta nueva sealizacin, produciendo un tren de
pulsos como el ilustrado en esta misma figura. La alternativa parece buena en primera instancia
aunque se observa que se introduce un retardo en la deteccin del sincronismo de lnea debido a la
propia inversin de la seal. No obstante, esta propuesta sugiere claramente la solucin definitiva: si
se introduce el retorno a cero un poco antes del inicio de la lnea, adelantando ligeramente el pulso de
modo que su final coincida con el inicio de una lnea, podremos mantener perfectamente el
sincronismo horizontal. Esta ltima idea se ilustra en la figura 2.28, donde ahora puede comprobarse
la correcta deteccin del inicio de las lneas.

Fig. 2.28 Insercin del sincronismo de lnea en el de campo

Sin embargo, si examinamos ms detenidamente las formas de onda actuales, veremos que an existen
problemas serios con la deteccin del sincronismo de campo. En efecto, en la figura 2.29 se
representan simultneamente las formas de onda de los impulsos de sincronismo de campo par e
impar. Los inicios de los dos pulsos de sincronismo se han representado sobre la misma vertical, de
modo que se observa un decalaje entre la posicin relativa de los sincronismos de lnea en cada
grfica. Esto es as debido a que el campo par empieza en la mitad de una lnea, mientras que el impar
lo hace al principio de lnea, por lo que aparece una cierta asimetra entre las dos seales.

El resultado de esta asimetra es que, cuando las seales se aplican al circuito integrador encargado de
detectar el inicio de campo, la evolucin de la forma de onda para el campo par y el impar es distinta,
alcanzando el nivel fijado por el umbral antes en un campo que en el otro. Ntese que el campo impar
empieza con una lnea completa, por lo que el impulso de sincronismo de lnea tarda ms en aparecer
que en el campo impar. Por ello la tensin de umbral se alcanza antes para este primer campo.

Este problema es realmente grave, por cuanto si uno de los campos se detecta antes, supondr que ste
tendr mayor duracin que el otro, generando una seal de barrido distinta para cada campo, con lo
que el entrelazado dejar de ser correcto. La solucin al problema exige que las dos seales sean
idnticas, con lo que su integracin tambin producir idnticos resultados. Para ello, es necesario
incorporar los impulsos de sincronismo de lnea en las mismas posiciones relativas dentro de la seal,
1 2 3 4
Derivador
Umbral
1 2 3 4
Derivador
Umbral
es decir, aadiremos un pulso de sincronismo en el campo par all donde estn situados los impulsos
correspondientes al campo impar y viceversa. Esta solucin supone que los impulsos de lnea tendrn
una frecuencia de ocurrencia doble en toda la regin donde queramos que las dos seales sean
idnticas. La forma de esta solucin se representa en la figura 2.30.

Fig. 2.29 Problemas en la deteccin del inicio de campo

Fig. 2.30 Forma de onda definitiva del segmento prximo al sincronismo de campo
1 2 3 4 5 6 625 624
313 314 315 316 317 318 312
Inicio campo impar
Inicio campo par
Deteccin inicio campo par
Deteccin inicio campo impar
1 2 3 4 5 6 625 624
313 314 315 316 317 318 312
Inicio campo impar
Inicio campo par
Deteccin inicio campo par
Deteccin inicio campo impar
1 2 3 4 5 6 625 624
313 314 315 316 317 318 312
Impulsos a frecuencia doble
No corresponden a lneas
1 2 3 4 5 6 625 624
313 314 315 316 317 318 312
Impulsos a frecuencia doble
No corresponden a lneas
El lector podra objetar que utilizando esta forma de onda, los circuitos de deteccin del sincronismo
de lnea se dispararn a una frecuencia doble durante este tramo de seal. En efecto, este es el precio
que tenemos que pagar para garantizar que las seales en la salida del filtro paso bajo se mantienen
idnticas, producindose la deteccin del inicio de campo en la misma posicin relativa,
independientemente de que se trate del campo par o el impar. No obstante, este problema no es en
absoluto grave, por cuanto, conocindolo, resulta muy fcil inhibir el disparo de los circuitos de
barrido horizontal hasta que no tengan un nivel de tensin prximo al que debe producirse la
conmutacin. As pues, en general, los circuitos de deteccin del impulso de sincronismo de lnea se
mantendrn inhibidos mientras la tensin de barrido no supere un determinado nivel que indique que
ya estamos explorando el extremo derecho de la pantalla, por lo que debemos estar preparados para la
recepcin de un nuevo pulso de sincronismo horizontal.

La insercin de estos impulsos a doble frecuencia de la de lnea se realiza no slo durante el pulso de
sincronismo de campo, sino que se extiende a un total de 7,5 lneas, entre las que se incluyen las 2,5
anteriores al pulso de sincronismo, las 2,5 propias del pulso y las 2,5 posteriores. La funcin de los
impulsos de pre-igualacin (2,5 lneas precedentes) es la de garantizar que la seal aplicada al
integrador cuando se inicia el pulso de sincronismo es la misma, independientemente del campo que
estemos considerando. En el supuesto de que no existieran estos impulsos de pre-igualacin, el estado
inicial del integrador podra ser diferente en cada uno de los campos, ya que en el campo par, el
ltimo impulso de sincronismo de lnea se hubiera recibido slo media lnea antes, mientras que en el
impar se habra recibido una lnea completa antes. Con la presencia de los impulsos de pre-igualacin
puede asegurarse que las posibles asimetras de seal entre los dos campos provienen como mnimo
de 2,5 lneas antes de la llegada del impulso de campo, lo que suele considerarse como un tiempo
suficiente para que la memoria del integrador ya no tenga relevancia. La funcin de los impulsos de
post-igualacin es, como ya hemos mencionado, menos importante, y se encarga de que la descarga
del integrador sea parecida, independientemente de si el campo es par o impar.

2.6.1 Sincronizacin de los generadores de barrido vertical
La sincronizacin de los circuitos de barrido vertical puede realizarse mediante un mtodo directo, es
decir, reinicializando el generador en diente de sierra cada vez que se detecta la presencia de un
impulso de sincronismo de campo, o mediante mtodos indirectos basados en las referencias de los
impulsos de sincronismo horizontal.

La razn de que en este caso pueda usarse un mtodo directo, mientras que en el sincronismo de lnea,
casi invariablemente, se use un sistema basado en un PLL, se debe por una parte a que la frecuencia
de trabajo es mucho ms lenta (tardara mucho tiempo en controlarse el VCO por lo que las derivas
podran ser considerables), y por otra a que, al tratarse de un pulso detectado mediante un integrador,
suele ser algo menos sensible al nivel de ruido.

En el caso de utilizar un sincronismo directo, el generador de barrido vertical suele estar diseado para
que conmute automticamente a una frecuencia interna si se produce un error en la deteccin del pulso
de sincronismo de campo. Con esta solucin pueden tolerarse algunos errores, aunque si se produce
una rfaga de fallos en la deteccin del sincronismo, se observar que la pantalla se desplaza hacia
arriba o hacia abajo a una velocidad que depender de la diferencia entre la frecuencia del generador
interno y la de la seal de televisin. Este efecto puede comprobarse en algunos receptores antiguos
que permiten que el usuario pueda controlar el umbral de deteccin de la seal de sincronismo de
campo. Si se ajusta este umbral a un nivel excesivamente elevado, podr forzarse que los impulsos de
sincronismo no se detecten correctamente y que el barrido vertical empiece a realizarse a la frecuencia
interna, observndose cmo en la pantalla la imagen se desplaza en sentido vertical.

No obstante, los receptores ms modernos suelen utilizar un dispositivo de sincronismo indirecto que
conjuga la seal de sincronismo horizontal obtenida mediante la tcnica del fly-wheel (una seal muy
estable y exenta de ruido) con la seal de sincronismo vertical directa. Las caractersticas de este
sistema de sincronizacin indirecta, cuyo diagrama de bloques se representa en la figura 2.31, son
excelentes.

Fig. 2.31 Diagrama para la obtencin indirecta del sincronismo de campo

La idea bsica consiste en utilizar el mismo sistema que suministra la referencia de fase de la seal de
sincronismo horizontal para obtener la seal de sincronismo vertical. El bucle del PLL debe
modificarse ligeramente, provocando que el oscilador controlado por tensin trabaje a una frecuencia
doble de la de lnea. Esto se consigue insertando un divisor de frecuencia por 2 en la salida del VCO,
tal y como se indica en el diagrama de bloques. Esta modificacin del circuito no representa una
prdida de la fase de la seal de sincronismo horizontal, por cuanto el comparador de fase sigue
trabajando con la seal de sincronismo externa y la salida del divisor de frecuencia.

Al doblar la frecuencia del oscilador interno podemos obtener una seal cuya frecuencia coincide
exactamente con la frecuencia de campo utilizada en el transmisor. Para ello basta con dividir la
frecuencia del VCO por 625 (para lo que normalmente se utiliza un contador de pulsos), ya que al
haber doblado la frecuencia del oscilador cada cuenta de 625 corresponder con el tiempo de campo.
La frecuencia obtenida coincide exactamente con la del transmisor, ya que el procedimiento utilizado
para su obtencin es esencialmente el mismo. Recurdese que al seleccionar el nmero de lneas en el
sistema de televisin ya habamos tenido en cuenta que admitiera una descomposicin en nmeros
primos sencilla con el objeto de poder dividir fcilmente su frecuencia.
Comparador
nivel
Comparador
de fase
V.C.O.
31250
Div 2
Div 625
Count N
Comparador
tiempos
Sincronismo
Campo
Sincronismo
Lnea
Sincronismo
Horizontal
Sincronismo
Vertical
Indirecto
Sincronismo
Vertical
Directo
Comparador
nivel
Comparador
de fase
V.C.O.
31250
Div 2
Div 625
Count N
Comparador
tiempos
Sincronismo
Campo
Sincronismo
Lnea
Sincronismo
Horizontal
Sincronismo
Vertical
Indirecto
Sincronismo
Vertical
Directo
Sin embargo, aunque disponemos de la frecuencia de campo exacta, la fase de la seal en la salida del
divisor por 625 depender de las condiciones en que se haya inicializado el circuito.

Para adquirir la fase exacta, se utilizar la seal de sincronismo de campo obtenida por un mtodo
directo. El procedimiento es sumamente sencillo. Un comparador de fase determina si las seales de
sincronismo de campo indirecto y directo estn en fase. Si no es as, se reduce el nmero de pulsos
que debe contar el divisor por 625, de manera que la frecuencia de la seal generada internamente
aumente ligeramente y consiga ponerse en fase con la seal de sincronismo externa. Este mtodo de
sincronizacin es muy parecido al utilizado en el PLL. Durante el tiempo de adquisicin de la
referencia de fase, el receptor utiliza la seal de sincronismo directo para controlar los generadores
barrido vertical, pero una vez se ha adquirido correctamente la referencia de fase, lo cual se detecta
por la coincidencia de los pulsos indirectos con los directos, se utiliza preferentemente la seal
indirecta para el control de los circuitos de barrido vertical.

La seal indirecta es mucho ms estable que la directa y no requiere de ningn control por parte del
usuario. Esta seal se mantiene como base para la sincronizacin del barrido vertical mientras no se
detecte una discrepancia con la seal directa durante un nmero elevado de campos, situacin que, en
condiciones de recepcin normales, slo se produce cuando el usuario cambia de emisora. En este
caso, se vuelve a utilizar la seal de sincronismo directa hasta que se determine la fase exacta del
campo.

Las ventajas del mtodo indirecto respecto al directo son evidentes, puesto que se obtiene un perfecto
sincronismo con la emisora, aun en el caso de que el nivel de ruido provoque la prdida de un elevado
porcentaje de impulsos de sincronismo vertical. Adems, no requiere ningn oscilador interno a la
frecuencia de campo ni el ajuste del nivel de disparo. El entrelazado entre los dos campos es, por otra
parte, perfecto, ya que se eliminan completamente las posibles imprecisiones temporales en la
deteccin del pulso de sincronismo. Adems, el sistema puede modificarse para que pueda conmutar
directamente entre los estndares de 50 Hz y 60 Hz.

2.7 Espectro de la seal de televisin en blanco y negro
En el captulo anterior se realizaron diversas consideraciones relativas al ancho de banda de la seal
de televisin, llegando a la conclusin de que un ancho de banda de unos 5 MHz proporciona una
imagen con calidad ms que satisfactoria para la mayora de espectadores. Sin embargo, no hemos
realizado ningn anlisis para determinar las caractersticas espectrales de la seal de televisin.
Evidentemente, la forma y caractersticas de la transformada de Fourier de la seal dependern de la
escena que se transmita, pero podemos realizar ciertas hiptesis genricas que nos permitan tener una
idea aproximada de los detalles espectrales de esta seal.

La hiptesis ms simple, por lo que respecta al clculo de la transformada de Fourier, es la de suponer
que se transmite una escena esttica que tiene simetra vertical. Bajo esta suposicin, el clculo de la
transformada es relativamente sencillo, ya que se trata de determinar el espectro de una seal
peridica. En efecto, al tener simetra vertical todas las lneas de la imagen son iguales y al ser esttica
los cuadros se repiten indefinidamente. Aparte de que esta hiptesis es la nica que podemos tratar
analticamente con cierta simplicidad, produce unos resultados bastante aproximados al espectro real
de la seal. Esto es debido a que en la mayora de escenas reales, si bien existe movimiento y no todas
las lneas son iguales, es verdad que entre una imagen y la siguiente o una lnea y la siguiente suelen
producirse pocos cambios, de modo que la seal de televisin tendr una estructura casi-peridica.
Evidentemente, la aproximacin es tanto ms precisa cuanto ms parecidas sean las peculiaridades de
la escena a las hiptesis que realizamos.

Para determinar el espectro de una seal de televisin con las caractersticas mencionadas
descompondremos su estructura en las componentes siguientes:

) ( ) ( ) ( ) ( t c t w t p t x + = (2.8)

donde x(t) representa la seal de televisin, con los sincronismos de lnea y de campo incorporados y
p(t), w(t) y c(t) son seales artificiales que nos permiten descomponer la seal x(t) como una
combinacin analtica de seales peridicas, cuya transformada de Fourier resulta muy sencilla de
estimar.

La seal p(t) representa, tal y como se indica en la figura 2.32, las lneas de la seal de televisin con
los sincronismos de lnea incorporados, pero sin la presencia de la seal de sincronismo de campo. Por
ello, la seal p(t) es perfectamente peridica y sus caractersticas espectrales podrn ser calculadas con
facilidad. La seal w(t) es una ventana que toma el valor 0 all donde la seal p(t) debera incorporar el
sincronismo de campo y valor 1 en el resto de valores. Es evidente por tanto que esta seal tambin es
peridica con un periodo de 1/50 Hz = 20 ms. El producto entre la seal p(t) y w(t) da como resultado
una seal que es idntica a la seal x(t) en todo instante de tiempo exceptuando las 25 de borrado de
campo en las que toma el valor cero. Finalmente, la seal c(t) es una seal que representa las
componentes de borrado de campo que no estn incluidas en el producto p(t) y w(t). Como las formas
de onda de las zonas de borrado de campo par e impar, aun en el supuesto de que no se transmita
teletexto ni informacin de control, no son exactamente iguales, esta componente tambin tendr un
periodo de 40 ms. Ntese, sin embargo que la diferencia entre la forma de onda del campo impar y del
campo par es muy sutil, ya que la nica diferencia es que la distancia entre el ltimo impulso de post-
igualacin y la siguiente seal de sincronismo de lnea es de media lnea en el campo impar y de una
lnea completa en el par. Por ello, muchas veces se supone que esta seal tiene un periodo
fundamental de 20 ms. Mediante esta descomposicin de la seal podemos expresar la transformada
de Fourier como:

) ( ) ( ) ( ) ( f C f W f P f X + = (2.9)

donde P(f), W(f) y C(f) representan las transformadas de Fourier de las seales peridicas p(t), w(t) y
c(t) respectivamente y el smbolo * representa el producto de convolucin entre las dos transformadas.
La transformada de Fourier de una seal peridica puede calcularse directamente a partir del
desarrollo en una serie de Fourier en exponenciales complejas de la seal. Para la seal p(t) el
desarrollo en serie de Fourier viene dado por la siguiente expresin:

=
k Linea
k
t k
T
a t p
2
exp ) ( (2.10)

Fig. 2.32 Descomposicin de la seal x(t) en tres componentes peridicas

donde los coeficientes a
k
dependen de la forma de onda de la seal en un periodo y se determinan a
partir de la relacin:

=
Lnea
T Lnea Lnea
k
dt t k
T
t p
T
a
2
exp ) (
1
(2.11)

donde el smbolo bajo la integral indica que los lmites de integracin pueden tomarse en cualquier
parte de la seal mientras se considere un periodo completo de la misma.

Si aplicamos la transformada de Fourier a la ecuacin 2.10 obtenemos:

( ) ( )

=
=
=
= =
k
Lnea k
Lnea
k
Linea
k
f k f a
T
t k
T
F a t p F f P
1 2
exp ) ( ) ( (2.11)

donde (t) representa la funcin delta de Dirac. Este resultado nos indica que la transformada de
Fourier de la seal est formada por un tren de deltas situadas en mltiplos de la frecuencia de lnea y
cuyas amplitudes relativas dependen de la forma de onda concreta que adopte la seal. Teniendo en
cuenta que el ancho de banda de la seal de televisin se extiende hasta unos 5MHz, deberemos
considerar la presencia de aproximadamente 320 armnicos (320f
Lnea
es aproximadamente 5 MHz).
Este resultado se representa esquemticamente en la figura 2.33.
c(t)
p(t)
w(t)
X(t)=p(t)w(t)+c(t)
25 lneas 312,5 lneas
25 lneas
t
t
t
t
c(t)
p(t)
w(t)
X(t)=p(t)w(t)+c(t)
25 lneas 312,5 lneas
25 lneas
t
t
t
t

Fig. 2.33 Representacin de los espectro P(f), W(f) y C(f)

Por otra parte, como las seales w(t) y c(t) tambin son peridicas, sus transformadas de Fourier,
representadas en la figura 2.33, darn un resultado parecido al obtenido en (2.12), aunque en este caso
las funciones delta estarn separadas 50 Hz para el caso de w(t) y 25 Hz para c(t):

( ) ( )
( ) ( );
1
) ( ) (
;
1
) ( ) (
=
= =
= =
k
cuadro k
cuadro
k
campo k
campo
f k f c
T
t c F f C
f k f b
T
t w F f W
(2.13)

Para obtener el espectro final de la seal basta con convolucionar el tren de deltas W(f) con P(f) y
sumar C(f). La convolucin de un espectro genrico con un tren de deltas da como resultado el
desplazamiento del espectro a las frecuencias a las que estn desplazadas las deltas junto con un factor
de escala directamente relacionado con la amplitud de las funciones delta. En efecto:

= =
k
Lnea k
Lnea k
Lnea k
Lnea
kf f W a
T
d kf f a W
T
d f P W f P f W
) (
1
) ( ) (
1
) ( ) ( ) ( * ) (
(2.14)

0 f
L
2f
L
3f
L
f
mf
L
320f
L
-f
L
a
0
a
1
a
2
a
-1
a
3
P(f)
f
0 50
Escala horizontal ampliada respecto a P(f)
W(f)
f
0 25
C(f)
0 f
L
2f
L
3f
L
f
mf
L
320f
L
-f
L
a
0
a
1
a
2
a
-1
a
3
P(f)
f
0 50
W(f)
f
0 25
C(f)
En la figura 2.34 se representan los sucesivos desplazamientos espectrales de W(f) a mltiplos de la
frecuencia de lnea. Ntese que como la frecuencia de lnea es muy superior a la de campo, las deltas
correspondientes al espectro W(f), que estn separadas por slo 50 Hz, permanecen muy agrupadas
entorno a los mltiplos de f
Lnea
. Esto implica que aparecen amplias regiones espectrales, situadas entre
los mltiplos de f
Lnea
, en las que la seal no tiene contenido espectral. La contribucin de C(f) a las
caractersticas espectrales de la seal no es excesivamente importante, ya que nicamente afecta a una
pequea regin centrada en el origen.

Fig. 2.34 Espectro aproximado de la seal de televisin

En resumen, podramos decir que el espectro de la seal de televisin concentra su energa en
mltiplos de la frecuencia de lnea donde se ubican los paquetes de funciones delta separadas 50 Hz,
que se corresponden con el espectro de la seal W(f). En la regin centrada en el origen, la
contribucin de C(f) al espectro global representa la aparicin de nuevas componentes separadas 25
Hz. Sin embargo, los valores de estas componentes son de pequea amplitud y no suelen ser
consideradas casi nunca en la prctica.

Aunque consideremos un nmero elevado de armnicos en la seal w(t), prcticamente toda la energa
de la seal de televisin queda concentrada alrededor de los mltiplos de la frecuencia de lnea, ya que
la separacin entre las componentes de W(f) es mucho menor que la frecuencia de lnea. Con ello, una
importante zona del espectro queda libre para la insercin de otras seales sin que se produzcan
interferencias significativas con la luminancia. Estos espacios libres en el espectro se aprovecharn
para insertar la informacin de color.

Hasta ahora hemos supuesto que la seal proporcionara informacin sobre una escena estacionaria y
con todas sus lneas iguales. Esta situacin no se produce casi nunca en la prctica, por lo que el
espectro de la seal de televisin slo se corresponde con el que hemos obtenido de manera
aproximada. En general, las lneas en una seal de televisin suelen presentar una elevada correlacin
entre s y los cambios que se producen entre dos cuadros consecutivos casi nunca son excesivamente
0 f
L
2f
L
3f
L
mf
L
320f
L
P(f)*W(f)
0
C(f)
f
f
0 f
L
2f
L
3f
L
mf
L
320f
L
P(f)*W(f)
0
C(f)
f
f
importantes, con lo que hiptesis que hemos realizado suele ser bastante plausible. No obstante,
siempre podramos pensar en algn contraejemplo, con abundantes cambios de plano y con poca
simetra vertical y cuya transformada de Fourier no tuviera nada en comn con la obtenida en este
apartado. Sin embargo, estas imgenes son, desde un punto de vista estadstico, muy poco probables,
por lo que, en la prctica, el modelo propuesto resulta simple pero eficaz. Basta considerar, por tanto,
que para imgenes reales las seales no sern perfectamente peridicas, por lo que las tericas
funciones delta de Dirac se convertirn en impulsos de amplitud finita y adquirirn una cierta anchura
espectral, aunque mantendrn la energa concentrada alrededor de los mltiplos de la frecuencia de
lnea.

Para que el lector compruebe que el modelo anterior es bastante robusto, podemos considerar cmo
afectara al espectro de la seal si la imagen siguiera siendo estacionaria pero la pantalla estuviera
ahora dividida en dos mitades de modo que las formas de onda de las lneas correspondientes a la
mitad superior y la inferior son distintas. En este ejemplo es fcil de ver que la seal p(t) puede
descomponerse en dos partes tal y como se indica en la figura 2.35.

) ( ) ( ) ( ) ( ) (
2 2 1 1
t w t p t w t p t p + = (2.15)

donde tanto p
1
(t) como p
2
(t) son seales peridicas con las mismas caractersticas que la seal p(t) que
habamos considerado anteriormente.

Fig. 2.35 Descomposicin de la seal p(t) en seales peridicas

Las seales w
1
(t) y w
2
(t) son tambin peridicas y actan como ventanas para combinar las dos
imgenes en las dos mitades de la pantalla. Su frecuencia fundamental es de 50 Hz, ya que las dos
formas de onda deben conmutarse en cada campo de la seal de televisin. Tngase en cuenta que en
la figura 2.35 nicamente se ha representado un campo de la seal, aunque la generalizacin del
dibujo es evidente.

p(t)
t
Mitad superior pantalla Mitad inferior pantalla
t
t
p
1
(t)
p
2
(t)
w
1
(t)
w
2
(t)
p(t)
t
Mitad superior pantalla Mitad inferior pantalla
t
t
p
1
(t)
p
2
(t)
w
1
(t)
w
2
(t)
La transformada de Fourier de la seal p(t) vendr dada en este caso por:

) ( * ) ( ) ( * ) ( ) (
2 2 1 1
f W f P f W f P f P + = (2.16)

En esta expresin vemos que P(f) es la suma de las dos componentes que se obtienen como el
producto de convolucin de una seal peridica con frecuencia fundamental f
Lnea
y otra con
frecuencia fundamental f
campo
. El resultado es, pues, un conjunto de deltas con una distribucin
espectral idntica a la que hemos obtenido anteriormente. Obsrvese que sin prdida de generalidad
hubiera sido posible incluir en las funciones w
1
(t) y w
2
(t) regiones que anularan la seal all donde
debe incorporarse el sincronismo de campo, con lo que para obtener el espectro completo de la seal
nicamente faltara sumar la componente C(f).

En este ltimo ejemplo se observa que no es necesario que todas las lneas sean idnticas para que el
espectro de la seal se concentre en los mltiplos de la frecuencia de lnea. De hecho, podramos
seguir dividiendo la imagen en regiones verticales manteniendo su estructura espectral. Este resultado
confirma que podemos suponer que, en general, las caractersticas espectrales que hemos obtenido se
mantienen siempre que la imagen presente ciertos patrones de repeticin en las lneas y cierto grado
de estacionariedad temporal, lo que en general ocurre para la mayora de aplicaciones prcticas.

Las particularidades del espectro de la seal de luminancia pueden generalizarse tambin para las
seales diferencia de color o R, G, B en aquellos sistemas que utilicen una descomposicin de la seal
en lneas y campos. As, las seales R, G, B que se aplican al tubo de imagen, o las componentes
diferencia de color, evidentemente antes de su modulacin, que se transmiten en sistemas analgicos
como el NTSC, PAL o SECAM, o las seales RGB presentes en un Euroconector, tienen todas ellas
una estructura espectral parecida.

3 La seal de televisin en color: sistemas compatibles 197

3 La seal de televisin en color: sistemas compatibles
3.1 Introduccin
Los sistemas de televisin en color compatibles, codifican la informacin de crominancia mediante las
seales diferencia de color o, como hemos visto en el captulo 1, mediante una combinacin lineal de
stas. Con ello se obtiene no slo la compatibilidad directa (que un televisor monocromo pueda
visualizar una seal de color), sino tambin la retrocompatibilidad o compatibilidad indirecta (que un
televisor de color pueda visualizar una seal en blanco y negro).

Adems, es necesario que la informacin de crominancia se superponga tanto en el tiempo como en
banda de frecuencia con la informacin de luminancia, de modo que un receptor en color pueda
interpretar correctamente la superposicin de ambas seales, mientras que un receptor monocromo
represente la informacin de croma como si se tratara de una interferencia. Es pues importante definir
una codificacin de las seales diferencia de color que pueda ser fcilmente interpretada por los
receptores de color (mediante soluciones circuitales no excesivamente complejas), pero que represente
un reducido nivel de interferencia visible para la seal de luminancia en los sistemas en blanco y
negro.

Las soluciones de los sistemas NTSC, PAL y SECAM para abordar este problema son, a pesar de sus
diferencias, conceptualmente muy parecidas. En todos ellos se utiliza alguna combinacin lineal de las
seales de color que son moduladas mediante una portadora cuya frecuencia se sita en la parte alta de
la banda de luminancia. En los sistemas NTSC y PAL se utiliza una modulacin de amplitud donde
las seales diferencia de color estn en cuadratura, mientras que en el sistema SECAM se realiza una
modulacin en frecuencia de las componentes de croma. En todos los casos, la frecuencia de la
portadora de la informacin de color se selecciona para que la interferencia sobre la seal de
luminancia sea mnima.

En este captulo describiremos los principios generales de los sistemas NTSC y PAL. Este ltimo
puede considerarse como una mejora del NTSC, por lo que es fundamental comprender los principios
de ste para posteriormente poder entender las mejoras que introduce el PAL. Por ello, dedicaremos la
mayor parte de este captulo a describir las caractersticas y particularidades del sistema NTSC,
preparando el terreno para la posterior descripcin de las modificaciones que introduce el PAL. Como
en el caso de los sistemas de televisin monocromos, las descripciones del funcionamiento de los
sistemas de color sern al nivel de diagramas de bloques sin entrar en los detalles de los circuitos
electrnicos empleados para realizar estas funciones. Con ello, pretendemos nicamente que el lector
tenga una idea general sobre los principios de funcionamiento de cada sistema. Aunque la transmisin
de seales de televisin analgicas se ir sustituyendo de forma paulatina por sistemas digitales,
probablemente, los sistemas de color compatibles seguirn todava vigentes como formatos de
intercambio domstico de vdeo durante bastantes aos. Actualmente, existe un gran parque de
receptores con este tipo de decodificadores y un elevado nmero de reproductores de vdeo, cmaras,
etc., que siguen utilizando los sistemas NTSC y PAL. Probablemente, en un futuro prximo, los
receptores de televisin y cmaras de vdeo sern compatibles con distintos formatos de seal de
vdeo tanto analgicos como digitales.

La parte final del captulo se dedicar a exponer brevemente la modulacin que se aplica en las
seales de televisin en banda base para su radiodifusin terrena. El objetivo es que el lector pueda
situar la posicin espectral de los distintos canales de televisin y la situacin de las componentes de
audio y vdeo en el espectro. Los sistemas de radiodifusin por satlite o cable utilizan,
evidentemente, bandas de frecuencias distintas a las que nosotros haremos referencia y que estn
adaptadas a las caractersticas de estos canales de transmisin. Sin embargo, los decodificadores de
satlite o cable que el usuario tiene instalados en el punto de recepcin reconvierten las seales
recibidas a la banda de radiodifusin terrena o directamente a seal de vdeo compuesto en banda base
(conexin del decodificador de satlite a travs de Euroconector) para que puedan ser correctamente
decodificadas por el receptor.

3.2 Las seales de color en los sistemas NTSC y PAL
Las siglas del sistema NTSC corresponden a la National Television System Comittee, que fue la
comisin encargada de definir los parmetros del sistema de televisin en color compatible que se
adopt en los Estados Unidos en 1953. Se trata de un sistema de 525 lneas con una frecuencia de 60
campos por segundo (30 imgenes por segundo) en el que se superponen la seal de luminancia y la
de croma de acuerdo con la siguiente expresin:

) 33 2 ( ) ( ' ) 33 2 cos( ) ( ' ) ( ' ) (
0 0
+ + + + t f sen t Q t f t I t Y t x
NTSC
(3.1)

donde Y(t) corresponde a la informacin de luminancia e I(t) y Q(t) representan una combinacin
lineal de las seales diferencia de color (R-Y) y (B-Y) que proporciona al receptor la informacin de
color. El smbolo indica que se realiza una correccin gamma sobre las seales, que al tratarse de un
sistema de color, adoptar un valor de 2,8.

Antes de adentrarnos en los secretos y particularidades de este sistema de televisin, empezaremos
comparando algunos de los parmetros que utiliza con los del sistema PAL. Esto nos permitir
obtener una mejor perspectiva de las peculiaridades de cada uno de los sistemas.

Prescindiendo de la informacin de luminancia, la informacin de color proporcionada por el sistema
NTSC es:

) 33 2 cos( ) ( ' ) 33 2 ( ) ( ' ) ( + + + t f t I t f sen t Q t croma
NTSC NTSC NTSC
(3.2)

Mientras que en el sistema PAL viene dada por:

) 2 cos( ) ( ' ) 2 ( ) ( ' ) ( t f t V t f sen t U t croma
PAL PAL PAL
t (3.3)

donde en este caso las seales U y V son una versin ponderada por constantes de las seales (B-Y)
y (R-Y).

Una primera inspeccin a estas ecuaciones revela alguna semejanza y bastantes diferencias entre los
dos sistemas, que conviene comentar con cierto detalle. En primer lugar, la similitud es que ambos
utilizan una modulacin de amplitud con portadoras en cuadratura de las componentes de color. En
efecto, cada una de las seales de diferencia de color se multiplican por unas portadoras que estn en
cuadratura (desfasadas 90 entre ellas) y que, como veremos, permitirn recuperar las seales de color
originales, siempre que el receptor pueda disponer de un oscilador en perfecta sincrona con el del
transmisor.

La diferencia principal entre los dos sistemas consiste en el cambio de signo que experimenta la
componente V en el sistema PAL. Aunque en esta versin de la ecuacin del PAL no se indica
explcitamente, el signo de esta componente vara de una lnea a otra, permitiendo una codificacin
del color mucho ms robusta e insensible al ruido que en el sistema NTSC. Dejaremos para ms
adelante la justificacin de que esta alternancia en el signo de la componente V proporcione mayor
fiabilidad al sistema en la codificacin del color, digamos por el momento que constituye la esencia
del sistema PAL, que debe su nombre (Phase Alternating Line) a esta particular manera de codificar el
color.

El resto de diferencias no son tan significativas desde un punto de vista conceptual. Las frecuencias
portadoras, aunque distintas, estn pensadas en los dos casos para que la interferencia visual que
introduce la croma en un receptor en monocromo sea lo ms reducida posible.

3.2.1 Seales diferencia de color en el NTSC y el PAL
Hemos visto en el primer captulo que cualquier combinacin lineal de las seales diferencia de color
(R-Y), (G-Y) y (B-Y) permita obtener sistemas compatibles y retrocompatibles. En el caso del
sistema PAL se toman como seales diferencia de color directamente las (R-Y) y (B-Y), aunque
ligeramente atenuadas por unos coeficientes diseados para que el margen dinmico de la seal de
crominancia sea el adecuado. Las componentes U y V pueden expresarse como:

)' ( 877 . 0 '
)' ( 493 . 0 '
Y R V
Y B U

(3.4)

Los coeficientes que atenan a las seales diferencia de color han sido calculados para que los niveles
de la seal de crominancia PAL se mantengan en un margen de valores adecuados para la seal de
vdeo compuesto (es decir, la suma de la seal de luminancia y de crominancia). En efecto, podra
ocurrir que al sumar la seal de croma a la de luminancia se superara en exceso el nivel de blanco, o
incluso que se redujera por debajo de los niveles de sincronismo. Este ltimo supuesto podra ser
realmente grave pues la seal de croma podra pasar a travs del circuito separador de sincronismos y
activar los circuitos de barrido. Adems, teniendo en cuenta que la seal de vdeo compuesto deber
ser finalmente modulada en amplitud para su transmisin, es importante asegurar que los niveles se
mantienen dentro de unos lmites en los que la posible sobremodulacin de la seal no sea perjudicial
para su recepcin. En consecuencia, estos coeficientes estn determinados para que los niveles de
amplitud de la seal de croma se mantengan, independientemente de los colores transmitidos, dentro
de los mrgenes en los que se puede garantizar una correcta decodificacin de la seal.

Las seales de color transmitidas en el sistema PAL suelen representarse mediante vectores en el
plano U, V que se indica esquemticamente en la figura 3.1. Dado un vector en este plano y la
componente de luminancia asociada pueden calcularse, utilizando las relaciones ya mencionadas, las
componentes R, G, B. As por ejemplo, el vector (U,V)=(0.3,0.2) con una luminancia de 0.4 se
correspondera con las coordenadas R,G,B siguientes:

17 . 0
59 . 0
11 . 0 3 . 0
1
493 . 0
63 . 0
877 . 0
+
+
B R Y
G
Y
U
B
Y
V
R
(3.5)

Anlogamente, dadas unas componentes R, G, B asociadas a un determinado color, es relativamente
simple determinar la componente de luminancia y las de croma U y V. El procedimiento utilizado
para el color R=0.3, G=0.5, B=0.7 se indica en las siguientes ecuaciones:

14 . 0 ) ( 877 . 0
12 . 0 ) ( 493 . 0
; 46 . 0 11 . 0 59 . 0 3 . 0

+ +
Y R V
Y B U
B G R Y
(3.6)

Fig. 3.1 Diagrama de componentes diferencia de color U', V' y colores representativos
U
V
347
61
103
167
241
283
Magenta
Rojo
Amarillo
Verde
Ciano
Azul
u1
v1
Tonos
naranja
U
V
347
61
103
167
241
283
Magenta
Rojo
Amarillo
Verde
Ciano
Azul
u1
v1
Tonos
naranja

Para introducir el efecto de la correccin gamma en estas ecuaciones, basta con considerar que se ha
aplicado este factor de correccin sobre las componentes R, G, B y mantener las mismas relaciones
algebraicas. As, el color R=0.0343, G=0.143, B=0.368 sin correccin gamma se corresponde con el
R=(R)
1/2.8
=0.3, G=0.5 y B=0.7 por lo que sus componentes Y, U y V tendrn los mismos valores
que los obtenidos en la ecuacin 3.6. Del mismo modo, si aplicamos las ecuaciones 3.5 con los
valores de Y, U y V corregidos por la gamma, obtendremos las componentes R, G y B que
deberemos aplicar directamente al tubo de imagen.

Con los procedimientos esbozados arriba podramos representar los distintos matices de color sobre el
plano U,V. En la figura 3.1 se han representado aproximadamente las posiciones de los colores ms
habituales. En este diagrama los cambios en el mdulo del vector (U,V) se corresponden
directamente con cambios en la saturacin o intensidad del color (ms o menos cantidad de blanco);
en otras palabras, al variar el mdulo del vector el matiz de color se conserva. En la Figura se indican
los ngulos de las lneas en las que encontraremos los matices de los colores primarios, sus
complementarios y los naranjas. Al desplazarnos a travs de estas rectas obtendremos versiones del
mismo color con distintas saturaciones e intensidades. El color blanco y toda la gama de grises estn
representados en el punto central, ya que este caso las componentes diferencia de color son nulas.

Forma de onda de una lnea PAL con la carta de barras de color

Usando las relaciones 3.6 entre las componentes RGB y las variables U y V podemos determinar la
forma de onda de una lnea de seal PAL si conocemos los colores que deben representarse en cada
posicin de la lnea. Para ello, basta con determinar los niveles de luminancia y de las seales
diferencia de color para cualquier combinacin RGB y representar la seal de acuerdo con las
ecuaciones 3.1 y 3.3. Una seal que habitualmente se utiliza para el ajuste de receptores es la carta con
barras de colores. Esta carta contiene todos los colores primarios, los complementarios, el blanco y el
negro. Existen versiones de esta tabla con distintos niveles de saturacin de los colores. En este
ejemplo supondremos que los colores son totalmente puros.

En la tabla 3.1 se proporcionan los niveles RGB asociados a cada uno de los colores. Como
suponemos que los colores son puros y tienen el nivel mximo los valores RGB originales y los
corregidos en gamma coinciden ya que 1
=1. Tambin se determinan los valores de las variables Y, U

y V. A partir de estos valores puede determinarse el mdulo y la fase de la seal de croma que se
suma a la luminancia. En efecto, podemos expresar la ecuacin 3.3 como

,
_
,
_
t +
) ( '
) ( '
arctan 2 sin ) ( ' ) ( ' ) ( croma
2 2
t U
t V
t f t V t U t
PAL PAL
(3.7)

donde la fase tomar el signo positivo o negativo en funcin de si la componente V'(t) est invertida o
no. A efectos de representacin de la forma de onda de la seal, por el momento, nicamente nos
interesa el mdulo de la componente de croma.
La forma de onda de la seal resultante se representa en la figura 3.2. Los niveles de tensin
representados en esta figura se corresponden con una normalizacin de la seal entre 0,3 Voltios
(impulsos de sincronismo) y 0,7 Voltios (nivel mximo de la luminancia para el blanco, Y=1). Por lo
tanto, los valores obtenidos en la tabla deben previamente normalizarse a estos niveles de tensin. El
procedimiento de normalizacin es bastante simple. As, para el color amarillo el nivel medio de
tensin vendr dado por 0,7xY
amarillo
= 0,623 Voltios. La amplitud de la portadora de color es de
0,7xP
amarillo
= 0,7x0,4493 = 0,3145 Voltios. En consecuencia, la excursin de tensin de esta barra de
color se situar entre 0,623-0,3145=0,3085 Voltios y 0,623+0,3145=0,9375 Voltios. El resto de
valores de tensin asociados a los otros colores pueden determinarse de forma parecida.

Tabla 3.1 Valores normalizados de Y, U y V para la barra de colores puros

R G B Y U V mod.crom
Blanco 1 1 1 1,00 0,0000 0,0000 0,0000
Amarillo 1 1 0 0,89 -0,4388 +0,0965 0,4493
Ciano 0 1 1 0,70 +0,1479 -0,6139 0,6315
Verde 0 1 0 0,59 -0,2909 -0,5174 0,5936
Magenta 1 0 1 0,41 +0,2909 +0,5174 0,5936
Rojo 1 0 0 0,30 -0,1479 +0,6139 0,6315
Azul 0 0 1 0,11 +0,4388 -0,0965 0,4493
Negro 0 0 0 0,00 0,0000 0,0000 0,0000

Fig. 3.2 Forma de onda de una lnea de la seal de color PAL para una barra de colores

-300 mV
0 V
700
623
490
mV
413
287
210
77
937
933
824
703
652
393
308
48
-3
-124
-233 -234
BURST BURST
-300 mV -300 mV
0 V
700
623
490
mV
413
287
210
77
937
933
824
703
652
393
308
48
-3
-124
-233 -234
BURST BURST
En la figura 3.2 slo hemos representado los lmites de amplitud de seal para cada una de las barras
de color. La codificacin de la informacin de color est tanto en los niveles de amplitud como en la
fase de modo que al pasar de un color a otro, no slo se producen los cambios de nivel sino que
tambin existen cambios de fase. La seal de burst que aparece en la figura permite que el receptor
pueda obtener una referencia de fase para decodificar correctamente los colores. Veremos los detalles
de esta seal ms adelante. Obsrvese tambin que los niveles de amplitud que se producen para los
colores primarios y los complementarios puros no superan, en ningn caso, el nivel de sincronismo,
por lo que todava resulta posible identificar la posicin de estos impulsos en la forma de onda de la
seal sin necesidad de emplear circuitos complejos. De hecho, los factores de escala por los que
hemos multiplicado las componentes (B-Y) y (R-Y) se han diseado especficamente para que los
niveles mximos de las seales de color cumplan con estos requisitos. Si los colores de la barra no son
puros, sino que tienen algn ndice de saturacin, las excursiones de la seal respecto al valor de
luminancia disminuyen (hay ms blanco), por lo que tampoco se produce la sobremodulacin de la
seal de color.

Componentes de color para la seal NTSC

En el sistema NTSC se eligieron las componentes de crominancia teniendo en cuenta las
caractersticas de resolucin de colores del ojo humano. Para ello se utilizaron los resultados de un
sencillo experimento que fue llevado a cabo por Knic en 1894. Este experimento consiste en situar
un tablero de colores a una cierta distancia de los espectadores e ir alejndolo progresivamente para
determinar si todos los colores dejan de percibirse a una misma distancia o existen colores que dejan
de percibirse antes que otros.

El tablero est dividido en zonas del mismo tamao, pero con distintos matices de color. El nmero de
zonas en que se divide es muy elevado, de modo que estn presentes prcticamente todas las
tonalidades. El resultado del experimento indica que la resolucin espacial del ojo no es igual para
todos los colores. En efecto, cuando el tablero est situado en una posicin cercana a los espectadores
es posible distinguir todos los colores. A medida que el tablero se aleja de los espectadores algunos
colores dejan de percibirse, mientras que otros siguen distinguindose correctamente. Este fenmeno
empieza a producirse cuando el ngulo subtendido por los rectngulos desciende por debajo de los 20
de grado y afecta principalmente a las tonalidades situadas entre el azul, el magenta y el verde. El
sistema visual distingue que se trata de colores distintos basndose en la sensacin de brillo que le
producen, pero no en su color. A partir de este momento, si el tablero continua alejndose, cada vez
son ms los colores que dejan de distinguirse. Las tonalidades que tardan ms en desaparecer son las
correspondientes al amarillo y ciano, que dejan de percibirse como colores cuando el ngulo
subtendido por los rectngulos del tablero se sita en torno a los 10 de grado. Si el tablero sigue
alejndose, ya no podremos apreciar ningn matiz de color aunque seguiremos distinguiendo las
distintas zonas en las que est dividido por la sensacin de brillo que producen mientras el ngulo con
el que observemos cada fragmento sea superior al minuto de grado. ste es el punto a partir del cual
integraremos toda la informacin observando el tablero como un todo y que, como es lgico, coincide
con el lmite de la agudeza visual.

La explicacin de este fenmeno se debe a que la densidad de los tres tipos de conos en la retina no es
idntica, por lo que la resolucin cromtica es ms baja para unas tonalidades que otras. Cuando las
zonas del tablero son lo suficientemente grandes como para activar un nmero considerable de los tres
tipos de sensores, podemos apreciar todas las tonalidades, pero si el rea de excitacin se reduce slo
se excitarn mayoritariamente dos tipos de conos, con lo que la visin se volver dicromtica.

Al definir el NTSC se aprovech est caracterstica del sistema visual para reducir, en lo posible, el
ancho de banda de una las componentes diferencia de color. La idea bsica es muy simple y consiste
en que una de las seales diferencia de color coincida con las tonalidades en las que el sistema visual
presenta menor resolucin. Esta seal puede transmitirse con un ancho de banda menor, debido a que
estos colores slo podrn ser distinguidos si ocupan una regin que ocupe un rea mnima en pantalla.
En caso contrario, no es necesario transmitir los cambios que se producen en esta componente de
seal puesto que se trata de colores que tampoco sern percibidos por el espectador. El lmite del
ancho de banda de esta componente de color puede determinarse teniendo en cuenta la resolucin de
estos colores que, de acuerdo con el experimento de Knic, se corresponde con un ngulo de visin de
20 de grados. La otra componente de color deber transmitirse con un ancho de banda que est
relacionado con la resolucin de 10 de grado a la que dejan de percibirse todos los colores. Este
mismo argumento puede usarse para justificar el mayor ancho de banda asignado a la seal de
luminancia y que se debe a la mejor resolucin del sistema visual (1 de grado) para las sensaciones de
brillo que las de color.

Fig. 3.3 Posicin relativa entre los ejes U y V e I y Q

Utilizando esta idea, el sistema NTSC defini las dos seales diferencia de color como una rotacin
sobre las componentes U y V, de modo que las nuevas coordenadas se correspondieran
aproximadamente con las tonalidades de mayor y menor resolucin de color del sistema visual
humano. Los nuevos ejes de coordenadas para las seales diferencia de color se representan en la
figura 3.3, donde se indica un giro de 33 respecto las componentes U y V del PAL. Este giro centra
uno de los ejes sobre la tonalidad amarilla (la de mayor resolucin) y el otro, ortogonal al primero,
U
V
33
33
Q
I
Uo
Vo
Qo
Io
Eje tonalidades
amarillo - ciano
U
V
33
33
Q
I
Uo
Vo
Qo
Io
Eje tonalidades
amarillo - ciano
sobre una tonalidad intermedia entre el magenta y el azul (la regin con menor resolucin al color).
Las nuevas coordenadas recibieron los nombres I y Q atendiendo a la fase de la portadora con la que
se modula la crominancia en el sistema NTSC. La componente I (In-phase) corresponde a la de mayor
ancho de banda y est en fase con la portadora cosenoidal, mientras que la componente Q
(Quadrature) est en cuadratura con esta portadora.

La relacin analtica entre las componentes del sistema NTSC y el PAL es por tanto:

1
]
1
1
]
1
1
]
1
U
V
sen
sen
Q
I
33 cos 33
33 33 cos
(3.8)

Evidentemente, teniendo en cuenta la relacin entre las componentes U y V con las seales diferencia
de color, tambin podemos expresar:

1
]
1
1
]
1
1
]
1
Y B
Y R
Q
I
414 . 0 478 . 0
269 . 0 783 . 0
(3.9)

O bien, obtener la relacin matricial entre las componentes Y, I y Q con las seales R, G, B que
proporcionar la cmara

1
1
1
]
1
1
1
1
]
1

1
1
1
]
1
B
G
R
Q
I
Y
312 . 0 523 . 0 211 . 0
322 . 0 275 . 0 596 . 0
114 . 0 587 . 0 299 . 0
(3.10)

Esta matriz se aplica a las seales R,G,B procedentes de la cmara despus de haber realizado la
correccin gamma siguiendo un esquema como el indicado en la figura 3.4. Las plantillas de los filtros
de las seales I y Q se representan en la figura 3.5. El filtro correspondiente a la seal I tiene un
ancho de banda de 1.3 MHz y utiliza una curva suave con una banda de transicin relativamente
amplia, mientras que el filtro de la seal Q, con un ancho de banda de 0.5 MHz, tiene una banda de
transicin mucho ms abrupta, de modo que todas las componentes que superan la frecuencia de corte
son fuertemente atenuadas.

En la figura 3.4 tambin se representan unas clulas de retardo que se aplican al canal de luminancia y
a la seal diferencia de color I. La presencia de estos retardos se debe a que los filtros que se aplican a
las tres componentes tienen anchos de banda distintos, por lo que las seales tambin experimentan
retardos distintos. Las clulas de retardo intentan compensar estas diferencias para que las tres seales
estn en fase y por lo tanto proporcionen, en cada instante de tiempo, informacin sobre un mismo
elemento de imagen. La componente que experimenta un mayor retardo es la Q, ya que es la que se
pasa a travs del filtro con menor ancho de banda. Por ello, slo es necesario compensar los retardos
de las otras dos componentes. En el supuesto de que no se realizara esta correccin, las informaciones
correspondientes a la luminancia y a cada una de las seales diferencia de color no estaran
correctamente sincronizadas, lo que se observara en la pantalla como un ligero desplazamiento
horizontal entre las tres componentes.


Fig. 3.4 Obtencin de la seal de luminancia y componentes I, Q en el NTSC

Fig. 3.5 Plantillas de los filtros de seal diferencia de color I, Q en el sistema NTSC

Fig. 3.6 Obtencin de la seal de luminancia y componentes U y V en el sistema PAL

Cmara
R
G
B
1 /
1 /
1 /
Matriz
RGB
a
YIQ
FPB
0,5 MHz
FPB
1,3 MHz
FPB
4,2 MHz
Retardo
T2
Retardo
T1
R
G
B
Y
I
Q
Ym
Im
Qm
If
Qf
Cmara
R
G
B
1 /
1 /
1 /
Matriz
RGB
a
YIQ
FPB
0,5 MHz
FPB
1,3 MHz
FPB
4,2 MHz
Retardo
T2
Retardo
T1
R
G
B
Y
I
Q
Ym
Im
Qm
If
Qf
0.25
0.50
0.75
1.00
1 2 3 4 5 6
Amplitud
Frecuencia
(MHz)
-3 dBs
1.3 MHz
3.6 MHz
-20 dBs
0.25
0.50
0.75
1.00
1 2 3 4 5 6
Amplitud
Frecuencia
(MHz)
-2 dBs
0.4 MHz
0.5 MHz
-6 dBs
0.6 MHz
-6 dBs
Filtro
componente I
Filtro
componente Q
0.25
0.50
0.75
1.00
1 2 3 4 5 6
Amplitud
Frecuencia
(MHz)
-3 dBs
1.3 MHz
3.6 MHz
-20 dBs
0.25
0.50
0.75
1.00
1 2 3 4 5 6
Amplitud
Frecuencia
(MHz)
-2 dBs
0.4 MHz
0.5 MHz
-6 dBs
0.6 MHz
-6 dBs
0.25
0.50
0.75
1.00
1 2 3 4 5 6
Amplitud
Frecuencia
(MHz)
-3 dBs
1.3 MHz
3.6 MHz
-20 dBs
1 2 3 4 5 6
Amplitud
Frecuencia
(MHz)
-3 dBs
1.3 MHz
3.6 MHz
-20 dBs
0.25
0.50
0.75
1.00
1 2 3 4 5 6
Amplitud
Frecuencia
(MHz)
-2 dBs
0.4 MHz
0.5 MHz
-6 dBs
0.6 MHz
-6 dBs
Filtro
componente I
Filtro
componente Q
Cmara
R
G
B
1 /
1 /
1 /
Matriz
RGB
a
YUV
FPB
1,3 MHz
FPB
1,3 MHz
FPB
5 MHz
Retardo
T1
R
G
B
Y
U
V
Ym
Um
Vm
Uf
Vf
Cmara
R
G
B
1 /
1 /
1 /
Matriz
RGB
a
YUV
FPB
1,3 MHz
FPB
1,3 MHz
FPB
5 MHz
Retardo
T1
R
G
B
Y
U
V
Ym
Um
Vm
Uf
Vf

As, en una regin de la imagen en la que apareciera un contorno uniforme, veramos que el cambio de
color se producira en una posicin situada ligeramente ms hacia la derecha de la zona en la que se
produce el cambio de brillo. Adems, como primero se recibira la componente I y despus la Q,
observaramos cambios de matices en las zonas de los contornos que no se corresponderan con la
imagen real. En la figura 3.4 las seales en la salida de los filtros y en la salida de las clulas de
retardo se indican respectivamente como I
f
, Q
f
y I
m
, Q
m
. No obstante, en general suele prescindirse
de estos subndices para distinguir las distintas versiones de las seales, entendindose que siempre se
realiza este filtrado y retardo de seales y que, por contexto, dependiendo del punto del sistema al que
hagamos referencia, sabremos siempre de qu seales se trata.

En el sistema PAL la obtencin de las seales Y, U y V sigue un esquema parecido al utilizado en
el NTSC (ver figura 3.6), aunque en este caso los dos filtros de las seales diferencia de color son
idnticos, por lo que nicamente deberemos retardar la seal de luminancia. Las plantillas utilizadas
para los filtros de las componentes U y V se representan en la figura 3.7.

Fig. 3.7 Plantillas de los filtros de las componentes U y V en el sistema PAL

3.2.2 Modulacin de las seales diferencia de color en los sistemas NTSC y PAL
Una vez establecida la relacin entre las seales diferencia de color que se utilizan en los sistemas
PAL y NTSC, podremos comprobar que las seales transmitidas al canal, aunque con diferencias
ciertamente sutiles, tienen muchas caractersticas en comn.

En efecto, desarrollando los trminos en seno y coseno en la expresin de la seal de croma para el
sistema NTSC, obtenemos la siguiente expresin:

0.25
0.50
0.75
1.00
1 2 3 4 5 6
Amplitud
Frecuencia
(MHz)
-3 dBs
1.3 MHz
4 MHz
-20 dBs
Filtro
componentes U y V
0.25
0.50
0.75
1.00
1 2 3 4 5 6
Amplitud
Frecuencia
(MHz)
-3 dBs
1.3 MHz
4 MHz
-20 dBs
Filtro
componentes U y V

( )
( )
) 2 cos( ) ( ' ) 2 ( ) ( '
) 33 ( ) 2 ( ) 33 cos( ) 2 cos( ) ( '
) 33 ( ) 2 cos( ) 33 cos( ) 2 ( ) ( '
) 33 2 cos( ) ( ' ) 33 2 ( ) ( ' ) (
t f t A t f sen t B
sen t f sen t f t I
sen t f t f sen t Q
t f t I t f sen t Q t croma
N N
N N
N N
N N NTSC
+
+
+ +
+ + +
(3.11)

donde hemos definido las seales A(t) y B(t) como las componentes en fase y cuadratura respecto a
la portadora cosenoidal. Estas seales pueden expresarse en funcin de las seales Q(t) e I(t) como

); 33 ( ) ( ' ) 33 cos( ) ( ' ) ( '
); 33 cos( ) ( ' ) 33 ( ) ( ' ) ( '
sen t I t Q t B
t I sen t Q t A

+
(3.12)

relacin que puede expresarse matricialmente como

1
]
1
1
]
1
1
]
1
) ( '
) ( '
33 cos 33
33 33 cos
) ( '
) ( '
t Q
t I
sen
sen
t B
t A
(3.13)

donde se observa claramente que las componentes A(t) y B(t) se corresponden con un giro de 33 en
el sentido horario de las componentes I(t) y Q(t).

Llegados a este resultado, cabe cuestionarnos qu sentido tiene que el sistema NTSC realice un primer
giro de 33 de las componentes V y U en el sentido antihorario, si posteriormente estas seales sern
transmitidas mediante unas portadoras desfasadas que equivalen a realizar un giro de 33 en el sentido
horario de las componentes de color. Una primera inspeccin a este resultado parece indicar que el
sistema NTSC est transmitiendo las mismas seales que se envan en el sistema PAL (exceptuando,
claro est, el cambio de signo en la componente V). En efecto, si sustituimos directamente la
ecuacin 3.8 en la ecuacin 3.13 obtendremos:

1
]
1
1
]
1
1
]
1
1
]
1
1
]
1
) ( '
) ( '
) ( '
) ( '
33 cos 33 sen
33 sen 33 cos
33 cos 33 sen
33 sen 33 cos
) ( '
) ( '
t U
t V
t U
t V
t B
t A
(3.14)

lo que nos indica que las seales A(t) y B(t) coinciden con las que se transmiten en el sistema PAL.

Sin embargo, hemos de tener en cuenta que las seales I, Q que se aplican a los mezcladores han
sido previamente filtradas, por lo que no en todos los casos las componentes A(t) y B(t) coincidirn
con las seales U(t) y V(t) que se transmitiran en el sistema PAL. Consideremos algunos casos
particulares para aclarar estas diferencias.

Supongamos que la escena que desea transmitirse produce una seal Q(t), con todas sus componentes
espectrales situadas dentro del ancho de banda de 0.5 MHz que se utiliza en el filtro de la componente
en cuadratura. En este caso, es evidente que la seal que se aplica al modulador, llammosla Q
f
,
coincide exactamente con la componente Q(t), por lo que las seales A(t) y B(t) sern
prcticamente iguales a las U(t) y V(t) que se transmitiran en el PAL.

No obstante, en el caso en que la seal Q(t) tenga componentes espectrales de frecuencia superior al
ancho de banda del filtro, la seal Q
f
(t) no coincidir con la original. Esto significa que se
transmitirn matices de color distintos a los que realmente existen en la escena, ya que no se enva la
componente completa, sino nicamente la parte de baja frecuencia. El problema, como hemos visto,
no es grave, ya que el sistema visual ser incapaz de distinguir entre los matices reales y los recibidos.
Sin embargo, ya no es posible sustituir la ecuacin 3.8 en la 3.13, puesto que la componente que
realmente se transmite no es exactamente la Q(t). En consecuencia, las seales A(t) y B(t) ya no
coinciden con las U(t) y V(t).

En resumen, la filosofa empleada en el sistema NTSC para la construccin de las seales diferencia
de color permite ahorrar algo de ancho de banda en una de las componentes, sin que suponga una
prdida en la calidad de la seal. Si las componentes de color slo tienen contenido en baja frecuencia,
la informacin de crominancia transmitida en el sistema NTSC y el PAL coinciden. En cambio, si
existen componentes de alta frecuencia, las seales de croma en ambos sistemas no coinciden, aunque
el espectador no es capaz de apreciar las diferencias entre los matices de las informaciones recibidas.
Veremos en secciones posteriores que uno de los principales problemas del sistema NTSC es que
pueden producirse degradaciones en el matiz de color obtenido en el reproductor respecto al matiz
original de la escena. Sin embargo, estos problemas son debidos a motivos completamente ajenos al
tipo de seales diferencia de color que se transmiten.

En la siguiente seccin se describir con detalle la seal en banda base para el sistema NTSC y se
analizarn los diagramas de bloques del codificador y el decodificador NTSC. Asimismo,
discutiremos el problema al que nos hemos referido en el prrafo anterior y cuya resolucin llev a la
introduccin del sistema PAL.

3.3 El sistema NTSC
3.3.1 Seleccin de la frecuencia portadora de la seal de croma
La superposicin de la seal de croma con la informacin de luminancia es, como ya se discuti en el
captulo 1, la nica forma de conseguir que los sistemas de televisin en color sean compatibles con
los de blanco y negro. Sin embargo, esta estrategia de transmisin de la informacin de color hace
inevitable que aparezcan interferencias entre las componentes de luminancia y las de color. Estas
interferencias afectarn especialmente a los receptores en blanco y negro, ya que en su diseo no se ha
tenido en cuenta la presencia de la seal de croma.

Una vez decidido el sistema de modulacin y las seales diferencia de color que se utilizarn para la
transmisin de la croma, slo queda seleccionar la frecuencia portadora de la seal. Esta frecuencia
portadora deber elegirse, utilizando como criterio principal que la interferencia que introduce la seal
de color en los receptores de blanco y negro sea mnima. Si expresamos la ecuacin 3.1 en funcin de
una nica portadora cosenoidal obtenemos:

( ) )) ( ' / ) ( ' ( 33 2 cos ) ( ' ) ( ' ) ( '
) 33 2 ( ) ( ' ) 33 2 cos( ) ( ' ) ( ' ) (
0
2 2
0 0
t I t Q arctg t f t I t Q t Y
t f sen t Q t f t I t Y t x
NTSC
+ + +
+ + + +
(3.15)

donde se observa que a la seal de luminancia se superpone una seal cosenoidal cuya amplitud y fase
proporciona la informacin relativa a las seales diferencia de color. En la figura 3.8 se ha
representado una lnea tpica de la seal de televisin en color donde se indica explcitamente la
superposicin entre las dos componentes. En principio, un receptor en color deber estar preparado
para separar correctamente las componentes de luminancia y color de la seal recibida. En cambio, un
receptor en blanco y negro interpretar la componente cosenoidal como una interferencia que se
superpone a la seal de luminancia y que, al no poder separarla de la primera, ser representada como
si fuera la propia luminancia en la pantalla del receptor.

As pues, deberemos elegir la frecuencia portadora de la informacin de crominancia de acuerdo con
un triple criterio. Por una parte, los receptores en color debern poder separar con facilidad ambas
componentes utilizando filtros u otros sistemas de fcil implementacin. Adems, deberemos intentar
elegir la frecuencia portadora para minimizar las intermodulaciones entre ambas seales, que podran
provocar que parte de la informacin de crominancia fuera interpretada como luminancia y viceversa.
Finalmente, admitiendo que es inevitable que los receptores en blanco y negro representen en la
pantalla toda la informacin recibida, sin distinguir si se trata de croma o luminancia, la portadora de
color deber tener una frecuencia que introduzca un patrn de interferencia poco visible para el
espectador.

Fig. 3.8 Superposicin de la luminancia y la croma en el sistema NTSC

Debemos comentar en este punto que en todo momento trabajaremos con la hiptesis de que los
receptores monocromos suponen que se est transmitiendo una seal en blanco y negro puro. En la
actualidad, muchos receptores en blanco y negro realizan algn tipo de filtrado previo sobre la seal
recibida presuponiendo que nicamente recibirn seales en color. Con ello se consigue reducir
apreciablemente la interferencia que produce la croma sobre la luminancia. Sin embargo, cuando se
disearon los primeros sistemas en color, deba considerarse el efecto de estas seales sobre
receptores preparados exclusivamente para recibir seales en blanco y negro. Por tanto, este es el
problema que debemos considerar como criterio de seleccin de la frecuencia portadora.

Imbricacin espectral entre la luminancia y las componentes de color

Todas las consideraciones previas nos llevan a elegir una frecuencia portadora que sea un mltiplo
impar de la mitad de la frecuencia de lnea.
Luminancia
Luminancia
+
Croma
Luminancia
Luminancia
+
Croma

( )
2
1 2
Lnea
NTSC
f
n f + (3.16)

La razn fundamental de esta seleccin es que el contenido espectral de la seal de luminancia est
concentrado en los mltiplos de la frecuencia de lnea, por lo que al modular las seales diferencia de
color nos interesar que su energa se concentre en aquellas regiones espectrales donde la seal de
luminancia presente un contenido energtico mnimo. De este modo, las componentes de color y
luminancia quedan imbricadas espectralmente, reducindose la interferencia entre ambas y facilitando
la separacin de estas componentes en el receptor.

La imbricacin espectral entre las seales se ilustra en la figura 3.9. La seal de luminancia y las dos
componentes diferencia de color tienen, como hemos visto en el captulo anterior, un espectro en el
que la mayor parte de la energa se concentra en los mltiplos de la frecuencia de lnea. Si elegimos
una frecuencia portadora que sea un mltiplo impar de la mitad de la frecuencia de lnea, es decir, que
est situada justo entre dos mltiplos de la frecuencia de lnea, desplazaremos el contenido espectral
de las seales I y Q a frecuencias en las que la seal de luminancia tiene un contenido prcticamente
nulo. De este modo, los dos espectros quedan imbricados, compartiendo la misma banda de
frecuencias, pero con una interferencia mutua mnima. Adems, veremos que es posible obtener una
muy buena separacin entre las dos componentes utilizando un tipo especial de filtros peridicos
(Comb Filters).

Fig. 3.9 Imbricacin entre los espectros de la luminancia y la croma
0 f
L
2f
L
3f
L
mf
L
320f
L
Espectro luminancia
Espectros I, Q
f
f
0 f
L
2f
L
3f
L
mf
L
320f
L
0 f
L
2f
L
3f
L
320f
L
Espectro luminancia + I, Q moduladas
f
(2m+1)f
L
/2
I,Q
I,Q
I,Q
Y
Y
0 f
L
2f
L
3f
L
mf
L
320f
L
Espectro luminancia
Espectros I, Q
f
f
0 f
L
2f
L
3f
L
mf
L
320f
L
0 f
L
2f
L
3f
L
320f
L
Espectro luminancia + I, Q moduladas
f
(2m+1)f
L
/2
I,Q
I,Q
I,Q
Y
Y

En la figura 3.9 hemos querido mantener la presencia de las componentes, separadas 50 Hz y que son
debidas a la repeticin de la seal en cada campo. Debera notarse que esta representacin no se ha
realizado a escala, en cuyo caso hubiramos obtenido una mayor concentracin de los espectros en los
mltiplos de la mitad de la frecuencia de lnea, dejndose un considerable espacio intersticial entre las
componentes de luminancia y de croma.

El valor de la frecuencia portadora de la seal de croma debe ser suficientemente elevado para que el
patrn de interferencias que se produce en la pantalla de un receptor monocromo sea lo menos visible
posible. Si la frecuencia es elevada podemos intuir, a partir de la figura 3.8, que la imagen
representada en el receptor tendr cambios de luminancia muy rpidos que, siempre que produzcan un
patrn poco definido, sern integrados por el espectador, resultando poco visibles. Sin embargo,
debemos notar que la frecuencia portadora no puede aumentarse excesivamente, ya que tendremos que
mantener las seales de croma dentro del ancho de banda asignado a la componente de vdeo en un
canal de televisin, que en el sistema NTSC es de aproximadamente 4,2 MHz. Tngase en cuenta que
este ancho de banda es una restriccin impuesta por los sistemas en blanco y negro que ya estaban
operativos en el momento de definir el NTSC. Los sistemas en color compatibles deben siempre
acomodarse en los canales previamente utilizados por los sistemas en blanco y negro, puesto que si no
fuera as, podran introducirse interferencias en sistemas ya operativos. Adems, debe tenerse presente
que la portadora de sonido est situada en 4,5 MHz y debe mantenerse en esta posicin si pretendemos
que el sistema sea compatible.

La frecuencia que finalmente se eligi para el sistema NTSC es:

Lnea Lnea NTSC
f f f 5 , 227
2
455
(3.17)

Si sustituimos la frecuencia de lnea por su valor numrico obtenemos:

MHz Hz f
NTSC
583125 , 3 ) 30 525 ( 5 , 227 (3.18)

Fig. 3.10 Ubicaciones espectrales de las componentes de luminancia y croma
4,2 MHz 3,58 MHz
Q Q
I I
Luminancia
frecuencia
Amplitud
4,2 MHz 3,58 MHz
Q Q
I
I
Luminancia
frecuencia
Amplitud
Filtrado de la componente I
Banda lateral vestigial
4,2 MHz 3,58 MHz
Q Q
I I
Luminancia
frecuencia
Amplitud
4,2 MHz 3,58 MHz
Q Q
I
I
Luminancia
frecuencia
Amplitud

En la figura 3.10 se representa la posicin relativa de los espectros de la seal de luminancia y de cada
una de las componentes de color. Aunque sigue mantenindose la imbricacin espectral entre las
seales, los espectros se han representado como continuos para facilitar la localizacin de los lmites
del ancho de banda de cada componente.

La portadora elegida desplaza las seales I y Q a la parte alta del espectro. La seal Q, con un ancho
de banda de 1 MHz, se extiende desde los 3 MHz hasta los 4 MHz, por lo que tiene cabida en el ancho
de banda asignado a la componente de vdeo de un canal del sistema NTSC. No obstante, la seal I,
con un ancho de banda total de 2,6 MHz, se situar entre los 2,2 MHz hasta los 4,8 MHz con lo cual
excedera el lmite asignado a la seal de vdeo. La solucin adoptada consiste en eliminar, mediante
filtrado, la parte alta del espectro de la seal I, por lo que realmente esta seal se transmite con su
banda lateral inferior completa ms una banda lateral vestigial superior de 0,5 MHz. Veremos que este
formato de transmisin de la seal no supone ningn problema para su demodulacin.

3.3.2 Patrones de interferencia en el sistema NTSC
Se conocen con el nombre de patrones de interferencia las componentes de la imagen que aparecen en
un receptor monocromo como consecuencia de la existencia de la informacin de croma en la seal de
televisin. La seal recibida puede descomponerse en la componente de luminancia ms la de croma

) ( ) ( ' ) ( t croma t Y t x
NTSC NTSC
+ (3.19)

Desde el punto de vista de un receptor monocromo, la seal Y(t) es la componente deseada mientras
que la croma deber ser considerada como una interferencia. La imagen que veremos en la pantalla
del receptor ser, pues, una superposicin de estas dos seales, interesndonos que la componente de
croma sea lo menos molesta posible. La eleccin de una frecuencia portadora de valor elevado
condiciona que las componentes de croma varen muy rpidamente en el tiempo, lo que significa que
en la pantalla se representarn cambios de luminancia muy bruscos que el sistema visual, en lo
posible, integrar. Decimos que, en lo posible, integrar debido a que la portadora de la seal de
croma tiene una frecuencia de 3,58 MHz que, en principio, debera resultar visible, pues se encuentra
dentro de los lmites en los que el ojo tiene an una buena resolucin. De hecho, si la interferencia
permaneciera estacionaria en la pantalla, sera muy molesta y su presencia sera intolerable para los
usuarios de receptores monocromos.

Sin embargo, comprobaremos que al haber elegido como frecuencia portadora un mltiplo impar de la
mitad de la frecuencia de lnea, la interferencia generada en la pantalla cambia completamente su fase
de una imagen a otra. De este modo, los puntos de la pantalla que en la imagen actual aparecen con
una luminancia superior a la real aparecern, en la imagen siguiente, con una luminancia inferior a la
real. La baja visibilidad de la interferencia se debe, por tanto, a la accin conjunta de integracin del
sistema visual tanto en el espacio como en el tiempo. El fenmeno que se produce es parecido al que
se discuti en el captulo 1 con motivo del efecto Kell. En aquel caso, no era posible que el ojo
observara una imagen en la que todas las lneas de un campo eran blancas y las del otro campo negras,
debido al efecto conjunto de rpida variacin espacial y temporal de la imagen, que provocaba que se
integraran ambas informaciones en una imagen gris. No obstante, en este caso debe tenerse en cuenta
que la frecuencia portadora de la croma no est en el lmite de resolucin del ojo, por lo que la
interferencia, aunque poco molesta y por lo tanto tolerable, ser perceptible.

Evidentemente, el patrn de interferencia generado por la seal de croma depende de la propia
informacin que contiene la seal. No obstante, con el objeto de esclarecer los conceptos expuestos en
los prrafos anteriores, representaremos un ejemplo concreto de imagen o patrn interferente. Para
ello, supondremos que se transmite una seal con luminancia constante a la que se superpone una
seal de croma cuyas componentes de color tampoco varan en el tiempo. Este ejemplo se
correspondera con una imagen esttica de color uniforme en toda la pantalla. La forma de onda
asociada a una de las lneas se representa esquemticamente en la figura 3.11, donde el color de la
imagen dependera del valor medio de la seal (luminancia) y de la amplitud y fase de la portadora de
color (componentes I y Q).

Fig. 3.11 Seal genrica para la que se determina la imagen del patrn de interferencia

La seal que desearamos que se representara en un receptor en blanco y negro sera nicamente la de
luminancia, que en este caso concreto se correspondera con el valor medio de la seal. Sin embargo,
la croma se superpondr a la luminancia y, por lo tanto, la imagen que veremos en la pantalla se
corresponder con la forma de onda de la seal de la figura 3.11, es decir, obtendremos rpidas
variaciones de la luminancia a lo largo de la pantalla. En resumen, el receptor representa la imagen
como si se tratara de una seal en blanco y negro, ya que en principio no est diseado para descifrar
la informacin de color.

La imagen que se observar en la pantalla puede descomponerse en la suma de la seal deseada, que
en este caso es un nivel de gris constante, ms la interferencia sinusoidal debida al color. Esta
interferencia se corresponde con una imagen cuyos niveles de brillo a lo largo de una lnea dependen
de la amplitud de la componente sinusoidal y varan de acuerdo con la frecuencia portadora de la seal
de croma. Por lo tanto, como la frecuencia portadora del color es 227,5 veces la frecuencia de lnea, se
representarn 227,5 ciclos de esta interferencia en cada lnea de la imagen (en realidad slo sern
visibles los ciclos que estn dentro de la lnea activa).
t
Luminancia
constante
Valor medio
de la seal
Croma:
Patrn interferente
Amplitud
t
Luminancia
constante
Valor medio
de la seal
Croma:
Patrn interferente
Amplitud

En la figura 3.12 se ilustra el procedimiento general para ver la forma grfica del patrn interferente
generado por la portadora de color. Las partes correspondientes al semiperiodo negativo y positivo de
la seal sinusoidal se representan respectivamente como pequeos cuadrados de color oscuro y claro.
En realidad la luminancia asociada a la seal tiene transiciones sinusoidales entre los niveles mximo
y mnimo de brillo, pero para simplificar la visualizacin del patrn interferente, supondremos que
estas transiciones pueden aproximarse por estos pequeos cuadrados. As, el brillo mximo de la
interferencia estar situado en el centro de un cuadrado claro, mientras que el mnimo nivel de brillo
se corresponder con el centro de un cuadrado oscuro.

Fig. 3.12 Clculo del patrn interferente producido en la pantalla por la portadora de color

Consideremos un punto de la pantalla en el que se produce un mximo nivel de la interferencia.
Supondremos que este punto, tal y como se indica en la figura 3.12, pertenece a la lnea k del campo
A y en l tomaremos la referencia de origen de tiempos. El punto situado en la misma vertical, pero
dos lneas ms hacia abajo, corresponde a la lnea k+1 del campo A y se representar en la pantalla
justo una lnea despus del punto que hemos tomado como referencia. El tiempo que transcurre entre
la representacin de los dos elementos es, por tanto, igual al tiempo de lnea (T
Lnea
), por lo que la
portadora de color habr completado un total de 227,5 ciclos. En efecto:

ciclos
f
f
T
T
ciclos n
Lnea
Lnea
color portadora
Lnea
5 , 227
5 , 227

(3.20)

De acuerdo con este resultado, la seal habr experimentado un cambio de fase de 180, por lo que si
en el instante de referencia la interferencia tena un nivel de brillo mximo, ahora ser mnimo.

Determinemos ahora el nivel de la portadora en la lnea de la imagen situada justo por debajo del
elemento de referencia. Esta lnea corresponde al siguiente campo de la imagen y se representar
Mximo de la sinusoide Mnimo de la sinusoide
Lnea k, campo A
Lnea k+1, campo A
Referencia
tiempo
t=0
Tiempo transcurrido
1 Lnea
t=T
Lnea
Lnea k+0.5+(525/2), campo B
Tiempo transcurrido
263 Lnea
t=263T
Lnea
Estructura de los patrones
interferentes
Mximo de la sinusoide Mnimo de la sinusoide
Lnea k, campo A
Lnea k+1, campo A
Referencia
tiempo
t=0
Tiempo transcurrido
1 Lnea
t=T
Lnea
Lnea k+0.5+(525/2), campo B
Tiempo transcurrido
263 Lnea
t=263T
Lnea
Estructura de los patrones
interferentes
cuando hayan transcurrido un total de ((525/2)+1/2)=263 lneas desde que se ha representado el
primer elemento. El trmino de 525/2 lneas se debe a que ha transcurrido un campo completo entre
los dos elementos y la media lnea adicional se aade debido a que el nmero de lneas en cada campo
no es entero. La figura 3.13 puede ayudar a comprender mejor la presencia de estos dos trminos. En
este ejemplo se considera un sistema de televisin de 5 lneas y dos campos. El elemento de referencia
ha sido indicado mediante un pequeo cuadrado, mientras que los puntos obtenidos despus de cada
periodo de lnea completo se representan mediante crculos. Ntese que en este ejemplo el punto
situado inmediatamente debajo del elemento de referencia se traza despus de (nmero total
lneas/2)+0.5) lneas, es decir, despus de 3 lneas completas.

Fig. 3.13 Clculo del nmero de lneas entre un elemento de imagen y el inmediatamente inferior en un sistema
simplificado de 5 lneas y 2 campos

Volviendo a nuestro sistema de 525 lneas, el nmero de ciclos de la portadora de color que se habrn
completado durante estas 263 lneas puede calcularse como

ciclos
f
f
T
T
Lnea
Lnea
color portadora
Lnea
5 , 59832
5 , 227 263 263
(3.21)

Nuevamente este resultado nos indica que la portadora de color, despus de estas 263 lneas, volver a
estar en contrafase respecto al valor que tomaba en el elemento de imagen de referencia. Los niveles
de brillo que toma la portadora de color en los tres elementos considerados se han representado en la
figura 3.12.

Si el elemento de referencia coincide con un mximo de brillo de la interferencia, los dos elementos
situados en las lneas inmediatamente inferiores tomarn valores mnimos. Podramos repetir este
razonamiento para cualquier elemento situado sobre la lnea k, o sobre cualquiera de las lneas del
campo A, obteniendo una imagen aproximada de cmo se visualizar la interferencia en la pantalla. El
resultado obtenido se ha representado en la figura 3.14, donde se observa que los mximos y mnimos
de la interferencia quedan superpuestos en un patrn complejo en los que los niveles lmite se alternan
tanto en el sentido vertical como en el horizontal.

Punto referencia
0
1 Lnea
2 Lneas
3 Lneas
1
2
3
Punto referencia
0
1 Lnea
2 Lneas
3 Lneas
1
2
3
Si la frecuencia de la portadora de color hubiera sido un mltiplo de la frecuencia de lnea, se hubiera
obtenido un patrn interferente formado por lneas verticales que alternan los valores mximos y
mnimos. As pues, aunque en el sentido horizontal este patrn interferente presentara cambios a una
frecuencia razonablemente alta, en el sentido vertical los niveles permaneceran constantes, siendo por
tanto muy visibles y molestos.

Hasta ahora se ha considerado la forma de patrn interferente considerando una nica imagen. La
principal ventaja de la frecuencia portadora que se ha elegido es que este patrn se invierte
completamente de una imagen a la siguiente, permitiendo, como ya se ha comentado, que la imagen
que se presenta al espectador presente rpidas variaciones no slo en las direcciones vertical y
horizontal, sino tambin en el tiempo.

Fig. 3.14 Forma del patrn interferente correspondiente a una imagen completa

En efecto, refirindonos nuevamente a la figura 3.12, est claro que el elemento de referencia volver
a representarse en la siguiente imagen una vez que hayan transcurrido las 525 lneas propias del
sistema NTSC. Podemos calcular el nmero de ciclos de la portadora de color que transcurren durante
este intervalo de tiempo, obteniendo, de nuevo, que la portadora estar en contrafase respecto al valor
que tomaba en este mismo punto de la pantalla en la imagen anterior. En efecto:

ciclos 5 , 119437
5 , 227 525 525
Lnea
Lnea
color portadora
Lnea
f
f
T
T
(3.22)

As, la imagen asociada a la interferencia vara de imagen a imagen, de manera que, en cada punto de
la pantalla, la interferencia que se superpone a la seal deseada tomar valores de signo cambiado
oscilando a una frecuencia de 12,5 Hz (equivalente a dos imgenes). En la figura 3.15 se representan
Lnea K (Campo A)
Origen tiempo
Lnea K (Campo B)
T
Lnea
Linea K+525/2+0.5
(Campo B)
263T
Lnea
Patrn Interferente
en la Imagen tipo A
Lnea K (Campo A)
Origen tiempo
Lnea K (Campo B)
T
Lnea
Linea K+525/2+0.5
(Campo B)
263T
Lnea
Patrn Interferente
en la Imagen tipo A
los patrones obtenidos en esta secuencia de dos imgenes que se han denominado imagen tipo A e
imagen tipo B.

Evidentemente, la secuencia temporal del patrn interferente abarca nicamente dos imgenes, ya que
la portadora de color estar nuevamente en fase con el punto de referencia cuando hayan transcurrido
2525 lneas, que se corresponden con 2119437,5=238875 ciclos completos de la portadora.

Es importante recordar que todo el anlisis del patrn interferente se ha basado en que la seal que se
transmita era estacionaria y uniforme en toda la pantalla. En un caso real se producirn variaciones
tanto en la seal de luminancia como en la amplitud y la fase de la portadora de color, por lo que la
imagen de la croma no ser tan estable como hemos postulado. Las variaciones en la amplitud de la
seal de croma supondrn que en determinadas regiones la amplitud de la imagen interferente ser
mayor que en otras. Por otra parte, los cambios de fase pueden significar que en las zonas en las que
se produzcan cambios de tonalidades el patrn de interferencias deje de tener la estructura peridica
que hemos discutido. Sin embargo, estas zonas estn ligadas a los contornos de la imagen en los que,
debido a que varan tanto la luminancia como la tonalidad de la imagen, la interferencia ser poco
visible. En zonas con brillo y color uniformes, que por otra parte son las ms abundantes y en donde la
interferencia es ms fcil de percibir, se mantendr la estructura espacial y temporal del patrn
interferente.

Fig. 3.15 Variacin temporal del patrn interferente entre imgenes consecutivas

Nuevamente, podramos plantearnos qu hubiera ocurrido con la evolucin temporal del patrn de
interferencias en el supuesto de que la frecuencia portadora hubiera sido un mltiplo de la frecuencia
de lnea. El resultado es evidente, ya que el nmero de ciclos de la portadora de color en una lnea
hubiera sido un entero perfecto, de manera que el patrn permanecera estacionario en el tiempo
aumentando considerablemente su visibilidad.

Patrn Interferente
en la Imagen tipo A
Patrn Interferente
en la Imagen tipo B
Patrn Interferente
en la Imagen tipo A
Patrn Interferente
en la Imagen tipo B
Otro aspecto que se deriva directamente de esta discusin es que el hecho de que cualquier frecuencia
que no sea un mltiplo impar de la mitad de la frecuencia de lnea generar un patrn interferente que
resultar ms molesto para el espectador. En efecto, la frecuencia seleccionada permite que tanto
variaciones en la direccin vertical como en la temporal muestren la mayor tasa de cambios posible
con lo que facilitan la integracin de la imagen interferente y minimizan su visibilidad. Cualquier otro
valor de la frecuencia podra provocar la aparicin de patrones estacionarios o que se desplazaran muy
lentamente sobre la pantalla, con lo que su visibilidad sera mayor. De hecho, en el siguiente apartado
veremos que en el sistema NTSC tuvo que modificarse ligeramente la frecuencia de imagen respecto a
la utilizada en los sistemas en blanco y negro para provocar que la posible intermodulacin entre la
portadora de color y de sonido tuviera una frecuencia que resultara poco molesta cuando se visualiza
en la pantalla.

3.3.3 Modificacin de la frecuencia de imagen
Al disear el sistema NTSC tuvieron que tenerse en cuenta los diversos factores que podran generar
interferencias en la imagen por el hecho de aadir una nueva componente que soportaba la
informacin de color. Uno de estos factores es que, en el sistema en blanco y negro sobre el que se
bas el NTSC, la seal de sonido se transmita en frecuencia modulada sobre una portadora situada en
los 4.5 MHz. Los parmetros de esta modulacin del sonido no podan modificarse en lo ms mnimo,
puesto que cualquier cambio sobre la frecuencia portadora hubiera significado importantes
degradaciones sobre las seales demoduladas por los receptores en blanco y negro ya existentes.

En principio, la portadora de sonido est fuera de la banda de vdeo, por lo que parece que si la
separacin entre las dos seales que se realiza en el receptor es correcta, no debera aparecer ningn
problema. Sin embargo, al disear el sistema debe tenerse en cuenta que no todos los receptores sern
ideales y que es posible que algunos sistemas de separacin de vdeo y audio muestren algn tipo de
comportamiento no lineal.

Fig. 3.16 Aparicin de componentes de intermodulacin debidas a las no linealidades del circuito

Parte Lineal
del circuito
No linealidades
cuadrticas
Vout=k2 (Vin)
2
f1 f2 f1 f2
0
f2-f1
2f1 2f2
f1+f2
Parte Lineal
del circuito
No linealidades
cuadrticas
Vout=k2 (Vin)
2
f1 f2 f1 f2
0
f2-f1
2f1 2f2
f1+f2
La presencia de no linealidades en alguno de los circuitos puede provocar la aparicin de nuevas
componentes de seal, que aparecen en el mismo receptor y que pueden producir interferencias sobre
las componentes deseadas. La situacin se ilustra en la figura 3.16, donde se representa un sistema que
incorpora una no linealidad de tipo cuadrtico en su salida. Si en la entrada estn presentes dos
componentes sinusoidales de frecuencias distintas, en la salida de la parte lineal del circuito siguen
mantenindose estas dos componentes, probablemente con amplitudes y fases distintas, pero con la
misma frecuencia. Sin embargo, en la salida de la parte cuadrtica del circuito aparecen seales que no
se corresponden directamente con las frecuencias de entrada, sino con las distintas combinaciones
suma y diferencia entre las dos frecuencias.

Para el ejemplo que hemos considerado, puede entenderse fcilmente este resultado si desarrollamos
la salida que se obtiene cuando en la entrada aparecen dos componentes sinusoidales:

( )
( ) ( )
( ) ( ) ) ) cos(( ) ) cos((
) 2 cos( ) 2 cos(
2
1
2
1
) ( ) (
2 1 2 1 2 1 2
2
2
2 1
2
1
2
2
2
1 2
2
2 2 1 1 2
t t A A k
t A t A A A k
t sen A t sen A k
+ +
+
,
_
+ +
+
(3.23)

La seal de salida est, pues, formada por la superposicin de componentes continuas, componentes
de frecuencia doble y componentes cuya frecuencia se obtiene como la suma y la diferencia de las
frecuencias de las seales de entrada. El nivel de estas seales depende del grado de no linealidad de
los circuitos que queda representado por la amplitud de la constante k
2
. Si se consideraran no
linealidades de orden superior, los resultados obtenidos seran parecidos.

Es evidente que estas no linealidades sern ms pronunciadas en algunos receptores que en otros y que
en principio no se trata de un problema del sistema, sino del receptor. No obstante, al disear el
sistema de televisin deben tenerse en cuenta todas las posibilidades para evitar, en lo posible, la
presencia de componentes indeseadas o en el caso en que sea imposible evitar su presencia, intentar
que su efecto sobre la calidad de la imagen sea lo menos perceptible posible.

De todas las componentes obtenidas en la salida de la no linealidad de segundo orden, la ms
perjudicial para el sistema de televisin es la que se obtiene como la diferencia entre la frecuencia
portadora del sonido y la de la croma, ya que su valor cae dentro del ancho de banda de la seal de
vdeo y por lo tanto podra hacerse visible en la pantalla.

Esta diferencia de frecuencias, si mantenemos las 30 imgenes por segundo que se utilizaban en el
precursor en blanco y negro del sistema NTSC, tomara el valor:

Hz MHz f f f
color audio dif
916875 525 30 5 , 227 5 . 4 (3.24)

Si expresamos esta frecuencia en funcin de la frecuencia de lnea del sistema obtenemos:

Lnea Lnea
Lnea
dif
dif
f f
f
f
f 2143 , 58 (3.25)

valor que en principio debera ser corregido si se desea evitar que esta interferencia sea visible en la
pantalla. Para ello, es necesario modificar ligeramente alguno de los parmetros del sistema de
televisin para conseguir que la interferencia sea lo menos molesta posible, es decir, que pueda
expresarse como un mltiplo impar de la mitad de la frecuencia de lnea. Teniendo en cuenta el
resultado de la ecuacin 3.25, el objetivo es que la diferencia entre la frecuencia de la portadora de
audio y la de color sea 58,5 veces la frecuencia de lnea.

Imponiendo esta condicin sobre la ecuacin 3.24 obtenemos:

V I V I audio dif
N f N f f f 5 , 58 5 , 227 (3.26)

donde f
I
representa la frecuencia de imagen y N
V
el nmero de lneas del sistema. De todos estos
parmetros, el nico que en principio puede ser modificado sin alterar la compatibilidad es la
frecuencia de imagen. Recurdese que la frecuencia de imagen se haba elegido de 30 Hz para poder
usar la red elctrica como seal patrn para sincronizar las distintas cmaras de un estudio de
televisin en los albores de la televisin. En el momento en que se defini la televisin en color, este
procedimiento de sincronismo ya se haba abandonado completamente. Adems, los receptores
regeneran siempre la seal de barrido vertical a partir de los sincronismos de campo, por lo que la
frecuencia de imagen puede modificarse sin que afecte el correcto sincronismo con la seal recibida.

El valor de la nueva frecuencia de imagen es:

s imgenes
N
f
f
V
audio
I
/ 97 , 29
) 5 , 227 5 , 58 (

+
(3.27)

valor que evidentemente no supone ninguna variacin observable por el espectador.

Con esta nueva frecuencia de imagen se modifican alguno de los parmetros bsicos del sistema de
televisin. La nueva frecuencia y periodo de lnea toman los valores:

s T Hz N f f
Lnea V I Lnea
556 , 63 ; 26 , 15734 (3.28)

y la frecuencia de la portadora de color ser:

MHz f f
Lnea color
579545 , 3 5 , 227 (3.29)

Aunque el sistema NTSC admite slo una desviacin de t 10 Hz sobre esta frecuencia es habitual en
la literatura referirse a este valor como 3,58 MHz, sin dar cuenta de todos los decimales. Tambin, al
referirnos a la frecuencia de imagen o de campo, es habitual seguir utilizando, por simplicidad, los
guarismos de 30 y 60 Hz.

Es fundamental que independientemente de la precisin con la que se consiga obtener la frecuencia
portadora de la informacin de color, su valor coincida exactamente con el valor de la frecuencia de
lnea multiplicada por el factor 227,5. Para ello, en el transmisor se utiliza un nico generador, del que
se obtienen, por divisin de frecuencias, las dos seales. El esquema utilizado habitualmente se
representa en la figura 3.17, donde slo se indica cmo obtener una seal con una frecuencia doble a
la de lnea (que indica la cadencia de los sincronismos en las primeras lneas de la parte de borrado de
campo). El procedimiento esbozado consiste en dividir la portadora de color por 5713=455, con lo
que obtenemos una seal cuya frecuencia es la mitad que la terica frecuencia de lnea. Ntese que no
es posible obtener directamente la frecuencia de lnea, ya que slo pueden implementarse divisores de
frecuencia en factores enteros. Esta seal se introduce a un comparador de fase cuya salida acta sobre
un VCO. La seal de salida de este oscilador se divide por un factor 4 y se introduce en el comparador
de fase. Cuando el circuito se estabiliza, la frecuencia de las seales en la entrada del comparador de
fase ser la misma por lo que la salida del VCO tendr una frecuencia doble a la de lnea. A partir de
esta seal, es posible obtener el resto de seales que habrn de incorporarse como sincronismos a la
seal de vdeo. As, la propia frecuencia de lnea se obtendra dividiendo por 2 la frecuencia de esta
seal y la frecuencia de campo dividindola por 525=3755.

Fig. 3.17 Obtencin de la frecuencia de lnea a partir de la portadora de color en el transmisor

3.3.4 Demodulacin de las componentes I y Q: caso ideal
En este y los siguientes apartados presentaremos los sistemas y principios utilizados para la
recuperacin de las seales diferencia de color I y Q a partir de la seal de croma. Estos
demoduladores constituyen la parte esencial de la decodificacin de la informacin en el receptor, por
lo que comprender su principio de funcionamiento es crucial tanto para tener una visin general del
sistema como para entender las distintas componentes que conforman la seal de un sistema de color
compatible.

En una primera aproximacin al problema supondremos que la seal de croma se corresponde
exactamente con la ecuacin 3.2, es decir, por el momento ignoraremos que la parte alta del espectro
de la seal I es filtrada y que esta componente se transmite con banda lateral superior vestigial. Una
vez desarrollada esta aproximacin al problema, se tratar el caso real, comprobando que puede
aplicarse el mismo esquema de demodulacin. Adems, veremos que una correcta demodulacin de
las seales exige que el receptor disponga de un oscilador en fase con la portadora de color utilizada
en el transmisor. Esto exigir transmitir una referencia de frecuencia y fase de la portadora de color
que se incorporar a la seal de vdeo y cuyos detalles expondremos tambin en este apartado. Los
principios de demodulacin de las seales diferencia de color expuestos en esta y las siguientes
secciones son comunes tanto para el decodificador de NTSC como en el de PAL. Por ello, los
resultados obtenidos se utilizarn en la discusin del PAL sin necesidad de justificarlos.

Div
5
Div
7
Div
13
Comp.
Fase
V.C.O.
Div
4
Oscilador
subportadora
color
2 f
Lnea
Div
5
Div
7
Div
13
Comp.
Fase
V.C.O.
Div
4
Oscilador
subportadora
color
2 f
Lnea
Considrese el esquema de la figura 3.18 que se aplica sobre la seal de croma del sistema NTSC,
cuya expresin repetimos aqu por claridad:

) 33 2 cos( ) ( ' ) 33 2 ( ) ( ' ) ( + + + t f t I t f sen t Q t croma
c c NTSC
(3.30)

donde usamos el smbolo f
c
para referirnos de forma abreviada a la frecuencia portadora de la
informacin de croma en el NTSC. Los dos canales del demodulador son parecidos. La seal de
croma se mezcla con portadoras generadas en el propio receptor, que, para un correcto funcionamiento
del sistema, debern estar en fase con la portadora de la seal recibida, y el resultado se pasa a travs
de filtros adaptados al ancho de banda de las seales diferencia de color.

Fig. 3.18 Esquema bsico de un demodulador de croma

El resultado del producto de la seal de croma por la portadora en coseno de la rama superior del
demodulador ser:

) 66 4 cos( ) ( ' ) 66 4 ( ) ( ' ) ( '
) 33 2 cos( ) (
2
1
2
1
2
1
+ + + +
+
t f t I t f sen t Q t I
t f t croma
c c
c NTSC
(3.31)

lo que establece que la seal I(t) ha sido trasladada nuevamente al origen, por lo que podremos
recuperarla despus del filtrado paso bajo, adaptado al ancho de banda de esta seal, que se indica en
la figura. Ntese que el resto de componentes que aparecen en la salida del mezclador estn centradas
a una frecuencia doble de la portadora de vdeo, por lo que sern eliminadas por el filtro paso bajo.

Anlogamente, el resultado del producto de la seal de croma por la portadora en seno da como
resultado:

) 66 4 ( ) ( ' ) 66 4 cos( ) ( ' ) ( '
) 33 2 ( * ) (
2
1
2
1
2
1
+ + +
+
t f sen t I t f t Q t Q
t f sen t croma
c c
c NTSC
(3.32)

Filtro I
LPF
1,3 MHz
Filtro Q
LPF
0,5 MHz
cos(2 f t+33)
sin(2 f t+33)
croma
NTSC
(t)
(1/2) I(t)
(1/2) Q(t)
Filtro I
LPF
1,3 MHz
Filtro Q
LPF
0,5 MHz
cos(2 f t+33)
sin(2 f t+33)
croma
NTSC
(t)
(1/2) I(t)
(1/2) Q(t)
que tambin indica que en la salida de la rama inferior del demodulador dispondremos de la seal
diferencia de color Q(t). As pues, en este caso ideal el demodulador recupera perfectamente las dos
seales diferencia de color.

3.3.5 Demodulacin con errores de fase
Consideremos ahora el efecto de un error de fase en las seales generadas en el propio receptor.
Para el caso de la componente en fase obtenemos:

) 66 4 cos( ) ( ' ) 66 4 ( ) ( '
) ( ' cos ) ( '
) 33 2 cos( * ) (
2
1
2
1
2
1
2
1
+ + + + + +
+
+ +
t f t I t f sen t Q
sen t Q t I
t f t croma
c c
c NTSC
(3.33)

De acuerdo con este resultado, existen dos componentes que siguen mantenindose centradas en una
frecuencia doble a la de portadora y que por lo tanto sern rechazadas por el filtro paso bajo. Sin
embargo, en la regin de baja frecuencia aparece tanto la componente I(t) (la deseada) como la Q(t)
(interferencia), por lo que ambas seales pasarn a travs del filtro. Se dice en este caso que existe
cruce de color en el decodificador, ya que la seal que en principio deba corresponder nicamente a
la componente I(t) contiene parte de informacin de la componente en cuadratura. Ntese que estas
seales estn ponderadas por el coseno y el seno del error de fase, lo que indica que el cruce de color
es tanto ms importante cunto mayor sea este error.

El resultado obtenido para el canal en cuadratura es parecido:

) 66 4 ( ) ( ' ) 66 4 cos( ) ( '
) ( ' cos ) ( '
) 33 2 ( ) (
2
1
2
1
2
1
2
1
+ + + + + +
+ +
+ +
t f sen t I t f t Q
sen t I t Q
t f sen t croma
c c
c NTSC
(3.34)

Ahora bien, slo una fraccin de la energa, correspondiente a la regin de baja frecuencia de la seal
I(t), pasar a travs del filtro paso bajo, ya que el ancho de banda de esta componente es superior a la
del filtro. No obstante, sigue apareciendo cruce entre las dos componentes de color.

La degradacin de la seal debida a estos errores de fase es muy grave, ya que podra modificar todos
los matices de color de la escena. Por ello, debe controlarse con sumo cuidado que los generadores de
las seales utilizadas para la demodulacin estn perfectamente sincronizados con la portadora de
croma utilizada en el transmisor. Con este objetivo, se decidi incorporar una pequea rplica de la
portadora de color utilizada en el transmisor para que el receptor pudiera usarla como referencia y
sincronizarse perfectamente con ella. Esta rplica de la portadora de color se denomina salva y se
transmite en cada lnea de la seal, ubicndose en una parte libre del prtico posterior del sincronismo
de lnea.

3.3.6 Insercin de la salva de la portadora de color
La seal de salva se introduce en la parte correspondiente al prtico posterior de la seal de televisin
y se utiliza para informar al receptor sobre la frecuencia exacta y la fase que se est utilizando en el
transmisor como portadora de la informacin de color. Tal y como se indica en la figura 3.19, est
situada a una distancia de 5,3 s del impulso anterior del sincronismo de lnea y tiene una duracin
aproximada de 2,5 s, durante los que se transmiten aproximadamente unos 9 ciclos de la portadora
de color. La amplitud es de un 40 % respecto al nivel de blanco, que, si ste se normaliza a 0.7 voltios,
corresponder a una tensin de unos 0.28 voltios. Este nivel de amplitud es aproximadamente igual al
nivel del impulso de sincronismo y se utiliza en el receptor para ajustar los sistemas de control
automtico de ganancia. Con ello es posible obtener un correcto equilibrado de las ganancias del canal
de luminancia y del de croma. Las tolerancias respecto a estos valores tericos se muestran en la
misma figura y son, como puede comprobarse, bastante elevados.

La introduccin de la salva se realiza mediante puertas de transmisin que se abren durante el
intervalo de tiempo correspondiente y permiten introducir una copia, con la amplitud y fase adecuada,
de la seal del oscilador de croma en la seal de vdeo. Veremos algunos esquemas a nivel de
diagramas de bloque cuando analicemos el codificador NTSC.

La parte de la seal de vdeo en la que se introduce la salva de color corresponde a la parte de lnea no
activa y por lo tanto es una regin en la que no se transmite informacin ni de luminancia ni de color y
durante la que los circuitos de barrido horizontal estn realizando el retorno hacia el extremo
izquierdo de la pantalla. La mayora de receptores actuales inhiben las seales que se aplican al tubo
de imagen durante este intervalo de tiempo para garantizar que el retorno del haz se realiza sin activar
ningn fsforo de la pantalla y que por lo tanto es invisible para el espectador.

Fig. 3.19 Salva de color para recuperar la informacin de fase de la portadora

5.3 s
+0.41
-0.32
2.51 s
+-0.28 s
9+/-1ciclos
0.38 s
min
4/10
nivel
blanco
Salva de color
Impulso
sincronismo
Prtico
anterior
Prtico
posterior
5.3 s
+0.41
-0.32
2.51 s
+-0.28 s
9+/-1ciclos
0.38 s
min
4/10
nivel
blanco
Salva de color
Impulso
sincronismo
Prtico
anterior
Prtico
posterior
No obstante, en la seal de televisin est prevista cualquier eventualidad y, como ya debe parecer
obvio a estas alturas, tambin se contempl la posibilidad de que algunos fabricantes no inhibieran las
seales que se aplican al tubo de imagen durante el tiempo de lnea no activa. En este supuesto, como
los demoduladores continan operando, descodificarn la salva y obtendrn las seales diferencia de
color asociadas al nivel de amplitud y la fase de esta componente. Si estas seales diferencia de color
se aplican junto con la luminancia a la matriz de decodificacin RGB, obtendremos las seales que
posteriormente se aplicarn al tubo de imagen y que, dependiendo de la amplitud y la fase de la seal
de salva, podrn ser ms o menos visibles.

Hemos visto que la amplitud de la seal de salva se ha elegido del mismo valor que los impulsos de
sincronismo para poder equilibrar fcilmente las ganancias de los canales de luminancia y de croma.
Por tanto, el nico parmetro que puede ser elegido libremente es el desfasaje relativo entre la
portadora de color y la seal de salva. Este desfasaje puede tomar el valor que se considere ms
oportuno, siempre que tanto el transmisor como el receptor se pongan de acuerdo en cul es el valor
con el que se va a transmitir. La situacin se ilustra en la figura 3.20, donde se muestra que si el
desfasaje es conocido, el receptor siempre puede regenerar la salva con la misma fase que en el
transmisor.

Fig. 3.20 Desfase de la salva de color respecto a la portadora

Para determinar la fase ms adecuada deberamos calcular las seales RGB que se obtendran si se
demodulara la seal de salva. El procedimiento para realizar este clculo es relativamente sencillo. En
efecto, supongamos que la salva tiene una amplitud genrica A y un desfasaje respecto a la seal
patrn cos(2f
c
t+33). Las seales que obtendremos en la salida del demodulador de color sern:

( )
( ) ); (
2
) 33 2 ( ) 33 2 cos( ) ( '
); cos(
2
) 33 2 cos( ) 33 2 cos( ) ( '
5 . 0
3 . 1
+ + +
+ + +
sen
A
t f sen t f A LPF t Q
A
t f t f A LPF t I
c c MHz
c c MHz
(3.35)

Evidentemente, la luminancia asociada a la seal de salva ser cero, ya que la seal est situada sobre
el prtico posterior, que tiene un nivel de negro. Si introducimos los valores de Y(t), I(t) y Q(t) en la
matriz de decodificacin R,G,B (es decir, la relacin inversa a la ecuacin 3.10), obtendremos:

Desfasaje
Portadora de color
Seal de
salva
desfasada respecto
a la portadora
TRANSMISOR
Desfasaje
360
Salva en
fase con la
portadora RECEPTOR
CANAL
Desfasaje
Portadora de color
Seal de
salva
desfasada respecto
a la portadora
TRANSMISOR
Desfasaje
360
Salva en
fase con la
portadora RECEPTOR
CANAL

1
1
1
]
1

+

1
1
1
]
1

1
1
1
]
1

1
1
1
]
1

sen
sen
sen
A
sen B
G
R
A
A
851 . 0 cos 552 . 0
323 . 0 cos 136 . 0
310 . 0 cos 478 . 0
cos
0
312 . 0 523 . 0 211 . 0
322 . 0 275 . 0 596 . 0
114 . 0 587 . 0 299 . 0
'
'
'
2
2
1
(3.36)

resultado que muestra la dependencia de las componentes RGB respecto a la amplitud y la fase de la
seal de salva. El objetivo sera elegir un valor de fase cuyas componentes RGB fueran lo menos
visibles posible. Como la amplitud est prefijada, bastar con ver los valores que toman las tres
variables en funcin del ngulo de desfase.

En la figura 3.21 se han representado las tres componentes R,G,B para valores de la variable entre 0
y 2 tomando la amplitud A como unitaria. Los valores negativos significan que la seal que se
aplicar al tubo de imagen no producir ninguna energa en el haz resultante, por lo que equivalen a
tener una componente de color nula. El ngulo de desfasaje que finalmente se eligi fue el de 147,
para el cual slo la componente G es positiva. El valor de intensidad del haz G asociado a la seal de
salva se sita sobre el 16% del valor mximo que puede tomar esta seal. La eleccin del valor 147
se debe a un doble motivo. Por una parte se trata de un ngulo en el que dos de las componentes se
anulan y la otra mantiene un valor reducido, pero, adems, es un ngulo muy simple de generar, si se
considera que, sumado a los 33 de desfase de la portadora en coseno da un total de 180, que se podr
implementar con una simple inversin de signo. Adicionalmente, este ngulo de desfasaje coincide
con la inversin de la portadora de la seal diferencia de color U, lo que, como veremos, se utiliza en
algunos receptores para obtener directamente las componentes U y V a partir de la seal de croma del
sistema NTSC.

En los apartados dedicados al codificador y decodificador NTSC veremos algunas de las alternativas
ms usadas para la insercin de la salva en la seal de vdeo y para la sincronizacin del oscilador de
color del receptor basndose en la informacin proporcionada por esta seal.

Fig. 3.21 Componentes RGB en funcin de la fase de la salva
7 6 5 4 3 2 1 0
1
0.5
0
-0.5
-1
R
G
B
2,56 rads
147
rads
7 6 5 4 3 2 1 0
1
0.5
0
-0.5
-1
R
G
B
2,56 rads
147
rads
3.3.7 Demodulacin de las componentes de color: banda lateral superior vestigial
Hasta ahora hemos analizado el esquema del demodulador de las seales diferencia de color en el
supuesto de que las dos componentes se transmitieran en doble banda lateral, comprobando la
necesidad de disponer de una referencia de la portadora de color para poder obtener un correcto
sincronismo con la portadora de color. En este apartado comprobaremos que el mismo esquema de
demodulacin puede aplicarse al sistema real, en el que la banda superior de la seal I ha sido
recortada a 4.2 MHz para acomodar la seal de vdeo dentro de los lmites establecidos por la
normativa. El anlisis demodulador con esta hiptesis requiere la introduccin de la transformada de
Hilbert para analizar los efectos que produce la supresin de una de las bandas superiores. El lector
puede omitir todo este apartado sin prdida de continuidad con el resto del texto. El anlisis permitir
comprobar que el hecho de recortar la banda superior de la seal I introduce una atenuacin de 3 dBs
en la parte de alta frecuencia de esta seal y puede provocar, si los filtros del canal Q no estn
perfectamente ajustados, la aparicin de un pequeo cruce de componentes de color.

Fig. 3.22 Descomposicin de la seal I'(t) en componentes de baja y alta frecuencia

El primer objetivo, para poder evaluar el tratamiento de seal que realiza el demodulador, es obtener
una expresin analtica de la seal I(t)cos(2f
c
t+33) filtrada. Para ello es conveniente descomponer
la seal en banda base I(t) en dos partes de alta y baja frecuencia, tal y como se esboza en la figura
3.22. De esta forma I(t) puede expresarse como la suma de estas dos componentes

) ( ' ) ( ' ) ( ' t I t I t I
H L
+ (3.37)

Los anchos de banda de estas dos componentes han sido ajustados para que, al modular la seal y
eliminar la banda superior de I
H
(t), obtengamos la versin en banda lateral superior vestigial que se
utiliza en el NTSC. El resultado final al que queremos llegar se representa en la figura 3.23, donde
suponemos que los filtros utilizados para recortar la banda superior son ideales. Los factores de
Espectro I(t)
Espectro I
L
(t)
Espectro I
H
(t)
0 0,6 MHz 1,3 MHz
0 0,6 MHz
0 0,6 MHz 1,3 MHz
f
f
f
Espectro I(t)
Espectro I
L
(t)
Espectro I
H
(t)
0 0,6 MHz 1,3 MHz
0 0,6 MHz
0 0,6 MHz 1,3 MHz
f
f
f
amplitud exp(tj(/180)33) existentes en cada una de las bandas se deben a la modulacin por el
coseno. Tngase en cuenta que la transformada de Fourier de I(t)cos(2f
c
t+33) viene dada por:

{ }
'
+ + +

33
180
33
180
) ( ' ) ( '
2
1
) 33 2 cos( ) ( '
j
c
j
c c
e f f I e f f I t f t I F (3.38)

donde I(f) es la transformada de Fourier de la seal I(t) en banda base. Sobre este espectro se realiza
el filtrado de la banda lateral que supera los 4,2 MHz.

Fig. 3.23 Transformada de Fourier de la seal I'(t) modulada y filtrada

Para obtener la expresin matemtica en el dominio temporal de la seal modulada y filtrada, es
necesario recurrir a la transformada de Hilbert de la componente I
H
(t). Esta transformada se define,
en el dominio frecuencial, como el resultado de filtrar la seal mediante un filtro H
Hilbert
(f) cuya
respuesta en frecuencia se representa en la figura 3.24 y que responde a la expresin:

'
<
>
0
0
) (
f si j
f si j
f H
Hilbert
(3.39)

Fig. 3.24 Respuesta en frecuencia de un transformador de Hilbert

El resultado pasar la seal I
H
(t) a travs de este filtro puede expresarse como:
3,58 MHz 4,2 MHz 1,3 MHz
1,2 MHz 0,7 MHz 0,7 MHz
0
1,9 MHz
Banda
eliminada
Banda
eliminada
f
(1/2) I(f-f
c
) exp(j 33/180)
(1/2) I(f+f
c
) exp(-j 33/180)
3,58 MHz 4,2 MHz 1,3 MHz
1,2 MHz 0,7 MHz 0,7 MHz
0
1,9 MHz
Banda
eliminada
Banda
eliminada
f
(1/2) I(f-f
c
) exp(j 33/180)
(1/2) I(f+f
c
) exp(-j 33/180)
f
H
hilbert
(f)
j
-j
f
H
hilbert
(f)
j
-j

( ) ) ( ) ( ) (
1
f H f I F t I
Hilbert H H

(3.40)

donde F
-1
representa la transformada inversa de Fourier e I
H
(f) la transformada de la componente I
H
(t).

Alternativamente, la transformada de Hilbert
H
(t) puede expresarse en el dominio temporal como la
convolucin entre la seal I
H
(t) con un sistema cuya respuesta impulsional es 1/(t). As:

,
_
d
t
I
t
t I t I
H H H
) (
1
) ( '
1
) ( ' ) ( '
(3.41)

Esta expresin deja claro que la transformada de Hilbert de una seal real ser tambin una seal real,
ya que todas las funciones que aparecen dentro del smbolo integral son reales. La transformada de
Hilbert de una seal slo puede ser implementada de forma aproximada, ya que el tipo de filtrado
involucrado es ideal y por lo tanto irrealizable. Sin embargo, en nuestro caso nicamente nos interesa
la representacin matemtica de la seal y no los valores que toma.

Fig. 3.25 Obtencin de las bandas superiores de la seal en funcin de la transformada de Hilbert

En la figura 3.25 se representan las transformadas de Fourier de las seales I
H
(t),
H
(t) y de las
combinaciones (I
H
(t)+j
H
(t)) y (I
H
(t)-j
H
(t)), donde j representa el nmero complejo j
2
=-1. Los
espectros de estas dos ltimas seales son particularmente interesantes, ya que, como puede
Espectro I
H
(t)
0 0,6 MHz 1,3 MHz
f
A A
Espectro
H
(t)
0
0,6 MHz 1,3 MHz
f
A/j
jA
Espectro (1/2)( I
H
(t) + j
H
(t))
0 0,6 MHz 1,3 MHz
f
A
0 0,6 MHz 1,3 MHz
f
A Espectro (1/2)( I
H
(t) - j
H
(t))
Espectro I
H
(t)
0 0,6 MHz 1,3 MHz
f
A A
Espectro
H
(t)
0
0,6 MHz 1,3 MHz
f
A/j
jA
Espectro (1/2)( I
H
(t) + j
H
(t))
0 0,6 MHz 1,3 MHz
f
A
0 0,6 MHz 1,3 MHz
f
A Espectro (1/2)( I
H
(t) - j
H
(t))
comprobarse grficamente, se corresponden con las partes de la banda lateral de la seal I(t) que
sern eliminadas durante el posterior filtrado de la seal modulada. Restando estas seales de I(t)
podemos construir las funciones L
1
(t) y L
2
(t):

( )
( ); ) (
) ( '
2
1
) ( ' ) (
; ) (
) ( '
2
1
) ( ' ) (
2
1
t I j t I t I t L
t I j t I t I t L
H H
H H

+
(3.42)
cuyas transformadas de Fourier se representan en la figura 3.26 y no son ms que la versin en banda
base de las partes positiva y negativa del espectro representado en la figura 3.23. Por lo tanto, para
obtener la expresin matemtica de la versin modulada y filtrada de la componente de color I(t),
bastar con desplazar el espectro de L
1
(t) a la frecuencia f
c
y el de L
2
(t) a la frecuencia f
c
, escalando
las amplitudes de ambos adecuadamente. Si denominamos L(t) a la componente I(t) una vez
modulada y filtrada, obtenemos la siguiente relacin:

,
_

+
,
_

+ 33
180
2 exp
2
1
) ( 33
180
2 exp
2
1
) ( ) (
2 1
t f j t L t f j t L t L
c c
(3.43)

Fig. 3.26 Versiones en banda base de la parte positiva y negativa del espectro de la seal

Si sustituimos los valores de L
1
(t) y L
2
(t) en funcin de I(t), I
H
(t) y la transformada de Hilbert de esta
ltima, obtenemos

( ) ) 33 2 ( ) ( '
) 33 2 cos( ) ( ' ) ( ' ) (

2
1
2
1
+ + + t f sen t I t f t I t I t L
c H c H
(3.44)

de modo que la seal de croma completa que se utiliza en el sistema NTSC podr expresarse como la
suma de la componente en fase obtenida en la ecuacin anterior ms la componente en cuadratura:
Espectro L
1
(t)
0 0,6 MHz
f
1,3 MHz
Espectro L
2
(t)
0 0,6 MHz
f
1,3 MHz
Espectro L
1
(t)
0 0,6 MHz
f
1,3 MHz
Espectro L
2
(t)
0 0,6 MHz
f
1,3 MHz

( )
) 33 2 ( ) ( ' ) 33 2 ( ) ( '
) 33 2 cos( ) ( ' ) ( ' ) (

2
1
2
1
+ + + +
+ +
t f sen t Q t f sen t I
t f t I t I t croma
c c H
c H NTSC
(3.45)

Si multiplicamos esta seal por la componente en fase de la parte superior del demodulador de color
obtendremos:
( ) ( )
( ) ) 66 4 cos( ) ( ' ) ( '
) 66 4 ( ) ( '
) ( ' ) ( ' ) ( '

) 33 2 cos( ) ( croma
2
1
2
1
2
1
2
1
2
1
2
1
+ +
+ + + +
+
t f t I t I
t f sen t I t Q t I t I
t f t
c H
c H H
c NTSC
(3.46)

Finalmente, la seal en la salida del filtro paso bajo ser:

( ) ( ) ) ( ' ) ( ' ) ( ' ) ( '
2
1
2
1
2
1
2
1
t I t I t I t I
H L H
+ (3.47)

Es decir, el hecho de filtrar la banda lateral superior de la componente I(t) introduce una atenuacin
en las componentes de alta frecuencia de la versin de I(t) que recuperamos en el decodificador.
Evidentemente, esta atenuacin es conocida a priori, por lo que siempre puede corregirse en el propio
receptor amplificando la regin del espectro que est atenuada. En la figura 3.27 se representa
aproximadamente el espectro de la seal demodulada y se sugiere la forma que debera tener el filtro
paso bajo del decodificador para ecualizarla completamente. En la prctica, sin embargo, los
receptores que decodifican las seales I(t) y Q(t) no suelen utilizar esta compensacin de frecuencia,
aplicando directamente la seal de la ecuacin 3.47 a la matriz de decodificacin RGB. Con ello, se
produce un pequeo cambio sobre el color real en estas componentes de alta frecuencia. La variacin
es poco perceptible, ya que, al tratarse de componentes de alta frecuencia, suelen coincidir con los
contornos de la imagen, donde el cambio de matiz es mucho menos importante que el cambio en la
seal de luminancia. Las regiones uniformes corresponden a componentes de baja frecuencia en las
que el color quedar correctamente decodificado.

Fig. 3.27 Espectro de la componente en fase y filtro ecualizador
Espectro componente en fase decodificada
0 0,6 MHz
f
1,3 MHz
I
L
(f)
(1/2) I
H
(f) (1/2) I
H
(f)
Filtro
ecualizador
Espectro componente en fase decodificada
0 0,6 MHz
f
1,3 MHz
I
L
(f)
(1/2) I
H
(f) (1/2) I
H
(f)
Filtro
ecualizador

Por otra parte, el resultado que obtenemos al multiplicar la seal de croma por la componente en
cuadratura es:

( ) ( )
( ) ) 66 4 ( ) ( ' ) ( '
) 66 4 cos( ) ( '
) ( ' ) (
) ( '
) 33 2 ( ) (
2
1
2
1
2
1
2
1
2
1
2
1
+ +
+ + + +
+
t f sen t I t I
t f t I t Q t I t Q
t f sen t croma
c H
c H H
c NTSC
(3.48)

En la parte de banda base recuperamos la seal Q(t) ms la transformada de Hilbert de I
H
(t). No
obstante, esta ltima seal es la parte de alta frecuencia de la seal I(t) (componentes superiores a 0.6
MHz), por lo que ser eliminada por el filtro paso bajo del decodificador de la componente Q(t). As
pues, este filtro eliminar la presencia de componentes interferentes debidas al filtrado de la banda
superior de I(t) en el canal en cuadratura. Sin embargo, debe tenerse en cuenta que, en un caso real, si
la banda de transicin del filtro no es suficientemente abrupta, pueden aparecer componentes de la
seal
H
(t) en el canal Q(t), deteriorando parte de la informacin de color. Este problema se conoce
con el nombre de cruce de color (cross-color) ya que su efecto es la aparicin, en el canal en
cuadratura, de una pequea interferencia altamente correlada con la componente en fase.

3.3.8 Demodulacin directa de las componentes U y V
La demodulacin de las seales diferencia de color sobre los ejes I(t) y Q(t) que se ha descrito en el
apartado anterior slo se utiliz en los primeros receptores NTSC. La ventaja de este tipo de
demodulacin es que permite recuperar la seal I(t) con el mismo ancho de banda con que ha sido
transmitida y que el cruce entre las dos componentes de color es prcticamente nulo. Sin embargo, el
problema de este sistema de demodulacin es que los filtros de las componentes I(t) y Q(t) tienen
anchos de banda muy distintos y, en consecuencia, los retardos que se introducen en las dos seales,
son tambin muy diferentes. Eliminar esta descompensacin de los dos canales requiere introducir una
unidad de retardo sobre la seal I(t) para sincronizarla con la seal Q(t), lo que, juntamente con la
unidad de retardo, que tambin debe aplicarse al canal de luminancia, encarece y complica
notablemente el diseo del receptor. Adems la matriz de decodificacin de las componentes R,G y
B a partir de las seales Y, I y Q es algo ms compleja que la matriz asociada a las componentes
Y,U y V.

Por todo ello, la mayora de los fabricantes prefieren realizar una demodulacin directa de las seales
sobre los ejes U y V. Este tipo de demodulacin supone una reduccin del ancho de banda global
con el que se recuperan las seales diferencia de color. No obstante, la simplificacin y reduccin de
costes en el receptor justifican esta prdida de resolucin en la seal de croma.

En la figura 3.28 se ha representado el diagrama de bloques de un demodulador de las componentes
U(t) y V(t), observndose que la diferencia ms notable respecto al demodulador convencional es
que las seales que se mezclan con la croma estn ahora desfasadas 33 respecto a la portadora de
color. Este desfase entre los osciladores del receptor y la portadora de color introduce un giro sobre
los ejes de demodulacin de 33 (en el sentido horario), por lo que las seales que recuperaremos son
directamente las componentes U(t) y V(t).

El anlisis del caso ideal en el que no se considera el filtrado de la banda superior de la componente
I(t) resulta trivial. En efecto, la seal obtenida despus del mezclador en la rama superior del
demodulador ser:

) 33 4 cos( ) ( ' ) 33 4 ( ) ( '
) 33 ( ) ( ' ) 33 cos( ) ( '
) 2 cos( ) (
2
1
2
1
2
1
2
1
+ + + +
+ +

t f t I t f sen t Q
sen t Q t I
t f t croma
c c
c NTSC
(3.49)

donde las componentes en banda base se corresponden, de acuerdo con las ecuaciones 3.13 y 3.14,
con la componente V(t). Debe tenerse en cuenta, como ya se ha observado anteriormente, que esta
relacin slo es estrictamente cierta cuando la escena original contiene todas las componentes de la
seal Q(t) dentro del ancho de banda de transmisin. En caso contrario, al haber filtrado esta seal
diferencia de color, las componentes obtenidas no se correspondern directamente con la seal V(t),
aunque las diferencias de matices no sern apreciadas por el observador.

Fig. 3.28 Diagrama de bloques de un demodulador de componentes U' y V'

Anlogamente, podramos calcular la seal obtenida como resultado del producto de la croma por la
portadora en seno. La parte de baja frecuencia de este resultado se corresponde con una combinacin
de las seales I(t) y Q(t), que, siempre que apliquen las condiciones comentadas en el prrafo
anterior, coincide con la seal U(t).

El anlisis del demodulador, cuando se considera la seal de croma NTSC que incluye el modelo de la
seal I(t) en banda lateral superior vestigial, es algo ms complejo. En la rama superior del
demodulador, el producto entre la croma y la componente en coseno tiene las siguientes componentes:

) 33 4 cos( ) ( ' ) 33 4 ( ) (
) 33 4 cos( ) ( ' ) 33 4 ( ) ( '

) 33 cos( ) ( ' ) 33 ( ) ( '
) 33 ( ) ( ' ) 33 cos( ) ( '

) 2 cos( ) (
4
1
4
1
2
1
2
1
4
1
4
1
2
1
2
1
+ +
+ + + + +
+ + +

t f t I t f sen t I
t f t I t f sen t Q
t I sen t I sen t Q t I
t f t croma
c H c H
c c
H H
c NTSC
(3.50)
Filtro LPF
B MHz
Filtro LPF
B MHz
cos(2 f t)
sin(2 f t)
croma
NTSC
(t)
(1/2) V(t)
(1/2) U(t)
Filtro LPF
B MHz
Filtro LPF
B MHz
cos(2 f t)
sin(2 f t)
croma
NTSC
(t)
(1/2) V(t)
(1/2) U(t)

En la rama inferior, el resultado del producto entre la portadora en seno y la seal de croma es:

) 33 4 ( ) ( ' ) 33 4 cos( ) ( '
) 33 4 cos( ) ( ' ) 33 4 ( ) ( '

) 33 ( ) ( ' ) 33 cos( ) ( '
) 33 ( ) ( ' ) 33 cos( ) ( '

) 2 ( ) (
4
1
4
1
2
1
2
1
4
1
4
1
2
1
2
1
+ +
+ + +
+ + +

t f sen t I t f t I
t f t Q t f sen t I
sen t I t I sen t I t Q
t f sen t croma
c H c H
c c
H H
c NTSC
(3.51)
Si tenemos en cuenta que, para las dos seales, las componentes centradas al doble de la frecuencia
portadora sern eliminadas por el filtrado paso bajo, es evidente comprobar que las seales obtenidas
se corresponden con las del caso ideal ms unas componentes interferentes que dependen de I
H
(t) y
su transformada de Hilbert.

As, para la componente en fase, la seal no deseada viene dada por:

) 33 cos( ) ( ' ) 33 ( ) ( '
4
1
4
1
t I sen t I fase canal deseada no Componente
H H
(3.52)

mientras que para la componente en cuadratura es:

) 33 ( ) ( ' ) 33 cos( ) ( '
4
1
4
1
sen t I t I cuadratura canal deseada no Componente
H H
+ (3.53)

Como en ambos casos las interferencias dependen de la seal I
H
(t) o de su transformada de Hilbert,
pueden ser eliminadas siempre que los filtros paso bajo del demodulador tengan un ancho de banda
del orden de los 0,6 MHz. Ntese tambin que, como recuperamos las seales U(t) y V(t), los dos
filtros deben tener el mismo ancho de banda, por lo que ya no existen diferencias en el tiempo de
retardo que sufre cada uno de los canales.

Evidentemente, la reduccin del ancho de banda de las dos seales diferencia de color a 0,6 MHz
afecta a la resolucin de la seal de color, que queda considerablemente reducida. La solucin
adoptada en los receptores reales consiste en utilizar filtros paso bajo con un ancho de banda algo
superior a los tericos 0,6 MHz, intentando buscar una solucin de compromiso entre la prdida de
resolucin en la informacin de croma y el cruce de componentes de color y nivel de las
interferencias. El ancho de banda tpico para estos filtros suele situarse en torno a los 0.9 MHz.

3.3.9 Diagrama de bloques de un codificador NTSC
El objeto de este apartado es dar una visin general del esquema de un codificador NTSC,
combinando los distintos elementos que constituyen la seal y que ya hemos presentado en secciones
previas. El diagrama de bloques genrico del codificador se ha representado en la figura 3.29. La parte
correspondiente al tratamiento de las seales R,G,B procedentes de la cmara hasta la obtencin de las
componentes I(t) y Q(t) en banda base ya ha sido presentada anteriormente y se corresponde
directamente con el esquema de la figura 3.3. Cabe remarcar que aunque hemos indicado que en el
receptor suele realizarse la demodulacin directa de las seales U(t) y V(t) con objeto de reducir el
nmero de unidades de retardo que deben aplicarse a las seales de luminancia y diferencia de color,
en el codificador, por la propia definicin del sistema NTSC, deben mantenerse las dos unidades de
retardo para garantizar que todas estas componentes estn sincronizadas. Tngase en cuenta que el
coste global de un equipo transmisor es muy superior al de un receptor, por lo que este aspecto tiene
una repercusin prcticamente nula sobre el sistema.

En este diagrama de bloques se supone que la seal que se genera en el bloque de subportadora de
color es directamente la componente en fase cos(2f
c
t+33), de modo que esta seal se multiplica
directamente por la seal I(t) en banda base. Para obtener la versin en cuadratura es necesario
retardar la subportadora un ngulo /2. En la figura se utiliza un signo negativo para indicar
explcitamente que se corresponde con un retardo y no con un adelanto de la fase.

Fig. 3.29 Diagrama de bloques de un codificador NTSC

La seal de salva puede obtenerse mediante un retardo de 303 sobre la misma subportadora. Tngase
en cuenta que la salva debe tener un desfase de 180 respecto al eje correspondiente a la seal U(t). El
desfase de 303 se obtiene como consecuencia de sumar los 90 grados de desfase entre la portadora
en coseno y seno, los 33 debidos al giro de las componentes I(t) y Q(t) respecto a las componentes
U(t) y V(t), ms los 180 correspondientes a la inversin de la fase de la componente V. En algunos
textos suele aparecer un adelanto de la fase de 57 respecto a la portadora de la componente en fase o
un adelanto de 147 respecto a la componente en cuadratura. En este texto hemos preferido indicar los
desfases como negativos, debido a que en la practica slo pueden realizarse retardos, y no adelantos,
de seales.

La subportadora de color se utiliza como seal de referencia para la obtencin de los sincronismos.
Para ello se utiliza un circuito como el que hemos discutido en la figura 3.17, que obtiene una seal
con una frecuencia doble a la de lnea y que, evidentemente, est perfectamente sincronizada con la
portadora de color. Esta seal es la referencia de fase para determinar las posiciones de todos los
pulsos de sincronismo. As, los impulsos de pre-igualacin y post-igualacin deben generarse a la
misma cadencia que esta referencia, los pulsos de sincronismo de lnea tendrn una frecuencia mitad a
la de referencia, y los de sincronismo de campo tendrn una cadencia 525 veces menor, por lo que
Cmara
R
G
B
1 /
1 /
1 /
Matriz
RGB
a
YIQ
0,5
1,3
4,2
T2
T1
R
G
B
Y
I
Q
Ym
Im
If
Qf
Subportadora
color
Cos(2f t+33)
-/2
-303
Puerta
salva
Video
Compuesto
Generador
sincronismos
Cmara Cmara
R
G
B
1 /
1 /
1 /
Matriz
RGB
a
YIQ
0,5
1,3
4,2
T2
T1
R
G
B
Y
I
Q
Ym
Im
If
Qf
Subportadora
color
Cos(2f t+33)
-/2
-303
Puerta
salva
Video
Compuesto
Generador
sincronismos
bastar con dividir la frecuencia de la seal de referencia por 525 para obtener una seal que
proporcione la referencia de fase del sincronismo de campo. Una vez obtenidas las seales de
referencia para cada tipo de sincronismo, stas se utilizan para activar los circuitos de conformacin
de pulsos para cada tipo de sincronismo y se insertan a la seal de luminancia y croma tal y como se
indica en el diagrama de bloques. La salva de color se inserta a la seal de croma mediante una puerta
que est controlada por el propio generador de sincronismos y que slo se mantiene activa durante una
fraccin del tiempo correspondiente al prtico posterior del sincronismo de lnea.

A la seal de vdeo compuesto que se obtiene en la salida del codificador debe an incorporarse la
seal de audio y aplicarla a un modulador que adapte esta seal en banda base para su transmisin a
distancia.

El procedimiento utilizado para generar la salva en un codificador real no se corresponde con el que se
ha representado en la figura 3.29, ya que en la prctica resultara complejo ajustar un retardo a 303
con precisin suficiente. La filosofa que normalmente se utiliza es la de aprovechar la propia
estructura del modulador de croma mediante un esquema como el de la figura 3.30, de modo que el
generador de sincronismos controla cundo los mezcladores estn conectados a las seales diferencia
de color I(t) y Q(t) o a las constantes para la generacin de la salva de color. La estrategia de
conmutacin entre las dos posibles entradas al modulador de croma es idntica a la que se realizaba en
la puerta de salva.

Fig. 3.30 Diagrama de bloques del circuito de insercin de la salva de color

Los niveles A y B estn ajustados para que la seal obtenida en la salida del modulador de croma
tenga la amplitud y fase de la salva. Suponiendo que trabajamos con excursiones de seal
normalizadas a 1 voltio y que la amplitud de la salva es aproximadamente de 0,3 voltios, los valores
de A y B pueden calcularse resolviendo la siguiente ecuacin:

) 2 ( 3 . 0 ) 33 2 ( ) 33 2 cos( t f sen t f sen B t f A
c c c
+ + + (3.54)
Nivel
A
Nivel
B
Salva
Componente
I(t)
Componente
Q(t)
Puerta
de salva
Croma + Salva
- /2
Nivel
A
Nivel
B
Salva
Componente
I(t)
Componente
Q(t)
Puerta
de salva
Croma + Salva
- /2

Si desarrollamos las funciones trigonomtricas obtenemos:

( ) ( )
) 2 ( 3 . 0
) 2 ( 33 cos 33 ) 2 cos( 33 33 cos
t f sen
t f sen B sen A t f sen B A
c
c c

+
(3.55)

que resulta un sistema de ecuaciones cuya solucin viene dada por
2516 , 0 ; 1633 , 0 B A (3.56)

As pues, con estos niveles de continua en cada uno de los dos canales de diferencia de color
obtendremos la seal de salva directamente de los moduladores de croma. La conmutacin entre las
seales diferencia de color y los valores de continua para la salva permite tambin garantizar que la
seal de croma permanece inactiva mientras se transmiten las seales de sincronismo.

3.3.10 Diagrama de bloques del decodificador NTSC
En principio, el proceso de decodificacin de la seal sigue un proceso inverso al del codificador. En
ste, las componentes de luminancia, croma, sincronismos y salva de color se generan en mdulos
independientes y, finalmente, todas las componentes se superponen en la seal de vdeo compuesto. El
decodificador debe obtener las seales a aplicar al tubo de imagen, es decir, las componentes RGB y
las seales de deflexin del haz a partir de la seal de vdeo compuesto, por lo que es esencial separar
todas las componentes de la seal y mantener un correcto sincronismo entre ellas. En la figura 3.31 se
representa un posible diagrama de bloques de un decodificador NTSC genrico. Cabe decir que en la
prctica pueden encontrarse diversas variantes de este esquema, sobre todo en lo respecta a la
tecnologa utilizada en cada uno de los bloques. No obstante, los conceptos presentados pueden
considerarse de validez general para la mayora de receptores.

Fig. 3.31 Diagrama de bloques de un decodificador NTSC
Extraccin
sincronismos
Separacin
Y-Croma
Puerta
Salva
Regenerador
portadora
color
Amplificador
de croma
(Ganancia variable)
Retardo
3-400 ns
Contraste Brillo
Luminancia
Demodulador
croma
Matriz
Decodificador
Seal
Vdeo
Compuesto
Sincronismo Horizontal
Sincronismo Verticall
R
G
B
A
L

T
U
B
O

D
E

I
M
A
G
E
N
sin wt
cos wt
Control
Ganancia
Croma
Saturacin
color
Killer
Croma
Extraccin
sincronismos
Separacin
Y-Croma
Puerta
Salva
Regenerador
portadora
color
Amplificador
de croma
(Ganancia variable)
Retardo
3-400 ns
Contraste Brillo
Retardo
3-400 ns
Contraste Brillo
Luminancia
Demodulador
croma
Matriz
Decodificador
Seal
Vdeo
Compuesto
Sincronismo Horizontal
Sincronismo Verticall
R
G
B
A
L

T
U
B
O

D
E

I
M
A
G
E
N
sin wt
cos wt
Control
Ganancia
Croma
Saturacin
color
Killer
Croma
La separacin de los sincronismos se realiza determinando el nivel de negro de la seal recibida y
aislando los impulsos de sincronismo de la informacin de vdeo basndonos en la polaridad de la
seal. La deteccin de los sincronismos horizontales y verticales y la generacin de las seales de
barrido del haz requiere, como es obvio, un procedimiento anlogo al utilizado en el caso de los
receptores en blanco y negro. En los receptores de color, la deteccin de los sincronismos proporciona
una referencia sobre la posicin de la seal de salva. Esta seal se utiliza como referencia de fase en el
sistema regenerador de la portadora de color, cuyos detalles consideraremos ms adelante.

Las componentes de luminancia y croma se discriminan mediante filtrado y se procesan en canales
independientes. El ajuste de la ganancia del canal de luminancia y el nivel de continua permiten
ajustar respectivamente el contraste y el brillo general de la imagen. La seal de croma debe
amplificarse antes de ser aplicada al demodulador para equilibrar la ganancia con el canal de
luminancia. El control de la ganancia se realiza teniendo en cuenta el nivel de amplitud de la seal de
salva recibida y los valores de los controles de saturacin de color y contraste a los que el usuario
tenga ajustado su receptor. En este control de ganancia suele tenerse en cuenta el nivel de ruido con el
que se recibe la seal de croma. De este modo, cuando la amplitud de la salva decrece, se reduce
automticamente la saturacin de color en el monitor, consiguiendo que el ruido sea menos molesto
para el espectador. Tambin suele incorporarse un sistema de inhibicin del canal de croma,
denominado supresor de color (Killer), que desactiva la demodulacin de las componentes de color
cuando se detecta la ausencia de la salva debido a que la seal se transmite en blanco y negro (siempre
que el transmisor anule la salva de color en este tipo de transmisiones).

En el esquema de la figura 3.31 hemos supuesto que el receptor emplea una demodulacin directa de
las componentes U(t) y V(t) de modo que slo debe introducirse una clula de retardo de seal en el
canal de luminancia. El valor de este retardo depende, como ya hemos comentado, de los filtros del
demodulador y oscila entre los 3 y 400 ns. No obstante, la demodulacin de las componente U(t) y
V(t) o las originales I(t) y Q(t) slo afectar a la propia estructura del demodulador (que deber
demodular con la referencia de fase de 33 respecto a la salva e incorporar un retardo para el canal
I(t)) y a la matriz de decodificacin de las componentes R,G, B.

Una vez identificada la funcin de los distintos bloques que intervienen en el proceso de
decodificacin de la seal, es conveniente profundizar en los detalles de dos elementos que juegan un
papel fundamental en las caractersticas del receptor: el filtro de separacin de croma-luminancia y el
sistema de regeneracin de la portadora de color.

3.3.11 Separacin de las seales de luminancia y croma
Al seleccionar la frecuencia portadora de la seal de croma, se ha tenido en cuenta que la interferencia
que introduce en el canal de luminancia sea mnima. Hemos visto que para que el sistema siga
manteniendo la compatibilidad con los sistemas en blanco y negro es necesario imbricar
espectralmente la informacin de croma y la de luminancia. Sin embargo, aunque desde un punto de
vista terico siempre es posible separar las dos seales, es evidente que no parece trivial, ni por
supuesto econmico, el diseo de un sistema que recomponga las dos seales originales en el receptor,
eliminando cualquier tipo de cruce entre ellas.

Bsicamente coexisten dos filosofas para separar estas seales que se conocen con el nombre de filtro
muesca (notch filter) y filtro peine (comb filter). El uso de una u otra alternativa depende del coste y
calidad del receptor, utilizndose la primera para receptores normales y la segunda en receptores de
calidad. En los apartados siguientes examinamos los detalles de estas dos estrategias.

Filtro muesca (notch filter)

La idea de este tipo de filtrado de la seal de vdeo compuesto es utilizar un filtro paso banda,
centrado en la frecuencia de 3,58 MHz, para obtener la seal de croma y un filtro de banda eliminada
para obtener la luminancia. El filtrado de la seal de vdeo se ilustra en la figura 3.32.

Fig. 3.32 Separacin de las componentes de croma y luminancia mediante filtro muesca

El filtro utilizado para la componente de luminancia recibe el nombre de filtro muesca, ya que
consiste en situar un cero de transmisin en la frecuencia portadora de la seal de croma. El resultado
global obtenido con este filtro es parecido al que se obtendra con un filtro paso bajo aplicado a la
seal de luminancia. De hecho, el filtro empieza a atenuar la seal de luminancia en frecuencias algo
inferiores a los 3,58 MHz (normalmente del orden de 3 MHz) y aunque tiene cierta ganancia para
frecuencias superiores a los 4 MHz, el contenido de la seal de luminancia a estas frecuencias puede
considerarse prcticamente nulo.

Este procedimiento de separacin de las componentes de la seal de vdeo puede realizarse mediante
filtros convencionales de bajo coste. En principio, si las imgenes no tienen excesivo contenido en alta
frecuencia, el sistema funciona correctamente. Es evidente que si pudiramos garantizar que la seal
de luminancia no contiene informacin ms all de los 3 MHz, la separacin entre las dos
componentes mediante este sencillo filtrado sera perfecta. Sin embargo, en regiones de la imagen con
mucho detalle, la seal de luminancia suele presentar cierto contenido en alta frecuencia, por lo que la
separacin entre las dos componentes no ser como en un principio esperaramos. Analicemos cmo
afecta este filtrado al contenido en alta frecuencia en cada uno de los canales.

f
3,58 MHz
f
3,58 MHz
Luminancia
+
Croma
Croma
Luminancia
Q Q
I I
Q Q
I I
f
3,58 MHz
f
3,58 MHz
Luminancia
+
Croma
Croma
Luminancia
Q Q
I I
Q Q
I I
La seal de luminancia perder las componentes de alta frecuencia situadas en torno a la frecuencia
portadora del color, con lo que la imagen que se observar en la pantalla ser una versin de la escena
original con menor detalle. En principio, esta prdida de detalle sera tolerable por el sistema visual
humano, ya que, como hemos visto, un sistema con 3 MHz de ancho de banda proporciona una
calidad de imagen bastante aceptable. Indudablemente se apreciara una prdida de resolucin
respecto a un sistema que mantuviera el ancho de banda nominal de la seal de luminancia, pero, no
obstante, es admisible.

El problema es ms grave en lo que respecta a la seal de croma. En efecto, las componentes de alta
frecuencia de la seal de luminancia estarn ahora presentes en el canal de color. Las componentes
prximas a la frecuencia portadora de la croma sern ahora demoduladas como informacin de color
de modo que, en los contornos de la imagen (regiones con contenido espectral de alta frecuencia),
sern decodificadas con falsas coloraciones. Este problema suele tambin conocerse con el nombre de
cross color debido a que el efecto es parecido al cruce de componentes de color, puesto que en ambos
casos los colores decodificados no se corresponden con los originales. Sin embargo, la naturaleza del
problema es muy distinta a la que habamos considerado en el proceso de demodulacin de las seales
de color, puesto que ahora se debe a que la seal de luminancia introduce errores en las seales
diferencia de color, mientras que en el otro caso se trataba de un verdadero cruce entre las dos
componentes de color.

As pues, el uso de un filtro muesca para la separacin de las componentes de luminancia y color suele
producir resultados aceptables en la mayor parte de las imgenes, aunque, en algunos contornos de las
imgenes, pueden aparecer colores falsos que no se corresponden con la escena original.

Filtros peine (Comb filters)

Este tipo de filtros requieren utilizar clulas que retarden la seal de vdeo, por lo que su
implementacin es bastante ms costosa que el filtro muesca. Su respuesta en frecuencia toma valores
de ganancia nula en frecuencias uniformemente espaciadas, por lo que su aspecto tiene la forma de un
peine. La implementacin ms simple, y tambin la ms habitual, se representa en la figura 3.33,
donde adems se indica que la componente de luminancia se obtiene como la suma de seal de vdeo
original ms la seal de vdeo retardada, mientras que la croma se obtiene como la diferencia entre
ambas seales. Analicemos la respuesta en frecuencia del filtro para cada una de las dos componentes.

En el caso del canal suma (luminancia), la salida puede expresarse como:

) ( ) ( ) ( T t x t x t y
L
+ (3.57)

donde x(t) representa la seal de vdeo compuesto y T el retardo que se aplica a esta seal. Si
aplicamos la transformada de Fourier a los dos trminos de la igualdad podemos determinar la
respuesta del filtro:

( )
T f j
e f X f Y

+
2
1 ) ( ) ( (3.58)

cuyo mdulo viene dado por:
) cos( 2 1
) (
) (
) (
2
fT e
f X
f Y
f H
T f j
+

(3.59)

Este resultado indica que la respuesta del filtro es peridica presentado sus valores mximos en las
frecuencias f
kmax
=k/T y con valores nulos en las frecuencias f
knul
=1/2T+k/T.

Fig. 3.33 Diagrama de un filtro peine para la separacin de croma y luminancia

El mdulo de la respuesta en frecuencia del filtro se ha representado en la figura 3.34, donde hemos
tomado T igual al periodo de lnea. Para este valor de T, el filtro presenta ganancia mxima en los
mltiplos de la frecuencia de lnea y ganancia nula en los mltiplos impares de la mitad de la
frecuencia de lnea. Esta disposicin de los mximos y los nulos permite que las componentes de
luminancia, centradas en los mltiplos de la frecuencia de lnea, puedan pasar a travs del filtro,
mientras que las componentes de croma, que estn situadas en los mltiplos impares de la mitad de la
frecuencia de lnea, sean canceladas en la salida.

Fig. 3.34 Respuesta en frecuencia de los canales suma y diferencia de un filtro en peine
Linea de Retardo
T=Periodo de Lnea
+
+
+
-
Vdeo Compuesto
Luminancia
Croma
Linea de Retardo
T=Periodo de Lnea
+
+
+
-
Vdeo Compuesto
Luminancia
Croma
Respuesta en frecuencia filtro peine: canal suma -luminancia
f
|H(f)|
K f
Lnea
(2K+1) f
Lnea
/2
Respuesta en frecuencia filtro peine: canal diferencia - croma
f
|H(f)|
K f
Lnea
(2K+1) f
Lnea
/2
Respuesta en frecuencia filtro peine: canal suma -luminancia
f
|H(f)|
K f
Lnea
(2K+1) f
Lnea
/2
Respuesta en frecuencia filtro peine: canal diferencia - croma
f
|H(f)|
K f
Lnea
(2K+1) f
Lnea
/2
La respuesta en frecuencia del canal diferencia tambin se ha representado en figura 3.34,
observndose que ahora la disposicin de las frecuencias de ganancia nula y mxima se ha invertido
respecto al caso anterior. En efecto, la relacin entrada salida de este canal es:

) ( ) ( ) ( T t x t x t y
L
(3.60)

con lo que su respuesta en frecuencia viene dada por:

( )
fT j
e
f X
f Y
f H

2
1
) (
) (
) ( (3.61)

cuyo mdulo es ahora una funcin del tipo seno:

) ( 2 ) ( fT sen f H (3.62)

que, cuando T es el periodo de lnea, presenta ganancia prcticamente nula a la seal de luminancia,
debido a que la ganancia del filtro es cero en las frecuencias donde se concentra la mayor parte de la
energa de la luminancia. Por el contrario, el filtro deja pasar la componente de croma, debido a que su
ganancia es mxima en las regiones donde se sita esta seal.

La tecnologa utilizada para implementar la lnea de retardo que requiere un filtro en peine est
basada, en la mayora de receptores actuales, en sistemas digitales. Por ello, estos sistemas de
separacin de las componentes de croma y luminancia no se popularizaron hasta mediados de la
dcada de los 80.

La realizacin de un filtro en peine mediante lneas de retardo analgicas se basa en el uso de
transductores de la seal elctrica a ultrasonidos, debido a que es difcil obtener por medios
exclusivamente electrnicos retardos de este orden de magnitud (63,49 s en el caso del NTSC). Se
trata de sistemas caros que, si bien se utilizan profusamente en los decodificadores de la seal de color
en PAL, como parte integrante del filtro separador de croma y luminancia se usan tanto. El principio
de funcionamiento de estas lneas de retardo analgicas se ilustra en la figura 3.35. La seal elctrica
se convierte a una onda de presin mediante un transductor electroacstico. Evidentemente, la seal
obtenida es ultrasnica, ya que las frecuencias de la seal de vdeo son muy superiores al margen
audible. La onda de presin se propaga en el interior de un material cristalino siguiendo el trayecto
indicado y sufriendo varias reflexiones que permiten reducir el tamao fsico del retardador
manteniendo un trayecto con una longitud aproximada de 17,46 cm (esta longitud debera ser de 17,6
cm para el caso del PAL). La velocidad de propagacin de las ondas de presin en este medio es de
unos 2750 m/s, de manera que la seal obtenida en la salida del transductor acstico-elctrico tendr
un retardo de 63,49 s respecto la seal de entrada.

Las lneas de retardo digitales pueden realizarse utilizando registros de memorias de desplazamiento
del tipo CCD, o bien con sistemas que convierten las seales de entrada directamente a formato
digital. En el primer caso no se trata un sistema digital propiamente dicho, ya que, aunque se realiza
un muestreo de las seales, estas muestras no se codifican como palabras digitales, sino que se
almacenan directamente como una carga elctrica proporcional a la tensin de entrada. Las cargas se
almacenan en una memoria CCD de lnea y se desplazan en el tiempo como si se tratara de un registro
de desplazamiento convencional que, en vez de operar con valores binarios, lo hace con elementos de
carga elctrica analgicos. En el captulo dedicado a cmaras examinaremos con algo ms de detalle
los principios de funcionamiento de estos registros de desplazamiento. Los sistemas basados en
capacidades conmutadas (switched capacitor) tienen unas prestaciones y filosofa de funcionamiento
parecidas a los sistemas CCD y tambin pueden usarse para la realizacin del filtro comb.

Fig. 3.35 Lnea de retardo mediante ultrasonidos con reflexiones mltiples

En los sistemas denominados digital comb filter suele realizarse un muestreo de la seal de vdeo
compuesto codificndose, mediante un conversor analgico digital, a unos 8 bits por muestra. En este
caso la combinacin suma y diferencia de las seales se realiza directamente en formato digital
utilizando una unidad lgica especialmente diseada para esta operacin. Estos sistemas suelen
aprovechar la digitalizacin de las seales de vdeo para realizar la decodificacin de las componentes
de color directamente mediante tecnologa digital.

La idea de utilizar una lnea de retardo para obtener un filtrado de las seales en forma de peine puede
extenderse a ms de un retardo. En la figura 3.36 se indica un esquema de filtro en peine basado en
dos unidades de retardo, cada uno de los cuales es igual al periodo de lnea. Esta generalizacin slo
suele usarse en sistemas basados en el tratamiento digital de las seales y no suele extenderse a ms de
dos unidades de retardo. La respuesta equivalente que obtendramos con este sistema puede
determinarse con un procedimiento anlogo al caso de un nico retardo temporal. Para el canal de
luminancia, la combinacin de las seales en el dominio temporal viene dada por:

) 2 ( ) ( 2 ) ( ) ( T t x T t x t x t y
L
+ + (3.63)

que tiene una respuesta en frecuencia:

( )
2 2 4 2
) 1 ( 2 1
) (
) (
) (
fT j fT j fT j L
L
e e e
f X
f Y
f H

+ + + (3.64)

cuyo mdulo ser el cuadrado de la funcin obtenida en el caso de utilizar un nico retardo:

2
) cos( 4 ) ( fT f H
L
(3.65)
Transductor
de entrada
Transductor
de salida
Transductor
de entrada
Transductor
de salida
Para el caso del canal de croma obtenemos un resultado similar, ya que ahora la respuesta en
frecuencia puede expresarse como:

( )
2 2 4 2
) 1 ( 2 1
) (
) (
) (
fT j fT j fT j C
C
e e e
f X
f Y
f H

+ (3.66)

por lo que el mdulo tambin ser el cuadrado de la funcin obtenida para un nico retardo:

2
) ( 4 ) ( fT sen f H
C
(3.67)

Fig. 3.36 Filtro en peine con dos unidades de retardo

Las magnitudes de las respuestas en frecuencia de estos dos canales se han representado en la figura
3.37. Las dos funciones mantienen las propiedades de ganancia mxima y mnima obtenidas para el
filtro comb de una sola lnea de retardo. Sin embargo, ahora la curva de ganancia es ms plana tanto
en los alrededores de las frecuencias en las que existe un mximo como en las que presentan ganancia
nula. Con ello se consigue distorsionar menos la seal de inters (ya que no se deforman los lbulos
de las componentes frecuenciales) y, lo ms importante, eliminar con mayor precisin las
componentes indeseadas en cada canal. En efecto, con el filtro comb de orden 1 (es decir, con un
nico retardo), la magnitud de la respuesta en frecuencia alrededor de los puntos con ganancia nula
variaba muy rpidamente, por lo que algunas componentes de la seal a cancelar, centradas en las
proximidades del cero, podan pasar a travs del sistema provocando la aparicin de un pequeo cruce
entre las componentes de luminancia y crominancia. Evidentemente, el nivel de cruce entre las dos
componentes en el caso de un filtro comb de orden 1 no es, ni mucho menos, comparable con el que
aparece en un sistema basado en el filtro muesca, pero es algo superior al que obtiene con un filtro de
orden 2, que ya es prcticamente despreciable.
Linea
Retardo
T
Linea
Retardo
T
Sumador
Sumador
Video
compuesto
Luminancia
Croma
1
2
1
1
-2
1
x(t) x(t-T) x(t-2T)
Linea
Retardo
T
Linea
Retardo
T
Sumador
Sumador
Video
compuesto
Luminancia
Croma
1
2
1
1
-2
1
x(t) x(t-T) x(t-2T)

Fig. 3.37 Respuesta en frecuencia de los filtros en peine de orden 2

3.3.12 Regeneracin de la portadora de color

Fig. 3.38 Recuperacin de la portadora de color

La regeneracin de la portadora de color suele realizarse mediante la estrategia indicada en el
diagrama de bloques de la figura 3.38. Bsicamente consiste en un oscilador controlado por tensin
que genera una seal de frecuencia doble a la de la portadora de color. El inters de que esta seal
tenga una frecuencia doble radica en que de este modo puede obtenerse el desplazamiento de 90 de
una de las seales del demodulador digitalmente. En efecto, la seal en la salida del regenerador puede
Filtro comb de orden 2: canal suma -luminancia
f
|H(f)|
K f
Lnea
(2K+1) f
Lnea
/2
Filtro comb de orden 2: canal diferencia - croma
f
|H(f)|
K f
Lnea
(2K+1) f
Lnea
/2
Filtro comb de orden 2: canal suma -luminancia
f
|H(f)|
K f
Lnea
(2K+1) f
Lnea
/2
Filtro comb de orden 2: canal diferencia - croma
f
|H(f)|
K f
Lnea
(2K+1) f
Lnea
/2
Puerta de
salva.
Amplificador
Comparador
de fase
V.C.O.
Divisor
frecuencia
div 2
Divisor frecuencia
y desplazamiento de fase
Vdeo
compuesto
Sincronismo
lnea
Al control
de ganancia
y supresor
de color
Puerta de
salva.
Amplificador
Comparador
de fase
V.C.O.
Divisor
frecuencia
div 2
Divisor frecuencia
y desplazamiento de fase
Vdeo
compuesto
Sincronismo
lnea
Al control
de ganancia
y supresor
de color
aplicarse a un par de bsculas flip-flop tipo D que dividen la frecuencia por 2 y realizan un
desplazamiento de un cuarto de periodo de la seal. De este modo el desplazamiento de 90 es muy
preciso y no se requiere el uso de sistemas analgicos. El hecho de que las seales que se aplican al
demodulador sean cuadradas en vez de sinusoidales no suele ser importante, debido al ancho de banda
del propio mezclador de vdeo.

La sincronizacin entre la referencia interna y la seal de salva se realiza mediante una realimentacin
de la seal de salida que se compara con la salva externa, como en un PLL convencional. La puerta de
entrada al sistema se encarga de garantizar que el oscilador de tensin slo se controla cuando est
presente la salva de color. En la figura 3.38 tambin se indica que el nivel de la salva se utiliza para
actuar sobre la ganancia del amplificador de croma y desactivar los demoduladores de croma cuando
la seal que se recibe es en blanco y negro y no contiene la salva.

3.3.13 Problemas del sistema NTSC
El sistema NTSC es particularmente susceptible a la denominada distorsin de fase diferencial. Este
fenmeno consiste bsicamente en que las no linealidades del canal de transmisin provocan que el
retardo que experimentan las seales dependa del nivel de continua sobre el que se transmite la seal.
El problema es particularmente importante, ya que supone que el retardo con el que se recibe la
portadora de color depende del nivel de luminancia de la seal. Por ello, aparecen pequeos errores de
fase entre la salva de color (transmitida con nivel de luminancia nulo) y la propia informacin de
color, cuya portadora tendr un retardo que depende del nivel de luminancia de cada parte de la
escena.

Estas diferencias de fase entre la portadora real y la seal salva suponen que las componentes
demoduladas no se corresponden directamente con las originales, sino que aparece un giro del vector
de crominancia U(t), V(t). En efecto, el error de fase entre la salva de color y la portadora puede
considerarse como si existiera un giro en el sistema de coordenadas en el que estamos demodulando la
seal o, equivalentemente, si se supone que seguimos demodulando en el mismo sistema de
coordenadas, un giro de las componentes del vector de crominancia. La magnitud y direccin del giro
depende de los niveles de la seal y, aunque est relacionado con la propia imagen, en primera
aproximacin podemos considerarlo como aleatorio. La situacin se ilustra en la figura 3.39, donde se
indica esquemticamente el carcter aleatorio del giro. Suponemos en este apartado que estamos
realizando una demodulacin directa de las seales sobre los ejes U(t) y V(t), aunque los resultados
que derivaremos tienen tambin validez para el caso en que realicemos la demodulacin sobre los ejes
I(t) y Q(t).

El giro del vector (U(t), V(t)) supone, como justificaremos seguidamente, un cambio en el matiz del
color demodulado que, evidentemente, distorsiona considerablemente la escena, ya que los colores
representados no se correspondern con los reales. El sistema PAL solucionar este problema del
NTSC introduciendo una modificacin sobre la seal transmitida que intenta convertir los errores de
fase del demodulador en errores de amplitud sobre el vector de croma.

Es relativamente fcil comprobar que los errores de amplitud en el vector de croma representan
cambios en la saturacin y brillo del color representado en la pantalla, pero nunca cambios en el matiz
del color. Es evidente que el sistema visual humano ser menos crtico con los errores en la saturacin
y brillo del color que sobre los cambios en el matiz, por lo que el sistema PAL se considera mucho
ms robusto que el NTSC.

Fig. 3.39 Efectos de la distorsin diferencial de fase sobre el vector de croma

Comprobaremos a continuacin que las variaciones en el mdulo del vector de croma afectan slo a la
saturacin y la intensidad del color, pero no al matiz. Esta misma demostracin sirve para indicar que
las variaciones en la direccin del vector de croma deben afectar al matiz del color decodificado.
Efectivamente, las componentes U(t) y V(t) proporcionan informacin de todos los parmetros del
color, por lo que si demostramos que un cambio en el mdulo de este vector, manteniendo fija la
componente de luminancia, representa slo un cambio en la saturacin y brillo, ser evidente que la
informacin de matiz debe depender de la direccin del vector. Es importante dejar claro que, a veces,
por abuso del lenguaje, suele decirse que los cambios de direccin del vector de croma se
corresponden exclusivamente con cambios de matiz del color, lo cual, no es estrictamente cierto. En
efecto, un cambio de direccin lleva implcito una variacin del matiz del color, pero tambin una
variacin en la saturacin y brillo. Desde nuestro punto de vista, lo que nos interesa demostrar es que
si logramos reducir el efecto del ruido a un error en el mdulo del vector en vez de un error en su
direccin, los colores decodificados mantendrn el mismo matiz que los originales. Para ello, bastar
con comprobar que el cambio en el mdulo del vector de croma no modifica el matiz del color.

Supongamos que las componentes de luminancia y seales diferencia de color que deberamos
demodular en ausencia de ruido y distorsiones son Y
A
,U
A
,V
A
. Con estas seales, las componentes
R,G,B que obtendramos vienen dadas por la relacin matricial:

1
1
1
]
1
1
1
1
]
1
1
1
1
]
1
1
1
1
]
1

1
1
1
]
1

1
1
1
]
1
A
A
A
A
A
A
A
A
A
V
U
Y
Y B
Y R
Y
B
G
R
'
'
'
0 493 . 0 / 1 0
877 . 0 / 1 0 0
0 0 1
1 0 1
194 . 0 509 . 0 1
0 1 1
)' (
)' (
'
1 0 1
194 . 0 509 . 0 1
0 1 1
'
'
'
(3.68)
Desplazamiento
de fase de los
vectores de croma
U
V
Desplazamiento
de fase de los
vectores de croma
U
V
donde la segunda matriz que interviene en el producto se ha obtenido a partir de las relaciones entre
las componentes U,V con las seales diferencia de color (R-Y), (B-Y). Desarrollando el producto
obtenemos

1
1
1
]
1
1
1
1
]
1

1
1
1
]
1
A
A
A
A
A
A
V
U
Y
B
G
R
'
'
'
0 0284 . 2 1
5804 . 0 3935 . 0 1
1403 . 1 0 1
'
'
'
(3.69)

Si en vez de utilizar el vector de croma original (U
A
, V
A
), modificamos su mdulo en un factor k, las
componentes R,G,B que obtendremos sern:

1
1
1
]
1

1
1
1
]
1

1
1
1
]
1
A
A
A
B
B
B
V K
U K
Y
B
G
R
'
'
'
0 0284 . 2 1
5804 . 0 3935 . 0 1
1403 . 1 0 1
'
'
'
(3.70)

Para relacionar ambos resultados podemos utilizar:

1
1
1
]
1

+
1
1
1
]
1
1
1
1
]
1
0
0
' ) 1 (
'
'
'
'
'
'
A
A
A
A
A
A
A
Y K
V K
U K
Y K
V K
U K
Y
(3.71)

que sustituyndolo en la ecuacin 3.70 y desarrollando los productos se obtiene:

1
1
1
]
1
+
1
1
1
]
1

1
1
1
]
1
1
1
1
' ) 1 (
'
'
'
'
'
'
A
A
A
A
B
B
B
Y K
B
G
R
K
B
G
R
(3.72)

Es decir, las componentes RGB que decodificamos cuando se modifica el mdulo del vector de croma
se corresponden con las componentes originales escaladas por el mismo factor (de modo que slo se
modifica el brillo pero no el matiz), ms una determinada cantidad de blanco que slo afectar a la
saturacin del color. En consecuencia, tal y como pretendamos demostrar, el color decodificado
mantiene el mismo matiz que el original.

En resumen, uno de los principales problemas del sistema NTSC es que los errores de fase en la
decodificacin del color se traducen directamente en errores sobre el matiz de la imagen representada,
lo cual resulta especialmente desagradable en determinadas imgenes, como por ejemplo los rostros
de las personas. Para controlar este problema, los receptores NTSC suelen incorporar un mando
externo que permite que el espectador pueda ajustar los tonos o matices de color representados. Este
control consiste en un sistema que permite desajustar la fase de la portadora de color que se emplea
para la demodulacin, de modo que el espectador puede actuar sobre los ejes sobre los que se realiza
la demodulacin compensando el giro debido a los errores de fase. No obstante, este control slo
permite compensar una gama reducida de matices, ya que como hemos comentado el desfase entre la
salva y la portadora depende del nivel de luminancia y, por lo tanto, vara en funcin de la imagen.
Las cartas de ajuste de los pases que utilizan el sistema NTSC suelen incorporar una imagen esttica
con la fotografa de una cara. Ello facilita notablemente el ajuste de matiz en el receptor, debido a que
la tonalidad de la piel es una de las que ms fcilmente pueden ajustarse pues el sistema visual es muy
crtico ante estos errores de color.

Otro de los problemas del sistema NTSC, que ya habamos comentado anteriormente, es que la
asimetra debida al recorte de la banda lateral superior de la componente I(t) provoca que aparezcan
problemas en el matiz de los colores en las regiones donde se producen transiciones de objetos. Por
todo ello, el sistema NTSC es mucho menos robusto que el PAL o el SECAM y, en trminos irnicos,
suele decirse que sus siglas corresponden al acrnimo de Never Twice The Same Colour.

3.4 El sistema PAL
El sistema PAL fue propuesto en 1964 por el Dr. Bruch de Telefunken (Alemania) como una
alternativa al sistema NTSC que permita reducir la sensibilidad del receptor a las distorsiones de fase.
El sistema fue aceptado por un gran nmero de pases que en la poca en que se defini todava no
haban regularizado las transmisiones de televisin en color. Estados Unidos y Japn mantienen el
sistema NTSC debido a su considerable implantacin en el momento de definir el PAL. Francia y los
pases de su rea de incidencia utilizan un desarrollo propio de H. De France conocido como SECAM
y que presenta bastantes aspectos diferenciales con el PAL y el NTSC. El PAL puede considerarse
como una evolucin natural del NTSC y comparte muchos de los aspectos tecnolgicos y de
implementacin que son comunes a ambos sistemas. Por ello, en esta presentacin del PAL nos
centraremos principalmente en los aspectos diferenciales entre ambos subsistemas. Suponemos que el
lector est familiarizado con las tcnicas de modulacin y demodulacin de las seales de croma, los
procedimientos para generar la seal de salva, los filtros para separar las componentes de croma y
luminancia y los subsistemas de recuperacin de la fase de la portadora de color que, en esencia, son
equivalentes en el sistema NTSC y en el PAL con slo cambiar el nmero de lneas y las frecuencias
de imagen y campo.

En los siguientes apartados se describen las diferencias ms significativas entre ambos subsistemas
prestando una especial atencin a la forma en que se consiguen corregir los errores en la fase de las
componentes de color y el proceso de decodificacin de la seal PAL.

3.4.1 Correccin de fase mediante la inversin de una de las componentes de croma
En la ecuacin 3.3 hemos visto que el sistema PAL realiza una inversin de la componente de color
V'(t) en lneas alternadas. La ecuacin puede expresarse en funcin de un ndice entero que representa
el nmero de lnea:

( )
( ) ( ) ( ) t f t V t f t U t croma
PAL
k
PAL
k
PAL
+ 2 cos ) ( ' 1 2 sin ) ( ' ) ( (3.73)

Debe mencionarse que el ndice k es un valor entero que se incrementa en cada nueva lnea de la
secuencia de vdeo y que, aunque est relacionado con la numeracin propia de las lneas de la seal
de televisin, esta relacin, como veremos posteriormente, no es directa.
La ecuacin 3.73 define una alternancia en el signo de la componente de color V'(t) que de alguna
manera deber compensarse en el receptor. De hecho, la cancelacin de los errores de fase en las
componentes de color se produce al corregir esta alternancia de signo en el decodificador. A menudo,
las lneas de la seal PAL que no contienen la inversin de signo se denominan lneas NTSC, mientras
que las lneas invertidas se denominan lneas PAL. Es importante que esta notacin no resulte confusa,
puesto que la esencia del sistema PAL es que aparezcan de forma alternada ambos tipos de lneas. El
receptor, para decodificar correctamente las seales, deber disponer de informacin precisa sobre el
tipo de lnea que est recibiendo. Esta informacin se proporciona al receptor mediante cambios de
fase en la seal de salva de color que analizaremos posteriormente.

Para ver cmo la alternancia de signo permite reducir los errores de fase en el vector de croma,
consideremos el ejemplo que se muestra en la figura 3.40. Por el momento supondremos que
deseamos transmitir una imagen homognea, con un color constante en todas sus lneas. El vector de
croma que se desea transmitir se representa en la parte superior de la figura. Debido a la alternancia en
la componente V'(t), se transmitirn dos tipos de vectores al canal, una para las lneas no invertidas
(lneas NTSC) y otro para las lneas invertidas (lneas PAL). En la figura 3.40 se supone que la lnea k
corresponde a una lnea no invertida y que la lnea k+1 tiene la componente V' invertida.

Si el canal introduce un desfase constante en los vectores de croma, las seales recibidas
experimentarn un giro de un ngulo en el mismo sentido.

Fig. 3.40 Diagrama de las seales transmitidas y recibidas en el sistema PAL

En el receptor, la rotacin de fase que han experimentado las componentes de croma puede cancelarse
si se promedian dos lneas consecutivas. El procedimiento de reconstruccin se ilustra en la figura
3.41, donde se indica que la lnea k se mantiene igual a como ha sido recibida, mientras que en la lnea
k+1 se realiza la inversin de la componente V'. El resultado de promediar ambas lneas tambin se
muestra en la figura 3.41, observando que, una vez se ha aplicado la correccin de signo, las
U
V
Componente de color
a transmitir
U
V
U
V
Lnea k Lnea k+1
Inversin signo en V
Seales transmitidas
Seales recibidas
Desfase cte
U
V
U
V
Lnea k
Lnea k+1
Inversin signo en V
U
V
Componente de color
a transmitir
U
V
U
V
Lnea k Lnea k+1
Inversin signo en V
Seales transmitidas
Seales recibidas
Desfase cte
U
V
U
V
Lnea k
Lnea k+1
Inversin signo en V

rotaciones del canal se traducen en giros opuestos del vector de croma, de modo que al promediar los
dos vectores, los errores de fase se cancelan.

Fig. 3.41 Cancelacin de las rotaciones de croma mediante el promedio de dos lneas consecutivas

La inversin de signo de la componente V'(t) y el promedio de las lneas consecutivas debe realizarse
en el decodificador. Existen dos alternativas para realizar el promedio que se conocen como el PAL-S
(PAL simple) y el PAL D (PAL Delay Line). En el primer caso, las lneas se invierten y se presentan
en la pantalla dejando que sea el propio espectador el encargado de realizar el promedio visualmente,
corrigiendo los errores de fase. Esta filosofa produce resultados aceptables siempre que la rotacin de
los vectores de croma sea inferior a unos 5. En el PAL D el promedio entre dos lneas consecutivas se
realiza de forma electrnica, produciendo mejores resultados. En la actualidad, todos los receptores
PAL realizan el promedio entre las lneas de forma electrnica. Veremos los diagramas de bloques
bsicos para cada uno de los procedimientos.

3.4.2 Diagrama de bloques de un decodificador de croma en PAL S
El decodificador de PAL S es prcticamente idntico al decodificador NTSC, con la salvedad de que
debe realizarse la correccin de signo de la componente V'(t). En la figura 3.42 se muestra el esquema
simplificado donde se indica que el signo de la componente en coseno debe invertirse de forma
sincronizada con los impulsos de sincronismo de lnea. La frecuencia del generador de cambio de
signo es igual a la mitad de la frecuencia de lnea, ya que el ciclo completo (es decir, la lnea positiva
y la negativa) tiene una duracin de dos periodos de lnea. Las seales obtenidas en la salida de los
mezcladores deben pasarse a travs de filtros paso bajo para obtener las componentes U'(t) y V'(t). En
el caso del sistema PAL, los dos filtros son en todos los casos idnticos, puesto que las seales U y V
tienen el mismo ancho de banda en la transmisin. Estas seales, junto con la componente de
Vectores de croma
recibidos
U
V
U
V
Lnea k
Lnea k+1
Correccin signo
en linea k+1
U
V
U
V
Lnea k
Lnea k+1
Inversin signo en V
Promedio entre
dos lneas
consecutivas
U
V
k
k+1
Promedio
Vectores de croma
recibidos
U
V
U
V
Lnea k
Lnea k+1
Correccin signo
en linea k+1
U
V
U
V
Lnea k
Lnea k+1
Inversin signo en V
Promedio entre
dos lneas
consecutivas
U
V
k
k+1
Promedio
luminancia se aplican a la matriz de decodificacin para obtener las componentes RGB que finalmente
se aplican al tubo.

El PAL S slo resulta satisfactorio cuando los errores de fase son muy pequeos (5). Para errores
mayores el sistema visual no puede promediar las lneas consecutivas y la diferencia entre ellas se
hace notable. Cuando existen errores de fase grandes, se produce un trazado de bandas por la imagen
que tienden a desplazarse en sentido vertical hacia arriba o hacia abajo. Este efecto se conoce con el
nombre de efecto Hannover o persiana veneciana.

Fig. 3.42 Diagrama de bloques del decodificador de croma en el PAL simple

3.4.3 Diagrama de bloques de un decodificador de croma en PAL D
Hemos comentado que el PAL D realiza un promedio electrnico entre dos lneas consecutivas, con lo
que consigue una mejor calidad de las imgenes, eliminando de forma prcticamente completa el
efecto Hannover. Para realizar el promedio es necesario introducir una lnea de retardo que permita
combinar la seal de la lnea actual con la de la lnea anterior. En los primeros receptores en PAL D,
la lnea de retardo se construa mediante el uso de transductores de ultrasonidos como los
representados en la figura 3.35. Actualmente la mayora de modelos incorporan lneas de retardo
basadas en CCD, en capacidades conmutadas, o directamente mediante el uso de memorias digitales,
que producen resultados mucho ms estables. En los decodificadores actuales la correccin de signo
de la componente V'(t) y el promedio entre lneas consecutivas puede realizarse con las componentes
U'(t) y V'(t) demoduladas. En los decodificadores antiguos era necesario realizar el promedio antes de
demodular las seales, debido a que las unidades de retardo basadas en ultrasonidos no podan trabajar
con componentes de continua. El decodificador de PAL D de la figura 3.43 realiza la correccin de
signo de la componente V'(t) y el promedio de lneas con las componentes de croma moduladas.

Para analizar el decodificador de croma supondremos inicialmente que la lnea k+1 ha sufrido la
inversin de la componente V, mientras que la lnea k es una lnea NTSC convencional. En este caso,
las expresiones de las seales en la entrada y en la salida de la lnea de retardo vienen dadas por:

( )
( ) ( )
( )
( ) ( ) t f V t f U t croma
t f V t f U t croma
PAL PAL
k
PAL
PAL PAL
k
PAL

+
+
2 cos ' 2 sin ' ) (
2 cos ' 2 sin ' ) (
1
(3.74)
Filtro LPF
B MHz
Filtro LPF
B MHz
cos(2 f t)
sin(2 f t)
croma
PAL
(t)
(1/2) V(t)
(1/2) U(t)
+/-
Sincronismo lnea
Filtro LPF
B MHz
Filtro LPF
B MHz
cos(2 f t)
sin(2 f t)
croma
PAL
(t)
(1/2) V(t)
(1/2) U(t)
+/-
Sincronismo lnea

donde suponemos que las seales U' y V' son constantes para toda la imagen y que el retardo que se
aplica a la seal deja inalterada la fase de las portadoras en cuadratura. Analizaremos este problema
con detalle ms adelante. Por el momento supongamos que al aplicar el retardo de una lnea
cualquiera de las dos portadoras en la salida, continan estando en fase con la entrada.

En el canal superior, la suma de ambas componentes da como resultado:

( ) t f U t S
PAL
2 sin ' 2 ) ( (3.75)

mientras que en el canal inferior, la diferencia es

( ) t f V t D
PAL
2 cos ' 2 ) ( (3.76)

Si multiplicamos el canal S(t) por la portadora en fase con el seno y el canal D(t) por la portadora en
fase con el coseno y aplicamos los filtros paso bajo, obtendremos las componentes U'(t) y V'(t)
deseadas.

En la siguiente lnea (k+2), los signos de las componentes V'(t) en la entrada y en la salida de la lnea
de retardo estarn invertidos:

( )
( ) ( )
( )
t f V t f U t croma
PAL PAL
k
PAL
PAL PAL
k
PAL
+

+
+
2 cos ' 2 sin ' ) (
2 cos ' 2 sin ' ) (
1
2
(3.77)

por lo que la seal en el canal suma seguir siendo:

( ) t f U t S
PAL
2 sin ' 2 ) ( (3.78)

mientras que en el canal diferencia tendremos una diferencia de signo

( ) t f V t D
PAL
2 cos ' 2 ) ( (3.79)

lo que significa que deberemos invertir esta seal en lneas alternativas para poder obtener la
componente de color deseada. La inversin de la seal debe sincronizarse con la alternancia de signo
realizada en el transmisor. Para ello, ser necesario transmitir la informacin del signo que se ha
utilizado en cada lnea. Esta informacin se introduce en la salva de color y puede ser recuperada en el
receptor permitiendo sincronizar la inversin de signo en el canal diferencia con la de las seales
recibidas.

En todas las ecuaciones anteriores hemos supuesto que las componentes de color eran iguales en las
dos lneas, por lo que en cada uno de los canales se obtena la componente de inters y se cancelaba la
otra componente. Si esto no es as, las seales S(t) y D(t) contienen componentes cruzadas, pero sern
eliminadas por el proceso de mezcla y filtrado.

Fig. 3.43 Diagrama del decodificador de croma del sistema PAL D

En efecto, consideremos slo el caso en que la lnea actual es una lnea del tipo NTSC y, por tanto, la
lnea anterior es del tipo PAL. Suponemos que el vector de croma en la lnea actual es (U
k+1
, V
k+1
) y
que el vector de croma en la lnea anterior es (U
k
, -V
k
). Podemos escribir:

( )
( ) ( )
( )
t f V t f U t croma
PAL k PAL k
k
PAL
PAL k PAL k
k
PAL

+
+ +
+
2 cos ' 2 sin ' ) (
2 cos ' 2 sin ' ) (
1 1
1
(3.80)

La seal en el canal suma vendr dada por:

( ) ( ) ( ) ( ) t f V V t f U U t S
PAL k k PAL k k
+ +
+ +
2 cos ' ' 2 sin ' ' ) (
1 1
(3.81)

Al multiplicar esta seal por la componente en seno y filtrar paso bajo obtendremos como componente
U'(t) el valor medio entre las dos lneas:

( )
2
' '
) ( '
1 k k
U U
t U
+
+
(3.82)

Anlogamente, en el canal diferencia obtendremos el promedio entre las dos componentes V'(t)

( )
2
' '
) ( '
1 k k
V V
t V
+
+
(3.83)

Retardo
1 Lnea
L
k+1
L
k
+
+
+
_
+/-
Fase inversin signo V
LPF
LPF
S(t)
D(t)
Sin w
0
t
Cos w
0
t
U(t)
V(t)
Retardo
1 Lnea
L
k+1
L
k
+
+
+
+
+
_
+/-
Fase inversin signo V
LPF
LPF
S(t)
D(t)
Sin w
0
t
Cos w
0
t
U(t)
V(t)
lo cual demuestra que obtenemos como seales de croma los valores promedios entre las dos lneas. Si
hubisemos considerado el caso en que la lnea actual es PAL y la anterior NTSC, los resultados
obtenidos seran idnticos a los de las ecuaciones 3.82 y 3.83.

El hecho de representar el promedio entre dos lneas consecutivas de la informacin de croma supone
una reduccin de la resolucin de color. No obstante, esta prdida de resolucin puede ser asumida
por el sistema, ya que se trata nicamente de las componentes de color, manteniendo la luminancia
distinta para cada lnea. Esto significa que las componentes RGB, que se obtienen como la
combinacin de la luminancia y la croma, son independientes en las distintas filas que constituyen la
imagen.

La prdida de resolucin en color se produce slo en el sentido vertical de la imagen, lo cual tiene
incluso cierta lgica. Recordemos que la resolucin horizontal de las componentes de croma haba
sido reducida durante el proceso de transmisin de la seal, aplicando filtros paso bajo, de 1,3 MHz de
ancho de banda, a las seales diferencia de color. No obstante, la resolucin vertical no ha sido
reducida durante la transmisin (se transmiten todas las lneas), por lo que admite una posterior
reduccin del ancho de banda (mediante el promedio de lneas consecutivas), que en este caso realiza
el propio receptor. Con ello, se igualan las resoluciones verticales y horizontales de las componentes
de color.

Un aspecto muy importante del demodulador de croma es cmo afecta a las portadoras la unidad de
retardo que se aplica a la seal. En el desarrollo anterior hemos comentado que suponamos que la
unidad de retardo no introduca ningn desfase significativo sobre las portadoras en seno y en coseno.
Esto nos permita agrupar los trminos de croma en los canales suma y diferencia y demodular
correctamente las seales. Si esto no fuera as, y existiera algn desfase entre las portadoras en la
entrada y en la salida de la lnea de retardo, apareceran cruces entre las dos componentes diferencia
de color que se traduciran en una incorrecta demodulacin de la seal. En efecto, si rescribimos la
ecuacin 3.74 teniendo en cuenta un posible desfase de las portadoras entre la entrada y la salida
obtenemos:

( )
( ) ( )
( )
( ) ( ) + +
+
+
t f V t f U t croma
t f V t f U t croma
PAL PAL
k
PAL
PAL PAL
k
PAL
2 cos ' 2 sin ' ) (
2 cos ' 2 sin ' ) (
1
(3.84)

Si desarrollamos la segunda expresin

( )
) 2 cos( )) cos( ' ) sin( ' (
) 2 sin( )) sin( ' ) cos( ' (
) 2 sin( ) sin( ' ) 2 cos( ) cos( '
) 2 cos( ) sin( ' ) 2 sin( ) cos( ' ) (
t f V U
t f V U
t f V t f V
t f U t f U t croma
PAL
PAL
PAL PAL
PAL PAL
k
PAL
+
+ +
+
+
(3.85)

y determinamos la seal que obtenemos en el canal suma obtenemos:

( )
( ) + + +
+ + +
t f U V
t f V U t S
PAL
PAL
2 cos ) sin ' ) cos 1 ( ' (
2 sin ) sin ' ) cos 1 ( ' ( ) (
(3.86)
Finalmente, si aplicamos esta seal al mezclador en seno y la filtramos paso bajo obtenemos la salida
de la componente U'(t) que aplicaremos a la matriz de decodificacin:

2
) sin ' ) cos 1 ( '
) ( '
+ +
V U
t U (3.87)

Esta expresin coincide con el resultado deseado cuando el desfase es nulo, pero introduce un cruce
entre las componentes de color cuando es distinto de cero, resultando tanto ms importante cuanto
mayor es este desfase. El resultado que obtendramos si analizamos el canal diferencia en vez del
canal suma es parecido.

En consecuencia, es sumamente importante que la lnea de retardo mantenga las fases de las dos
portadoras en cuadratura, para lo cual el tiempo de retardo deber ser un mltiplo entero del periodo
de la portadora de color. Esta restriccin parece imponernos que el tiempo de lnea deber ser un
mltiplo entero del periodo de la portadora de color, lo que, como sabemos del anlisis del NTSC,
supondra la introduccin de patrones de interferencia altamente visibles. La solucin a este dilema de
diseo consiste en dar prioridad a que los patrones de interferencia sean mnimos, seleccionando la
frecuencia de la portadora de color para que se cumpla este requisito. Una vez elegida la frecuencia de
portadora, la lnea de retardo del decodificador PAL se ajusta para que el tiempo de retardo coincida
exactamente con un mltiplo entero de periodos de la portadora de color. Esto significa que el tiempo
de retardo no coincidir exactamente con el periodo de lnea, sino que ser ligeramente inferior. En la
prctica, tal y como veremos en el subapartado siguiente, el tiempo de retardo debe ser de 64,056 s,
algo superior al periodo de lnea de 64 s. Esta diferencia significa que el promedio de las
componentes de croma no se realiza exactamente entre dos elementos de imagen situados en la misma
posicin horizontal, sino que el elemento actual ha sido promediado con un elemento de la lnea
anterior situado ligeramente a su izquierda (desde la posicin del espectador). La diferencia entre
ambas posiciones es sumamente pequea (un 0,08 % de la duracin de una lnea) por lo que no se
aprecia ningn efecto secundario.

Debe observarse que el ajuste del retardo de lnea del decodificador PAL debe ser muy preciso, puesto
que en caso contrario se producira el cruce entre las componentes de color. Adems, la frecuencia de
la portadora de color debe ser muy estable y no debe presentar diferencias significativas entre distintas
transmisiones. Las especificaciones sobre la frecuencia de portadora de color exigen que la desviacin
sea inferior a 1 Hz sobre el valor terico (de un 0,225 unidades por milln respecto al valor real de la
portadora).

Una alternativa al decodificador de la figura 3.43 es realizar el promedio entre las componentes de
color directamente en banda base. Esta estrategia, que se representa de forma esquemtica en la figura
3.44, consiste en utilizar un decodificador PAL S para separar las componentes U'(t) y V'(t) y
posteriormente promediarlas de forma independiente. Los retardos con los que se realizan los
promedios pueden ser exactamente iguales a un periodo de lnea y no se producen cruces entre las
componentes de color, aun en el supuesto que el sistema se desajustara. Las lneas de retardo pueden
implementarse utilizando circuitos de capacidades conmutadas, dispositivos CCD o mediante la
digitalizacin de las seales croma y la simulacin del retardo con memorias digitales. La mayor
parte de los decodificadores actuales utilizan esta tecnologa, que es ms estable y requiere de un
menor nmero de ajustes. No obstante, esta filosofa requiere que los retardos de la seal puedan
realizarse a frecuencias muy bajas (las seales diferencia de color en banda base pueden permanecer
en un mismo valor durante tiempos largos), lo cual no es posible implementar mediante lneas de
retardo ultrasnicas convencionales. Por ello, este tipo de decodificadores slo empezaron a utilizarse
a partir de la mitad de la dcada de los 80, cuando la tecnologa digital y de CCD resultaron
econmicamente rentables.

Fig. 3.44 Promedio de las componentes de coloren banda base

3.4.4 Seleccin de la frecuencia portadora de color
Al analizar el sistema NTSC hemos visto que, si seleccionbamos la frecuencia de la subportadora de
color igual a un mltiplo impar de la mitad de la frecuencia de lnea, obtenamos unos patrones
interferentes que tanto en el dominio espacial como el temporal ofrecan cambios constantes de
posicin, por lo que la seal resultaba poco visible en los receptores monocromos. En el sistema PAL
podramos intentar utilizar una frecuencia portadora que cumpliera la misma propiedad. No obstante,
la inversin de signo en una de las componentes de color introduce cambios significativos en el patrn
interferente e imposibilita utilizar una frecuencia portadora que sea un mltiplo impar de la mitad de
la frecuencia de lnea.

En efecto, el patrn de interferencias de la seal PAL puede considerarse como la superposicin de los
patrones interferentes asociados a las componente U'(t) y V'(t). El patrn de la componente U'(t)
coincide con el del NTSC, puesto que la seal no sufre ninguna inversin de signo entre lneas
consecutivas. En cambio, la componente V'(t) va alternando el signo entre lneas consecutivas, lo que
significa que la interferencia tambin cambiar de signo respecto al patrn del NTSC. Habamos visto
que los elementos de imagen situados en la misma posicin horizontal en lneas adyacentes
experimentaban un cambio de signo en la amplitud de la interferencia que se superpona con la
informacin de luminancia. Ahora, para la componente V'(t), este cambio de signo se compensa con la
inversin de signo propia de la lnea, por lo que las interferencias estn en fase en lneas adyacentes.
Esto significa que aparecer un patrn interferente formado por lneas verticales que ser altamente
visible. Adems, desde el punto de vista temporal la interferencia tambin ser estacionaria debido a
que el nmero de lneas entre imagen e imagen es impar (625) y por lo tanto la lnea actual estar
invertida respecto a la misma lnea en la imagen anterior, compensado las diferencias de signo que
Decodificador
PAL
Simple
Lnea Retardo
T
L
Croma
U(t)
Lnea Retardo
T
L
V(t)
Decodificador
PAL
Simple
Lnea Retardo
T
L
Croma
U(t)
Lnea Retardo
T
L
V(t)
existan en el patrn interferente del sistema NTSC. La nica solucin factible a este problema
consiste en modificar la frecuencia de la subportadora de color eligiendo un patrn ms complejo que
no se vea afectado por los cambios de signo de una de las componentes.

La solucin que se adopt fue tomar una frecuencia portadora que cumpliera la siguiente condicin:

4 2
) 1 2 (
L L
PAL
f f
k f + + (3.88)

Esta seleccin resulta bastante lgica si tenemos en cuenta que un mltiplo impar de la mitad de la
frecuencia de lnea produce un patrn interferente adecuado para la componente U'(t), pero totalmente
desfavorable para la componente V'(t). Anlogamente, un mltiplo exacto de la frecuencia de lnea
(mltiplo par de la mitad de la frecuencia de lnea) produce un patrn interferente adecuado a la seal
V'(t), pero nefasto para la U'(t). La solucin ms adecuada parece quedarnos con una frecuencia
intermedia entre estos dos casos extremos, con lo cual los dos patrones sern complejos y se
imbricarn espacialmente en la forma en que se ilustra en la figura 3.45.

Fig. 3.45 Patrones interferentes espaciales para las componentes U'(t) y V'(t) en el sistema PAL

Con esta frecuencia de portadora, las fases entre las ondas interferentes en lneas consecutivas estn
desfasadas un ngulo de 90 (retrasadas para la componente U'(t) y adelantadas para la componente
V'(t)). Los patrones interferentes entre dos lneas consecutivas correspondientes a distintos campos
estn en fase y las interferencias vuelven a estar en fase cada cuatro lneas consecutivas dentro de un
mismo campo. El patrn interferente es algo ms visible que en el sistema NTSC debido a que la
imbricacin de los mximos y mnimos en el sentido vertical es algo ms lenta ya que las lneas
sucesivas de los dos campos tienen la misma fase. Para mejorar algo esta imbricacin, se decidi
modificar ligeramente la frecuencia portadora aadiendo al resultado de la ecuacin 3.88 la frecuencia
de imagen, que en el caso del PAL es de 25 Hz. Con ello, la frecuencia de la subportadora de color
pasa a ser:

L1A
L2A
L3A
L4A
L5A
L1B
L2B
L3B
L4B
Patrn interferente
Componente U(t)
Patrn interferente
Componente V(t)
L1A
L2A
L3A
L4A
L5A
L1B
L2B
L3B
L4B
Patrn interferente
Componente U(t)
Patrn interferente
Componente V(t)

V
L L
PAL
f
f f
k f + + +
4 2
) 1 2 ( (3.89)
Ahora, los patrones interferentes dentro de un mismo campo prcticamente no se han modificado
debido a que el incremento de frecuencia es muy pequeo. Sin embargo, el segundo campo quedar
con una fase invertida, por lo que la imbricacin de las interferencias mejora considerablemente. En la
figura 3.46 se muestran los patrones espaciales definitivos del PAL.

Fig. 3.46 Patrones de interferencia espacial definitivos del sistema PAL

La frecuencia definitiva se selecciona para un valor de k suficientemente elevado para que quede
situada sobre la parte alta del espectro de la seal de vdeo. En concreto, el valor seleccionado es
k=283, con lo que obtenemos una frecuencia definitiva de

Hz 25 75 , 283 +
L PAL
f f (3.90)

que sustituyendo por el valor de la frecuencia de lnea de 15625 Hz, obtenemos:

Hz 75 , 618 . 433 . 4
PAL
f (3.91)

valor que debe obtenerse con una precisin de entre +/- 1 Hz o +/- 5 Hz en funcin de la variante del
sistema PAL que se utilice en la modulacin de la seal.

El patrn interferente en el dominio del tiempo tambin va cambiando de forma parecida a como
ocurra en el sistema NTSC. Podemos determinar el nmero de ciclos de la frecuencia portadora que
habrn transcurrido despus de una imagen completa multiplicando la frecuencia portadora por el
tiempo que transcurre entre dos imgenes. El resultado es de

ciclos 75 , 177344
25
imagen portadora/ ciclos
PAL
f
(3.92)
L1A
L2A
L3A
L4A
L5A
L1B
L2B
L3B
L4B
Patrn interferente
Componente U(t)
Patrn interferente
Componente V(t)
L1A
L2A
L3A
L4A
L5A
L1B
L2B
L3B
L4B
Patrn interferente
Componente U(t)
Patrn interferente
Componente V(t)
Lo que significa que el patrn interferente se desplaza un cuarto de periodo en cada imagen. El patrn
se repetir, por tanto, cada cuatro imgenes completas, lo que tambin significa que la fase relativa
entre los sincronismos y la subportadora de color coincide y se repite con una periodicidad de cuatro
imgenes, o como suele expresarse habitualmente, con una periodicidad de ocho campos. En efecto, el
nmero de ciclos de la portadora de color despus de 8 campos es un entero:

ciclos 709379
25
4 campos 8 portadora/ ciclos
PAL
f
(3.93)

Esto significa que, si deseamos editar para corte la seal PAL, deberemos tener la precaucin de
realizar los cortes con un nmero de campos que sea mltiplo de 8. En caso contrario, deberemos
regenerar los sincronismos y la portadora de color. La insercin directa de cortes de imagen
fragmentando la secuencia de 8 campos producir la prdida de sincronismo de la subportadora de
croma con la eventual interrupcin de la informacin de color en la pantalla. Este efecto se observa a
menudo en videos domsticos cuando se interrumpe la grabacin de la escena y se continua
posteriormente con otra escena. Durante el inicio de la nueva secuencia se produce una prdida del
sincronismo de la seal de color que se traduce en que, momentneamente, la imagen se visualiza en
blanco y negro.

La secuencia de 8 campos de la seal PAL significa que durante el registro de seales para directo o
estudio, las distintas cmaras que intervienen deben estar sincronizadas con la misma portadora de
color, ya que, en caso contrario, la conmutacin entre distintas cmaras producira la prdida de
sincronismo de la seal de color. Para ello, es necesario proporcionar una seal de sincronismo global
para que todas las cmaras funcionen de forma sincrona. Las cmaras profesionales disponen de una
entrada especfica para los sincronismos. En aplicaciones semiprofesionales puede utilizarse una
cmara maestra que proporciona las seales de sincronismo al resto de cmaras con las que se realiza
el registro de la escena. En el NTSC existe un problema parecido, pero, en este caso, la frecuencia de
repeticin es de 4 campos.

A menudo la frecuencia de la subportadora se expresa en funcin de la frecuencia de lnea por lo que
su expresin queda como:

L L PAL
f f f
,
_
+ + 7516 , 283
625
1
4
3
283 (3.92)

Otro aspecto fundamental en la seleccin de la frecuencia portadora de la informacin de croma es,
como ya hemos analizado para el NTSC, las interferencias que pueden producirse como consecuencia
de las no linealidades del receptor y la aparicin de productos de intermodulacin entre la
subportadora de color y la subportadora de audio. En este caso, la subportadora de audio se sita sobre
los 5,5 MHz, con lo que el nico producto de intermodulacin que entra dentro de la banda de vdeo
es la diferencia entre la portadora de audio y de color. La frecuencia de modulacin de audio se ha
seleccionado para que esta diferencia de frecuencias produzca un patrn interferente con una
visibilidad muy reducida. La diferencia entre ambas frecuencias puede expresarse en funcin de la
frecuencia de lnea con una expresin muy parecida a la que se obtiene para la frecuencia
subportadora de color, por lo que los patrones interferentes son muy parecidos:

25 25 , 68 2484 , 68 006638125 , 1 5 , 5
L L PAL I
f f MHz f MHz f (3.93)

3.4.5 Espectro de la seal PAL
Desde el punto de vista espectral, la alternancia de signo de una de las componentes de color tiene una
incidencia importante en la imbricacin entre las componentes de luminancia y croma. Tal y como
hemos visto para el sistema NTSC, las seales de croma en banda base tienen una transformada de
Fourier parecida a la de la seal de luminancia y en la que la energa se concentra en los mltiplos de
la frecuencia de lnea. Las modulaciones en cuadratura de la componente U'(t) y V'(t) pueden
analizarse por separado. La componente U'(t) est multiplicada por una funcin seno que simplemente
desplaza el espectro de U'(t) a la frecuencia de la subportadora de color. El anlisis es anlogo al que
hemos realizado para el NTSC y no merece la pena repetirlo. Las componentes espectrales de U'(t)
quedan imbricadas con las de luminancia y se centran en las frecuencias

L L k
f k f f t 7516 , 283 (3.94)

En lo que respecta a la componente V'(t), el anlisis es algo ms complejo, puesto que debe tenerse en
cuenta la alternancia de signo de esta componente. Por lo tanto, es necesario separar el anlisis del
espectro de la seal V'(t) en banda base, con la alternancia de signo incluida, y posteriormente
introducir el efecto de la modulacin en la componente coseno.

Fig. 3.47 Construccin de la seal V'(t) con la alternancia de signo

En la figura 3.47 se muestran las formas de onda de la componente V'(t) y de la funcin que realiza la
alternancia de signo. Se trata de una funcin cuadrada con una frecuencia fundamental f
L
/2, por lo que
su espectro estar formado por una serie de rayas espectrales situadas en la frecuencia fundamental de
Seal V(t)
Alternancia de signo P(t)
+1
-1
2T
L
t
t
Seal P(t) V(t)
t
Seal V(t)
Alternancia de signo P(t)
+1
-1
2T
L
t
t
Seal P(t) V(t)
t
la seal y en sus mltiplos impares. La transformada de Fourier del producto entre la componente
V'(t) y esta seal cuadrada puede determinarse de forma muy simple. La componente V'(t) tiene una
serie de rayas espectrales situadas en la componente continua y en los mltiplos de la frecuencia de
lnea. El resultado de convolucionar este espectro con el de la seal cuadrada es que las nuevas
componentes espectrales se sitan sobre los mltiplos impares de la mitad de la frecuencia de lnea. El
espectro del producto de las dos seales en banda base se representa en la figura 3.48.

Fig. 3.48 Espectro de la seal +/-V'(t)

Ahora falta considerar el efecto de la modulacin mediante la portadora en coseno, que no es ms que
un desplazamiento a la frecuencia subportadora de color de todo el espectro de la seal +/- V'(t). Las
componentes espectrales quedan por tanto situadas sobre las frecuencias

2
) 1 2 ( 7516 , 283
L
L k
f
k f f + t (3.95)

Por tanto, en el sistema PAL, las componentes espectrales de la seal U'(t) y las de la seal V'(t) se
sitan en frecuencias distintas que estn imbricadas alrededor de las componentes de luminancia. En
la figura 3.49 se representa la situacin espectral de todas estas componentes en una parte del espectro
situado en las proximidades de la frecuencia subportadora de color.

Fig. 3.49 Imbricacin espectral entre las componentes de luminancia, U'(t) y V'(t)
f
L
/2 3f
L
/2 5f
L
/2
f
f
L
/2 3f
L
/2 5f
L
/2
f
283 f
L
284 f
L
285 f
L
286 f
L
282 f
L
281 f
L
U Y V
U Y V
U Y V U Y V U Y V U Y V
f
L
f
L
283,75 f
L 284,25 f
L
283 f
L
284 f
L
285 f
L
286 f
L
282 f
L
281 f
L
U Y V
U Y V
U Y V U Y V U Y V U Y V
f
L
f
L
283,75 f
L 284,25 f
L
Recordemos que las componentes de croma en banda base han sido filtradas paso bajo con un ancho
de banda de aproximadamente 1,3 MHz. Esto significa que al modularlas en cuadratura se desplazarn
a la frecuencia central de la subportadora de color, ocupando, tal y como se muestra en la figura 3.50,
un ancho de banda que se sita entre los 3,1 MHz y los 5,7 MHz. Este ancho de banda es excesivo
para su transmisin en los canales de radiodifusin terrena, por lo que, como en el caso del NTSC, se
aplica un filtrado de las componentes de croma que superan los 5 MHz, obteniendo una modulacin
con banda lateral superior parcialmente suprimida. Ya hemos analizado en el caso del NTSC que, para
recuperar las componentes de croma, pueden aplicarse las mismas estructuras de demodulacin que se
aplicaran cuando no se suprime la banda lateral superior. La diferencia es una reduccin de nivel en
las componentes de alta frecuencia que resulta poco visible para el usuario, pues no puede comparar
con el contenido original de la seal. Adems, en el caso del PAL, las dos componentes de croma
tienen el mismo ancho de banda, por lo que todos los filtros del demodulador pueden ser idnticos,
facilitando el equilibrio en el tratamiento de las dos componentes.

Fig. 3.50 Filtrado de la banda lateral superior para la transmisin de la seal PAL en canales de RF

3.4.6 Generacin de sincronismos en el sistema PAL
Hemos visto que es muy importante que la relacin entre la frecuencia subportadora de color y la
frecuencia de lnea sean exactas. Para garantizar que todas las seales de sincronismos de lnea,
campo e imagen estn perfectamente sincronizadas con la subportadora de color suele emplearse un
nico oscilador maestro, a partir del cual se obtienen el resto de referencias. El sistema maestro suele
ser el oscilador de subportadora de croma, del que se deriva una seal con una frecuencia doble a la
frecuencia de lnea. A partir de esta ltima seal pueden obtenerse, como hemos visto en la seccin
3.3.3, el resto de sincronismos.

En la figura 3.51 se muestra un diagrama esquemtico de cmo puede obtenerse una seal con una
frecuencia doble a la de lnea a partir de la frecuencia del oscilador de croma. El procedimiento es
algo ms complejo que en el NTSC debido a que la relacin 3.92 entre la subportadora de color y la
5,0 MHz 4,43 MHz
U, V U, V
Luminancia
frecuencia
Amplitud
5,0 MHz 4,43 MHz
U, V
U, V
Luminancia
frecuencia
Amplitud
3,1 MHz 5,7 MHz 5,0 MHz 4,43 MHz
U, V U, V
Luminancia
frecuencia
Amplitud
5,0 MHz 4,43 MHz
U, V
U, V
Luminancia
frecuencia
Amplitud
3,1 MHz 5,7 MHz
frecuencia de lnea es tambin ms compleja. El primer mezclador desplaza la frecuencia del oscilador
22 veces la frecuencia de lnea, por lo que la frecuencia de la seal en su salida es de (283,7516-22)f
L
.
Al aplicar los sucesivos multiplicadores y divisores de frecuencia indicados en la figura, obtenemos
una seal cuya frecuencia es el doble de la frecuencia de lnea. A partir de esta seal podemos obtener
la frecuencia de lnea (dividiendo por 2), la frecuencia de campo (dividiendo por 625) y la frecuencia
de imagen (dividiendo por 2x625).

Fig. 3.51 Generacin de los sincronismos a partir de la subportadora de color

3.4.7 La seal de salva en el sistema PAL
La seal de salva de color tiene en el sistema PAL una doble funcin. Por una parte, igual que en el
NTSC, permite que el receptor se sincronice con la portadora de color utilizada en el transmisor. La
segunda funcin de la seal de salva es proporcionar informacin precisa sobre el signo en la
componente V'(t) con el que se recibe cada lnea. Para ello, la seal de salva incluye unos pocos
periodos de la subportadora de color con dos defasajes distintos en funcin del tipo de lneas. En el
caso de lneas NTSC, la salva se transmite con un desfasaje de 135 respecto a la subportadora
utilizada en el transmisor. En el caso de lneas del tipo PAL el desfasaje es de 135. Las dos
posibilidades se muestran en la figura 3.52.

Fig. 3.52 Fase de la salva de color para identificar las lneas NTSC y PAL

Los dos posibles defasajes se generan en el transmisor utilizando las mismas seales que se aplican a
los moduladores de las componentes de croma. Para ello, como ya hemos visto en el sistema NTSC,
cada una de las seales moduladoras se ponderan por unos coeficientes y se combinan para obtener los
defasajes deseados de 135 y 135. Estas seales se insertan en la seal de vdeo compuesto en el
Div 19 Div. 31 Div. 101 x8 x625 Div 22
f
PAL
2 f
L
Div 19 Div. 31 Div. 101 x8 x625 Div 22
f
PAL
2 f
L
Fase de la subportadora
de color usada en el
transmisor.
Fase salva
lneas
NTSC
Fase salva
lneas PAL
-135
135
Fase de la subportadora
de color usada en el
transmisor.
Fase salva
lneas
NTSC
Fase salva
lneas PAL
-135
135
prtico posterior del sincronismo de lnea, de modo anlogo a como se realizaba en el sistema NTSC.
La insercin de la fase adecuada debe concordar con el signo con el que se modula la componente
V'(t).

Las caractersticas de amplitud y posicin temporal de la salva en el sistema PAL son parecidas a las
que hemos descrito para el sistema NTSC, y que han sido representadas en la figura 3.19.

Para sincronizar el oscilador del receptor con la subportadora de color suele utilizarse un circuito que
responde al diagrama de bloques de la figura 3.53. La seal de salva y la seal procedente del
oscilador local se comparan durante el periodo de tiempo en que se transmite la salva (puerta de salva)
y cuya seal de control se obtiene a partir de las seales de sincronismo de lnea. El bucle de control
del VCO es un PLL convencional en el que la constante de tiempo del integrador es lo
suficientemente grande como para que el oscilador slo pueda adaptarse a la fase de la seal de salva
despus de varias lneas. El sistema slo acta de forma realimentada durante los instantes en los que
est presente la salva de color. El resto del tiempo el oscilador funciona de forma autnoma. Como la
seal de salva se transmite con cambios de fase de 135 y 135 en lneas sucesivas, el oscilador local
converge al valor de fase medio que se est recibiendo, es decir, 180. Por tanto, el circuito de
sincronizacin con la portadora de color es idntico al que se utiliza en el sistema NTSC, con la
salvedad de que debe garantizarse que las reacciones del sistema sean lo suficientemente lentas como
para integrar los cambios sucesivos de fase de la salva.

Fig. 3.53 Circuito de sincronizacin del receptor con la subportadora de color

Una vez obtenida la sincronizacin del oscilador local con la subportadora de color de la seal
recibida, es relativamente simple determinar la fase concreta con la que se recibe la seal de salva para
actuar sobre el signo de los demoduladores del decodificador de croma. Para ello, basta con realizar
una mezcla entre la seal de salva que se est recibiendo y la subportadora de color que hemos
regenerado, aplicando un filtro paso bajo a la seal producto resultante. El signo de la seal en la
salida del filtro indicar si se trata de una lnea NTSC o una lnea PAL. Existen otras variantes
tecnolgicas para regenerar la subportadora de color y para determinar el signo empleado en cada una
de las lneas. Las variantes que hemos descrito son las ms simples desde el punto de vista conceptual
y se utilizan en un buen nmero de receptores.
Puerta de
Salva
Comparador
fase
Integrador VCO
Inversor
Puerta
Salva
Salva
Sincronismo
Prtico
Posterior
Subportadora
de color
Puerta de
Salva
Comparador
fase
Integrador VCO
Inversor
Puerta
Salva
Salva
Sincronismo
Prtico
Posterior
Subportadora
de color
3.4.8 Diagramas de bloques de un codificador y un decodificador PAL
En la figura 3.54 se muestra, a modo de resumen, un diagrama global de todos los elementos que
intervienen en la confeccin de la seal de vdeo en el sistema PAL. La mayor parte de los elementos
ya han sido descritos con detalle en apartados anteriores. La seal P(t) que se deriva del generador de
sincronismos determina el signo que debe aplicarse a la componente V'(t) y que debe estar
sincronizado con la seal que se enva como referencia de fase. Los retardos que se indican en la
figura suelen obtenerse, como ya hemos descrito, mediante combinaciones lineales entre las dos
portadoras en cuadratura. En la figura no se muestra la insercin de la seal de audio ni se indica el
filtrado paso bajo que se aplica a las componentes de croma para obtener la modulacin en banda
lateral superior vestigial. Normalmente este filtrado se realiza en la etapa previa a los moduladores de
radiofrecuencia.

Fig. 3.54 Diagrama de bloques general de un codificador de vdeo en el sistema PAL

Por lo que respecta al decodificador, puede utilizarse el mismo diagrama de bloques que hemos
comentado al describir el sistema NTSC y que se ha representado en la figura 3.31. Las variantes ms
significativas del sistema PAL respecto al NTSC son la estructura del propio decodificador de croma
que requiere, adems de las dos componentes de la subportadora de color en cuadratura, la seal P(t)
para determinar en que lneas se ha realizado la inversin en la componente V'(t).

Los circuitos de regeneracin de sincronismos son tambin distintos en los dos sistemas de
transmisin. La separacin de las componentes de luminancia y croma puede realizarse mediante
filtros del tipo muesca o filtros en peine. Esta ltima estrategia puede usarse en el sistema PAL para
separar las componentes U'(t) y V'(t) antes de entrar al demodulador de cromo. En efecto, hemos visto
que en el caso del PAL las componentes de croma moduladas quedan situadas en posiciones
espectrales distintas, por lo que pueden ser separadas mediante el uso de filtros en peine que
seleccionen cada una de ellas de forma individual. Esta opcin garantiza una mejor separacin entre
las dos componentes de color y la desaparicin prcticamente total de los efectos de cruce de color
(cross-color).
Cmara
R
G
B
1 /
1 /
1 /
Matriz
RGB
a
YUV
1,3
1,3
T1
R
G
B
U
V
Ym
Uf
Vf
Subportadora
color
Sin(2f t)
+/ -
/2
Puerta
salva
Video
Compuesto
Generador
sincronismos
Y
+/ -
135
Sincronismos
P(t)
Cmara Cmara
R
G
B
1 /
1 /
1 /
Matriz
RGB
a
YUV
1,3
1,3
T1
R
G
B
U
V
Ym
Uf
Vf
Subportadora
color
Sin(2f t)
+/ -
/2
Puerta
salva
Video
Compuesto
Generador
sincronismos
Y
+/ -
135
Sincronismos
P(t)
3.5 Normas utilizadas en la transmisin de seales de TV en color analgicas
A pesar de que slo existen tres sistemas bsicos para la obtencin de seales en vdeo en color
compatibles, el ITU-R (anteriormente CCIR) establece distintas normas en las que se especifican el
nmero de lneas, los anchos de banda de los canales de radiofrecuencia, el ancho de banda de la
seal, la separacin entre la portadora de audio y vdeo, el tipo de modulacin que se aplica a la seal
de audio, etc. Estas normas se denominan con las letras A a N y sus caractersticas bsicas se detallan
en la tabla 3.2.

Tabla 3.2 Normas de seales de televisin analgicas para la radiodifusin terrestre

Norma Nmero de
lneas
Ancho de
banda canal
(MHz)
Ancho de
banda de
vdeo (MHz)
Portadora
de sonido
respecto a
imagen
(MHz)
Banda
Lateral
Vestigial
(MHz)
Modulacin
de vdeo
Modulacin
de audio
A

405 5 3 -3,5 0,75 Pos. AM
B 625 7 5 +5,5
(+5,742)
0,75 Neg. FM
C

625 7 5 +5,5 0,75 Pos. AM
D

625 8 6 +6,5 0,75 Neg. FM
E

819 14 10 +11,15 2 Pos. AM
F

819 7 5 +5,5 0,75 Pos. AM
G

625 8 5 +5,5 0,75 Neg. FM
H 625 8 5 +5,5
(+5,742)
1,25 Neg. FM
I

625 8 5,5 +6 1,25 Neg. FM
J

625 8 6 +6,5 0,75 Neg. FM
K

625 8 6 +6,5 1,25 Neg. FM
L

625 8 6 +6,5 1,25 Pos. AM
M

525 6 4,2 +4,5 0,75 Neg. FM
N

625 6 4,2 +4,5 0,75 Neg. FM
En principio las normas anteriores son independientes del sistema de codificacin del color y slo
establecen los criterios de anchos de banda asignados al vdeo, separacin entre canales y formas de
modulacin de la informacin de audio y vdeo. As, en Marruecos utilizan la norma H para la
transmisin de seales en sistema SECAM en la banda de UHF, mientras que en Malta se utiliza la
misma norma H, pero con el sistema de codificacin de color PAL. No obstante, algunas normas slo
pueden utilizarse con un sistema de codificacin del color. Uno de estos ejemplos es la norma M que
se utiliza en Estados Unidos y Japn.

En Espaa se utiliza la norma G para la transmisin de seales codificadas en PAL en la banda de
UHF. Hasta hace poco tiempo tambin se transmita en la banda de VHF con la norma B, pero
actualmente ya ha desaparecido. Comentemos con algn detalle los parmetros especificados en la
norma G, cuya interpretacin puede generalizarse fcilmente para el resto de normas.

Se trata de un sistema de 625 lneas (que puede ser usado para transmitir PAL o SECAM, as en
Grecia tambin se usa la norma G pero la seal est codificada en SECAM). El ancho de banda
asignado a un canal de televisin, que incluye el vdeo, el audio y las guardas, es de 8 MHz. Esto
significa que el resto de canales en la misma banda de frecuencias estarn separados por 8 MHz.

Por otra parte, el ancho de banda de la seal de vdeo en el sistema G es de 5 MHz. Esto significa que
antes de realizar la modulacin de la seal de vdeo a radiofrecuencia se utiliza un filtro paso bajo de 5
MHz. Este filtro es el que elimina la parte de la informacin de luminancia que excede los 5 MHz de
ancho de banda y el que elimina parte de las bandas laterales superiores de la informacin de croma.

La portadora de audio se sita a 5,5 MHz por encima de la portadora de vdeo y est modulada en FM.
La insercin de la seal de audio se realiza, habitualmente, cuando la seal de vdeo en banda base ya
ha sido previamente filtrada por el filtro de 5 MHz. A la portadora de audio se le asigna una potencia
que est situada unos 10 dB's por debajo de la potencia de la portadora de vdeo.

La seal de vdeo se modula en AM con banda lateral inferior vestigial. Esto significa que, una vez
modulada la seal a la frecuencia de transmisin, se aplica un filtro paso banda que elimina parte de la
banda lateral inferior. En el sistema G, se permite que el ancho de banda asignado a esta banda
inferior sea de 0,75 MHz. Esto supone que el ancho total del vdeo es de 5,75 MHz (5MHz de la
banda lateral superior y 0,75 MHz de la inferior). La modulacin de la seal de vdeo es negativa, lo
que significa que la seal de vdeo compuesto se invierte (impulsos de sincronismo positivos y
luminancia negativa) antes de enviarla al modulador de AM. En la figura 4.55 se representa un
diagrama esquemtico de cmo se sitan las portadoras de vdeo, de croma y de audio analgico en la
banda de 8 MHz asignada a cada canal. En esta figura tambin se indica la portadora de audio digital
NICAM, que est situada a 5,85 MHz de la portadora de vdeo y que se transmite con una potencia de
20 dB por debajo. La seal NICAM es un sistema de audio digital estereofnico que se introdujo a
mediados de la dcada de los 80 para proporcionar sonido de alta calidad. El NICAM admite la
radiodifusin de programas estereofnicos o la transmisin de programas en dual (canal principal
monofnico ms un canal auxiliar con versiones originales o comentarios). Tambin existe una
alternativa analgica al NICAM, denominada Zweiton, que se utiliza habitualmente por algunas
cadenas en Espaa, en la que se transmite un nico canal auxiliar que puede utilizarse para decodificar
una seal estreo o la versin original del programa.


Fig. 3.55 Distribucin de portadoras y niveles en un canal de 8 MHz

En la tabla 3.3 se indican las normas y sistemas de color utilizados en diferentes pases. La lista
incluye las normas utilizadas tanto en las bandas de VHF (actualmente en fase de abandono en un
gran nmero de pases; en Espaa, esta banda ya no est en uso desde Noviembre de 1999) como
UHF. La lista no es completa y slo incluye algunos pases representativos de cada uno de los
sistemas y normas.

Tabla 3.3 Lista de pases y normas de TV

Pais VHF UHF Sistema Pas VHF UHF Sistema
Argentina N N PAL Korea M NTSC
Australia B H PAL Luxemburg C L PAL/SEC
Austria B G PAL Mxico M M NTSC
Blgica B H PAL Mnaco E L SECAM
Bulgaria D K SECAM Marruecos B H SECAM
China D K PAL Noruega B G PAL
Chequia D K SECAM Polonia D K SECAM
Dinamarca B G PAL Portugal B G PAL
Egipto B G,H SECAM Suecia B G PAL
Francia E/L L SECAM Espaa B G PAL
Alemania B G PAL Suiza B G PAL
Gibraltar B H PAL Turqua B G PAL
Gran Bret. I I PAL USA M M NTSC
Italia B G PAL Malta B H PAL
J apon M M NTSC Tnez B G SECAM
8 MHz
Pvideo
1,25 MHz
Pcolor
4,43 MHz
5,5 MHz
Paudio
PNicam
5,85 MHz
10
16
20 dB
8 MHz
Pvideo
1,25 MHz
Pcolor
4,43 MHz
5,5 MHz
Paudio
PNicam
5,85 MHz
10
16
20 dB

Actualmente, las bandas definidas para la radiodifusin terrestre de seales de televisin o audio estn
distribuidas en unos mrgenes de frecuencias denominados bandas y que se definen como:

Onda Larga (OL): 150-285 KHz
Onda Media (OM): 535-1605 KHz
Onda Corta (OC): 3,95-26,1 MHz
TV Banda I (VHF): 41-68 MHz, ancho de canal de 7 MHz
Banda II(VHF-FM): 87,5-108 MHz, ancho de canal de 100 KHz (emisoras audio FM
comercial)
TV Banda III(VHF): 174-223 MHz, ancho de banda de canal de 7 MHz.
TV Banda IV(UHF): 470-606 MHz, ancho de banda de canal de 8 MHz.
TV Banda V(UHF): 606-854 MHz, ancho de banda de canal de 8 MHz.

Las bandas que actualmente se utilizan en Espaa son la IV y la V, donde estn definidos hasta un
total de 49 canales de televisin, que se numeran del 21 al 69. En la tabla siguiente se proporcionan
los mrgenes de frecuencias, la frecuencia portadora de vdeo, de croma y de sonido de algunos de
estos canales. Evidentemente, pueden obtenerse formulas cerradas que determinen estas frecuencias
en funcin de los canales.

Tabla 3.4 Tablas de canales de frecuencia

Banda Canal Frecuencia
Canal (MHz)
Portadora
Vdeo
Portadora
Sonido
Subportadora
color
IV 34 574-582 575,25 580,75 579,68
IV 35 582-590 583,25 588,75 587,68
IV 36 590-598 591,25 596,75 595,68
IV 37 598-606 599,25 604,75 603,68
V 38 606-614 607,25 612,75 611,68
V 39 614-622 615,25 620,75 619,68
V 40 622-630 623,25 628,75 627,68
V 41 630-638 631,25 636,75 635,68
V 42 638-646 639,25 644,75 643,68
V 43 646-654 647,25 652,75 651,68

4 Televisin digital 273

4 Televisin digital
4.1 Introduccin
La transmisin de seales de televisin en formato digital ha supuesto un cambio significativo tanto
en el mbito tecnolgico como en lo que respecta a la produccin de programas y servicios que se
ofrecen al espectador. Los modernos canales digitales ofrecen multitud de programas en un mismo
paquete de televisin y han introducido nuevos conceptos como el pago por canal (pay per channel),
el pago por programa (pay per view), la reemisin peridica de los programas en diferentes franjas
horarias, canales temticos, canales gua, etc. Desde el punto de vista tecnolgico, la principal ventaja
de la televisin digital es que la codificacin de la informacin de audio y vdeo puede transmitirse en
un ancho de banda menor que el empleado por los sistemas analgicos. Junto con la informacin
convencional pueden transmitirse datos de tipo texto sobre el programa (subttulos o resumen),
codificar la seal de audio en estreo o multicanal, codificar el programa en varios idiomas. Adems,
la calidad de imagen y sonido es superior, debido a que la naturaleza digital de las seales les
proporciona cierto nivel de proteccin frente al ruido.

El objetivo de este captulo es proporcionar los principios matemticos y tecnolgicos sobre los que se
basa la televisin digital actual. En el proceso de transmisin y recepcin de la televisin digital
intervienen un gran nmero de subsistemas entre los que destacan:

1) Sistemas de digitalizacin de la seal de audio y vdeo. Entenderemos que se trata de
sistemas que digitalizan ambas seales a partir de seales analgicas y que obtienen un
formato PCM convencional sin comprimir. En el caso de la seal de audio, el formato
PCM es parecido al del sistema Compact Disc, con una frecuencia de muestreo de
44,1KHz por canal y 16 bits por muestra. Para la seal de vdeo el formato digital de
partida suele ser alguna variante del formato ITU 601 (normalmente 4:2:2 o 4:2:0).

2) Sistemas de compresin / descompresin de la informacin. La seal de vdeo en
formato ITU-601 tiene un gran volumen de datos que hacen inviable su transmisin
directa. La compresin de esta informacin es la etapa ms importante en la transmisin
de vdeo digital, ya que determina la calidad final de las imgenes que se reproducen y
establece la eficiencia espectral del sistema de transmisin. Actualmente, el formato de
codificacin utilizado por la mayora de proveedores es el MPEG-2, tanto en el caso de
audio como en el de vdeo, y se prev que permanezca en el mercado durante un periodo
prolongado. Este estndar de codificacin combina distintas estrategias, basadas tanto en
la redundancia estadstica de los datos como en las caractersticas de percepcin del
sistema visual humano. Est especficamente diseado para proporcionar una calidad de
la seal de vdeo suficiente para su transmisin como seal de televisin. El anlisis de
la seal para su codificacin en tiempo real es extremadamente complejo y se requiere
de un hardware dedicado a estas funciones cuyo precio es relativamente elevado. La
decodificacin se realiza sin que el receptor deba tomar decisiones relevantes, por lo que
se trata de sistemas ms simples y relativamente econmicos. La tasa de bits final que se
consigue depende del tipo de seal de vdeo, pudiendo estar entre 2 Mbits/s o 9Mbits/s,
lo que significa una compresin que oscila entre un factor de 15 a 40 respecto al formato
4:2:0.

3) Multiplexacin / Demultiplexacin de seales de vdeo y audio y varios programas. La
trama de bits asociada a un canal puede estar formada por varios programas, cada uno de
los cuales est constituido por una fuente de vdeo y uno o varios canales de audio y
datos. La informacin de audio y datos debe intercalarse entre la informacin de vdeo
para poder mantener una sincrona perfecta durante la reproduccin. Las
especificaciones y normativas para realizar esta multiplexacin de las seales estn
especificadas en el estndar MPEG2 Sistemas.

4) Transmisin / Recepcin de las seales. La transmisin de las seales de televisin
digitales est normalizada (en Europa y otras reas geogrficas) por la organizacin
DVB (Digital Video Broadcasting). En pases como Estados Unidos o Japn, donde el
volumen de negocio vinculado a la televisin es muy importante, han aparecido sistemas
propietarios ofrecidos por las plataformas productoras en los que se modifica tanto la
codificacin de la seal como, sobre todo, su formato de transmisin. El DVB cubre toda
la normativa de transmisin por satlite, cable y terrena y establece los procedimientos
utilizados para el acceso a los programas, cdigos de proteccin, sistemas de
modulacin, etc.

De todos estos aspectos nos concentraremos fundamentalmente en el proceso de compresin y
descompresin de la seal de vdeo, aunque tambin revisaremos brevemente los conceptos de
multiplexacin de vdeo y audio y veremos los principios de los sistemas de DVB. No se considerar
la codificacin de la seal de audio ni los subsistemas de conversin entre los formatos analgicos y
digitales.

En la figura 4.1 se representan las distintas etapas conceptuales que intervienen en el proceso de
codificacin de la seal de vdeo digital. La codificacin de fuente consiste en extraer toda la
redundancia posible en la seal, reduciendo el nmero de bits con el que se representa la informacin
sin que ello suponga una prdida aparente de calidad para el sistema visual humano. Los mtodos y
estrategias empleados para la codificacin de fuente son muy variados, y resulta difcil establecer un
procedimiento de compresin ptimo puesto que los resultados dependen, en gran medida, de las
caractersticas de las seales. Generalmente los mtodos de compresin avanzados combinan distintas
estrategias simultneamente para codificar la seal. La multiplexacin de distintas seales bsicas es
necesaria para formar una nica trama binaria que transporte la informacin y contenidos de todo el
canal definido por la plataforma operadora. Por otra parte, la codificacin de canal se utiliza para
adecuar la forma de onda de las seales a las caractersticas del canal. En esta etapa se introducen
cdigos de proteccin frente a errores, cdigos de encriptacin de la informacin y se adecua la forma
de onda de las seales para que puedan ser directamente utilizadas por la etapa de modulacin o
transmisin. Esta ltima etapa se encarga de adaptar los datos a las caractersticas del medio de
transmisin, para garantizar una correcta recepcin de las seales. El medio de transmisin condiciona
el tipo de modulacin que se utiliza y la codificacin de canal. As, en un medio como el cable, los
sistemas de deteccin y correccin de errores pueden ser ms simples que en el caso de la
comunicacin va satlite, debido a que la relacin seal a ruido es mucho mayor y, por tanto, se
reduce la probabilidad de error.

Fig. 4.1 Etapas en la codificacin y transmisin de una seal de vdeo digital

Los procedimientos utilizados para la codificacin de la seal de vdeo en MPEG2 son bastante
complejos y algunos detalles concretos escapan de los propsitos de este texto. Lo mismo ocurre
respecto a algunos sistemas de modulacin y acceso condicional utilizados en la radiodifusin de la
seal. Nuestro objetivo es presentar los conceptos de forma progresiva y que el lector comprenda las
ideas generales que subyacen en el sistema de televisin digital para que domine sus principios y
conozca sus limitaciones. Por ello, se omiten algunos detalles y formalismos matemticos que no
resultan cruciales en la comprensin y filosofa del sistema.

En la primera parte de este captulo se introduce la necesidad de comprimir la seal de vdeo digital
para posibilitar su transmisin. Se presentan los conceptos bsicos de codificacin por diferencias y
redundancia estadstica de los datos. Ambos procedimientos se utilizan en algunos mdulos de la
codificacin de vdeo mediante MPEG2. Posteriormente, se describe la codificacin de imgenes
estacionarias en formato JPEG. La filosofa del sistema JPEG resulta fundamental para comprender la
codificacin de imgenes en movimiento y es utilizada en el formato MPEG, con ligeras variantes,
para codificar algunos fotogramas de la seal de vdeo. En la siguiente seccin se desarrollan los
principios del formato MPEG-1, precursor del MPEG-2 en aplicaciones multimedia, y con el que
comparten muchos aspectos comunes. Una vez definido el formato MPEG1, resulta bastante simple
concentrarse en los aspectos adicionales que proporciona el MPEG2 y que resultan necesarios para
obtener una calidad suficiente para su aceptacin como seal de televisin. Tambin se comentan
brevemente las diferencias entre estos formatos de codificacin de vdeo y los formatos H-261 y H-
263 utilizados en la transmisin de seales de videoconferencia mediante lneas telefnicas o de datos.

En las ltimas secciones se desarrollan algunos aspectos relativos a la multiplexacin de seales de
audio, vdeo y datos y se establecen los principios de transmisin de las seales de televisin digital
por cable, satlite o redes terrenas de acuerdo con la normativa DVB, aportando algunos detalles sobre
la codificacin de canal de las seales y los mtodos de acceso condicional a los programas.
Codificacin
Fuente
Codificacin
Fuente
Multiplex
Multiplex
Codificacin
Canal
Codificacin
Canal
Transmisin
Transmisin
Otras fuentes
Codificacin
Fuente
Codificacin
Fuente
Multiplex
Multiplex
Codificacin
Canal
Codificacin
Canal
Transmisin
Transmisin
Otras fuentes
4.2 Compresin de imgenes: necesidad y conceptos bsicos
La digitalizacin de seales analgicas aporta considerables ventajas entre las que pueden citarse la
proteccin frente a ruidos, la facilidad para encriptar las seales, la posibilidad de procesar
digitalmente los datos, etc. No obstante, por lo general, la digitalizacin directa supone un aumento
considerable del ancho de banda. En el caso de seales de vdeo analgicas, hemos visto que un ancho
de banda de 5 MHz resulta suficiente para mantener una resolucin espacial y tasa de refresco de
imgenes aceptable. En cambio, la digitalizacin de la secuencia de vdeo en un formato no
comprimido, como el 4:2:0, requiere transmitir una tasa de bits de 124,4 10
6
bits/s (vanse los clculos
en el captulo. 1). Evidentemente, aunque se usen cdigos y modulaciones digitales de gran eficiencia
espectral, el ancho de banda necesario para transmitir esta tasa de bits es muy superior a los 5 MHz
que requiere el sistema analgico. Por esta razn, los formatos digitales derivados del ITU 601 se han
mantenido como estndares digitales para el intercambio de informacin entre equipos y terminales en
estudios de grabacin y produccin de vdeo y no se han extendido a sistemas de radiodifusin de la
seal de vdeo.

Tomando estos formatos digitales como punto de partida, es necesario aplicar un proceso de reduccin
de la tasa de bits que permita la radiodifusin de las seales sin una prdida aparente de calidad. Un
sistema de compresin de informacin suele estar formado por dos etapas que se ilustran en la figura
4.2. La transformacin de los datos es un procedimiento genrico que se utiliza para representar la
informacin en una forma alternativa y en la que, en principio, resulta ms evidente la redundancia
existente en los datos originales. Es necesario que esta transformacin sea invertible, es decir, que a
partir de los datos transformados podamos recuperar exactamente la informacin original.

Consideremos como ejemplo la aplicacin de una transformada de Fourier a las seales que
representan la informacin de un fragmento de audio. Es posible que resulte ms eficiente codificar
los datos resultantes de esta transformacin que los datos originales. En efecto, en el dominio
transformado de Fourier es ms simple identificar las regiones espectrales que tienen una energa por
debajo del umbral de audicin, o analizar las bandas que resultarn enmascaradas por otras seales y
que por lo tanto no seran audibles. Si este anlisis de la seal es factible, no tendr sentido codificar
toda aquella informacin que el sistema auditivo humano es incapaz de escuchar y resulta ms
rentable dedicar los bits a las zonas audibles. El resultado final es que en este dominio transformado
podemos codificar la informacin de forma ms eficaz. No obstante, debemos recordar que al final de
la cadena de codificacin / decodificacin, deben presentarse los datos en el mismo formato de
entrada para que puedan ser correctamente interpretados por el sistema auditivo. Esto significa que
deberemos aplicar la transformacin inversa sobre los datos codificados para devolverlos a su dominio
de representacin original.

La transformacin de los datos puede ser de naturaleza muy distinta, o incluso, no resultar necesario si
existen procedimientos eficientes para la compresin directa. En algunos casos, es posible que existan
varias transformaciones en paralelo o en serie y que la codificacin se realice tomando datos parciales
de cada una de ellas. Veremos que este es el caso del sistema MPEG-2, en el cual se combinan
distintas estrategias de codificacin en funcin del tipo de informacin y de las caractersticas de la
secuencia de vdeo. En cualquier caso, es fundamental mantener el esquema simplificado de la figura
4.2 en mente, teniendo siempre en cuenta que es necesario, independientemente de lo complejas que
sean las transformaciones que utilizamos para optimizar la codificacin, disponer de mtodos que
permitan restablecer la seal codificada al dominio original.

Fig. 4.2 Proceso general de codificacin y decodificacin de la informacin

La compresin puede ser con prdidas (lossy) o sin prdidas (lossless) en funcin de si la informacin
que se recupera coincide exactamente con la original o es slo una aproximacin. Los mtodos de
codificacin sin prdidas se utilizan sobre todo en aplicaciones de codificacin de datos binarios de
aplicaciones informticas en los que es absolutamente necesario recuperar la informacin original.
Los formatos ms populares son el zip y el arj. En tratamiento de imgenes los mtodos de
compresin sin prdidas encuentran su aplicacin en la codificacin de imgenes mdicas o cientficas
en las que puede resultar crtico la prdida de parte de la informacin. El formato JPEG dispone de
una versin de codificacin sin prdidas que suele emplearse en estas aplicaciones.

La compresin con prdidas es la ms habitual en la codificacin de seales de vdeo y audio.
Evidentemente, las prdidas son tolerables siempre que la calidad de las seales decodificadas sean
aceptables. El principio general sobre el que se sustenta la codificacin con prdidas es que no resulta
necesario codificar aquellas componentes de la informacin que no son observables por los sistemas
de percepcin humana. Por lo tanto, estos mtodos se fundamentan en las caractersticas psico-
fisilgicas de los sistemas auditivo y visual, que son, en ltima instancia, los que deben evaluar la
calidad del algoritmo de compresin. Por ello, es fundamental comprender las limitaciones y
caractersticas de estos sistemas de percepcin para disear codificadores en los que las prdidas de
informacin resulten poco evidentes o incluso inapreciables. La principal ventaja de estas estrategias
de codificacin es que consiguen unos factores de compresin muy superiores a los que se obtienen
con los mtodos sin prdidas. Adems, suelen ser mtodos escalables con la aplicacin, es decir, el
grado de prdida de calidad que se tolera depende del mbito al que se destine el codificador. As, la
calidad que se exige en una aplicacin de vdeo en directo para internet es muy inferior a la que se
exige para la radiodifusin de televisin. Anlogamente, un codificador de vdeo para aplicaciones
multimedia (MPEG-1) deber realizar una compresin mucho mayor que un codificador para
aplicaciones de televisin (MPEG-2), ya que las tasas de transferencia de bits que admite un CD-
ROM son mucho menores que las que admiten los canales de televisin.

Transformacin
datos
Transformacin
datos
Codificacin
Codificacin
Transformacin
Inversa
datos
Transformacin
Inversa
datos
Decodificacin
Decodificacin
Transformacin
datos
Transformacin
datos
Codificacin
Codificacin
Transformacin
Inversa
datos
Transformacin
Inversa
datos
Decodificacin
Decodificacin
4.2 Un ejemplo: la codificacin diferencial
En este apartado consideraremos uno de los sistemas ms simples e intuitivos que se emplean en la
codificacin de seales de audio y vdeo. Este mtodo de compresin se utiliza en los formatos JPEG
y MPEG para codificar alguno de los coeficientes transformados. Utilizaremos estas ideas para ilustrar
los conceptos de codificacin con prdidas y sin prdidas, as como la transformacin de las seales.
Adems, nos permitir introducir de forma natural los mtodos de compresin basados en el anlisis
estadstico de los mensajes.

El esquema bsico de un codificador diferencial se representa en la figura 4.3. En nuestro caso, la
seal de entrada puede ser la luminancia de una lnea de la imagen. La transformacin utilizada
consiste simplemente en calcular la diferencia entre dos muestras consecutivas. En principio, desde un
punto de vista intuitivo, esta transformacin parece natural debido a la redundancia que existe entre
dos elementos consecutivos. Es de esperar que, una vez realizada la transformacin, la mayora de
muestras estarn situadas en un entorno prximo al cero, por lo que, seguramente, podemos encontrar
compresores que aprovechando esta caracterstica de la seal reduzcan la tasa de bits necesaria para su
codificacin.

Ntese que la transformacin que hemos utilizado es invertible y que podemos recuperar de forma
exacta la informacin original a partir de los resultados transformados. Analticamente, la
transformacin diferencial viene dada por:

[ ] [ ] [ ] 1 = n x n x n y (4.1)

mientras que la transformacin inversa se obtiene como:

[ ] [ ] [ ] 1 + = n z n y n z (4.2)

Puede verificarse que una transformacin es inversa de la otra sin ms que aplicar las ecuaciones
anteriores a las tablas de valores que se muestran en la figura 4.3.

Fig. 4.3 Transformacin diferencial
Z
-1
+
x[0]
x[1]
x[2]
x[3]
x[4]
x[N-2]
x[N-1]
Linea
Seal TV
x[1]-x[0]
x[2]-x[1]
x[3]-x[2]
x[4]-x[3]
x[N-2]-x[N-3]
x[N-1]-x[N-2]
Transformacin
+
-
Z
-1
+
+
+
Transformacin
Inversa
Original
x[0]
Transformada
Z
-1
+
x[0]
x[1]
x[2]
x[3]
x[4]
x[N-2]
x[N-1]
Linea
Seal TV
x[1]-x[0]
x[2]-x[1]
x[3]-x[2]
x[4]-x[3]
x[N-2]-x[N-3]
x[N-1]-x[N-2]
x[3]-x[2]
x[4]-x[3]
x[N-2]-x[N-3]
x[N-1]-x[N-2]
Transformacin
+
-
Z
-1
+
+
+
Transformacin
Inversa
Z
-1
+
+
+
Transformacin
Inversa
Original
x[0]
Transformada
x[0] x[0]
Transformada
La transformacin diferencial puede considerarse un caso particular de la prediccin de muestras. Los
predictores lineales son uno de los mtodos ms utilizados para la codificacin de seales de audio y
vdeo y se basan en estimar el valor de la muestra actual a partir de una combinacin lineal de las
muestras anteriores. La filosofa general de un predictor se ilustra en la figura 4.4 donde se indica la
transformacin directa y la inversa. Si la prediccin de la muestra es correcta, la seal que se codifica
es el error de prediccin que, en principio, tendr un valor prximo a cero, por lo que podr
codificarse de forma bastante eficiente. La ecuacin que rige el filtro predictor es:

[ ] [ ]
=
=
P
k
k
k n x a n x
1
~
(4.3)

donde P es el orden del predictor (nmero de muestras anteriores que se utilizan para realizar la
prediccin de la muestra actual) y a
k
son los coeficientes de prediccin. Los coeficientes de prediccin
pueden calcularse en base a las caractersticas estadsticas de la seal.

Fig, 4.4 Esquema general de una codificacin por prediccin de muestras

La codificacin diferencial que estamos analizando puede considerarse como un predictor de orden 1,
con un coeficiente de prediccin igual a la unidad. En apartados posteriores veremos algunos casos
particulares de predictores aplicados a la codificacin de imgenes donde se utilizan no slo la
muestras anteriores de la lnea actual, sino tambin las muestras de otras lneas.

Los resultados de aplicar el codificador diferencial a una lnea de la imagen se muestran en la figura
4.5, donde se representa el nivel de gris de una lnea original y los valores resultantes despus de la
transformacin. Obsrvese como los valores transformados se concentran alrededor del cero y que
nicamente en los contornos de la imagen se producen niveles significativos en la seal diferencia.

En la figura 4.6 se representan los resultados del codificador diferencial aplicados a una imagen en
blanco y negro. La imagen original est codificada con 256 niveles de gris (8 bits por pixel) y se
representa asignando el negro al nivel 0 y el blanco al nivel 255. La imagen diferencia se ha
representado tomando el nivel 0 como un gris neutro. Los valores de seal negativos son ms oscuros
que el gris neutro, mientras que los valores positivos son ms claros. Esta imagen se ha obtenido
aplicando el codificador diferencial a cada una de las lneas de la imagen. A partir de estos resultados
visuales, es evidente que hemos conseguido el propsito que perseguamos. La mayora de pxeles de
+
Transformacin
-
Predictor
+
+
+
Transformacin
Inversa
Predictor
+
Transformacin
-
Predictor
+
Transformacin
-
Predictor
+
+
+
Transformacin
Inversa
Predictor
+
+
+
Transformacin
Inversa
Predictor
la imagen diferencia estn prximos al nivel de gris medio y slo en los contornos de la imagen
aparecen pxeles cuyo valor se aparta apreciablemente del cero.

Fig. 4.5 Representacin de los niveles de una lnea original y de la diferencial

Fig. 4.6 Imagen original e imagen diferencias

Este efecto puede apreciarse ms claramente en las grficas de la figura 4.7, donde se representan los
histogramas de la imagen original y de la imagen diferencia. El histograma es una representacin
bidimensional de la frecuencia relativa con la que aparece cada nivel de gris en la imagen. As, para
cada posible nivel de gris en el eje de abcisas, encontramos el nmero de pxeles de la imagen que
toman ese nivel de gris. Por tanto, el histograma es una representacin aproximada de la probabilidad
de que un pxel tome un determinado nivel de gris en la imagen. Ntese que en estas grficas se han
normalizado los niveles de gris, de forma que el negro corresponde al cero mientras el blanco
corresponde a la unidad. En el histograma de la izquierda, que corresponde a la imagen original, los
0 50 100 150 200 250 300
0
50
100
150
200
0 50 100 150 200 250 300
-100
-50
0
50
100
150
Lnea original
Lnea transformada
Imagen
0 50 100 150 200 250 300
0
50
100
150
200
0 50 100 150 200 250 300
0
50
100
150
200
0 50 100 150 200 250 300
-100
-50
0
50
100
150
0 50 100 150 200 250 300
-100
-50
0
50
100
150
Lnea original
Lnea transformada
Imagen
Imagen Original Imagen Diferencias Imagen Original Imagen Diferencias
niveles de gris se distribuyen dentro de toda la gama sin mostrar preferencia directa por ningn valor.
En cambio, en la grfica de la derecha, que corresponde a la imagen diferencia, existe una gran
concentracin de elementos de imagen con un nivel de gris prximo a 0.5 (gris neutro con el que
hemos representado el valor cero).

Fig. 4.7 Histogramas de la imagen original y la imagen transformada

Cuando una seal tiene una estadstica bien definida, en la que predominan unos pocos valores que se
presentan con mucha probabilidad, frente a otros muchos posibles niveles que se presentan con poca
probabilidad, suele resultar rentable utilizar cdigos de longitud variable en los que los valores ms
probables se codifican empleando pocos bits, mientras que los valores con poca probabilidad utilizan
muchos bits. Esta es la idea bsica de los cdigos de Huffman y sus variantes, que examinaremos con
cierto detalle ms adelante.

Es importante subrayar que la codificacin que hemos realizado hasta este momento es una
codificacin sin prdidas, siempre que mantengamos los clculos de la diferencia con la precisin
adecuada. En este ejemplo, la imagen original estaba codificada con 256 niveles de gris (8 bits por
muestra), por lo que las seales diferencia pueden tomar valores comprendidos entre -255 y 255 pues
es posible que un pxel tome el valor nulo cuando el anterior era blanco o viceversa. Esto significa que
si queremos reconstruir la imagen original con los niveles de gris exactos (sin prdidas), deberemos
mantener los 511 posibles valores que puede tomar la seal diferencia (9 bits por muestra). Si estos
valores se aproximan mediante una cuantificacin ms tosca, ya no ser posible recuperar la imagen
original de forma exacta.

Cuando se realiza una codificacin con prdidas, es importante seleccionar correctamente la estructura
del codificador y el decodificador para que las aproximaciones no se vayan deteriorando a medida que
avanza la descodificacin. Para ilustrar este problema consideremos el ejemplo de la figura 4.8, en el
que se aplica un cuantificador uniforme de 21 niveles directamente en la salida del codificador
diferencial. Si la seal est normalizada entre los valores 1 y 1 (que corresponderan con los niveles
de gris de 255 y 255), un cuantificador uniforme de 21 niveles significa que los valores originales se
0 0.2 0.4 0.6 0.8 1
0
100
200
300
400
500
600
700
0 0.2 0.4 0.6 0.8 1
0
500
1000
1500
Imagen Original Imagen Diferencias
0 0.2 0.4 0.6 0.8 1
0
100
200
300
400
500
600
700
0 0.2 0.4 0.6 0.8 1
0
500
1000
1500
Imagen Original Imagen Diferencias
aproximan a la dcima (-1, -0.9, -0.8, ..., 0, 0.1,...0.9,1). Si sobre esta aproximacin aplicamos el
decodificador diferencial, obtenemos la imagen de la figura 4.9, donde puede observarse la presencia
de errores significativos en la reconstruccin de la imagen.

Fig. 4.8 Cuantificacin directa de la seal transformada. Codificacin con prdidas

Fig. 4.9 Imagen diferencial cuantificada con 21 niveles e imagen reconstruida

Estos resultados indican que, al tratarse de una codificacin diferencial, los errores existentes en el
proceso de cuantificacin pueden acumularse, provocando una prdida de calidad considerable en
algunas lneas de la imagen. La razn de este problema es que en el esquema de la figura 4.8 el
codificador utiliza siempre la imagen original para determinar la seal diferencia, mientras que el
Z
-1
+
x[0]
x[1]
x[2]
x[3]
x[4]
x[N-2]
x[N-1]
Linea
Seal TV
Transformacin
+
-
Z
-1
+
+
+
Transformacin
Inversa
Original
Q
Z
-1
+
x[0]
x[1]
x[2]
x[3]
x[4]
x[N-2]
x[N-1]
Linea
Seal TV
Transformacin
+
-
Z
-1
+
+
+
Transformacin
Inversa
Z
-1
+
+
+
Transformacin
Inversa
Original
Q
Imagen diferencias
cuantificada
Imagen recuperada
Sin errores de canal
Imagen diferencias
cuantificada
Imagen recuperada
decodificador no dispone de la seal original, por lo que debe utilizar la muestra reconstruida
anteriormente para determinar la muestra actual. Si la muestra anterior tena un error acumulado, este
error se mantendr en la muestras sucesivas.

Una solucin a este problema consiste en modificar la estructura del codificador diferencial de manera
que las diferencias se calculen entre la seal original y la muestra que puede reconstruirse en el
decodificador. Esta nueva estructura de codificacin se representa en la figura 4.10. Ahora el
cuantificador se aplica a la diferencia entre la muestra original y la muestra que se reconstruye en el
lazo de realimentacin de la parte inferior del codificador. Ntese que este lazo es idntico al que
utiliza el decodificador para recuperar la seal original. La seal se obtiene en base al error actual y a
las seales que se haban reconstruido anteriormente. Con esta nueva estructura, los errores que se
cuantifican son un indicativo de la diferencia entre la muestra original y la que hemos reconstruido
hasta este momento, de modo que los errores no se acumulan. En la figura 4.11 se representa la seal
diferencia cuantificada con 21 posibles niveles y la seal que se reconstruye en el decodificador.
Obsrvese que existen prdidas apreciables en la reconstruccin de la imagen, pero que ahora se
deben exclusivamente a que se ha elegido un paso de cuantificacin con muy pocos niveles de gris.

Fig. 4.10 Estructura del codificador diferencial basada en la diferencia con las muestras reconstruidas

Fig. 4.11 Decodificacin de la imagen con la estructura de la figura 4.10
+
Q
+ Z
-1
+
+
+
-
+
Q
+ Z
-1
+
Q
+ Z
-1
+
+
+
-
Imagen diferencias
cuantificada
Imagen recuperada
Imagen diferencias
cuantificada
Imagen recuperada
La cuantificacin que hemos utilizado en el ejemplo anterior reduce el nmero total de smbolos
asociados a la imagen diferencia a 21. Entre todos estos smbolos, los ms probables son los que estn
situados en un entorno prximo al cero, por lo que sera conveniente que estos se codificaran con un
nmero de bits menor que los que tienen menos probabilidad. En la siguiente seccin se presentan los
conceptos bsicos para establecer procedimientos sistemticos que permitan asignar cdigos eficientes
a los distintos mensajes que puede proporcionar un codificador. Estos mtodos estn basados en la
propia estadstica de las seales y pueden utilizarse tanto para la compresin con prdidas como sin
prdidas.

4.3 Medida de la informacin de una fuente
Una fuente de mensajes se caracteriza por el nmero de mensajes que puede producir y por la
probabilidad con la que se produce cada mensaje. En el ejemplo del codificador diferencial del
apartado anterior, podramos decir que la fuente asociada a la imagen original poda producir 256
posibles mensajes, cuya probabilidad podra estimarse como el histograma dividido por el nmero
total de puntos de la imagen (frecuencia relativa de cada nivel de gris). En primera aproximacin
tambin hubiramos podido postular que todos los niveles de gris eran equiprobables. Por otra parte,
la fuente de mensajes asociada a la salida del codificador diferencial contiene, para el caso de una
codificacin sin error, un total de 511 mensajes con una probabilidad mucho mayor para los mensajes
prximos al valor nulo. Anlogamente, cuando aplicamos un cuantificador de 21 niveles obtenemos
un total de 21 posibles mensajes con una probabilidad determinada. En general, podemos afirmar que
la estadstica de los mensajes de una fuente se modifica cuando se aplican transformaciones a las
seales, lo que nos sugiere concentrar los esfuerzos en buscar aquellas transformaciones que permitan
obtener una estadstica de mensajes que pueda codificarse con un nmero reducido de bits.

En la figura 4.12 se representa la idea bsica de caracterizacin de una fuente de mensajes. A partir de
los mensajes producidos podemos estimar su funcin densidad de probabilidad, de modo que la fuente
queda completamente determinada si conocemos todos los mensajes posibles y la probabilidad con la
que se producen.

Fig. 4.12 Caracterizacin de una fuente de mensajes
m
1
m
2
m
3
m
N
Posibles mensajes: m
1
, m
2
, ...., m
N
Probabilidad con la
que se produce cada
mensaje
Fuente
m
1
.......p
1
m
2
.......p
2
m
N
.......p
N
Lista de mensajes y
probabilidades
m
1
m
2
m
3
m
N
Posibles mensajes: m
1
, m
2
, ...., m
N
Probabilidad con la
que se produce cada
mensaje
Fuente
m
1
.......p
1
m
2
.......p
2
m
N
.......p
N
Lista de mensajes y
probabilidades
Una vez especificada la estadstica de la fuente, deberemos plantearnos establecer una medida
cuantitativa de la cantidad de informacin asociada a cada mensaje. La medida debe verificar ciertos
requisitos que parecen naturales y que generalmente estn asociados al concepto cualitativo de
informacin. Estos postulados son:

1) La informacin asociada a un mensaje es positiva. Es lgico suponer que siempre que se
produce uno de los posibles mensajes aporta informacin. No tiene sentido que se
produzcan prdidas de informacin si recibimos nuevos datos.
2) Los mensajes con poca probabilidad aportan mayor informacin que los mensajes con
poca probabilidad. Los mensajes que se producen frecuentemente nos aportan muy poca
informacin porque son esperados de antemano. As, cuando se nos informa que hay
circulacin lenta en los accesos de entrada a Barcelona entre las 8 y las 9 de la maana,
es un mensaje que nos aporta muy poca informacin.
3) La informacin que aportan dos mensajes independientes es la misma que la que
aportan cuando se producen por separado. Esto significa que la informacin que nos
aportan dos eventos independientes que se producen simultneamente coincide con la
suma de las informaciones que nos aportaran si se produjeran por separado.

Podemos formular estos postulados mediante las siguientes ecuaciones:

0 ) ( >
k
m I (4.4)

j i j i
p p si m I m I < > ) ( ) ( (4.5)

) ( ) ( ) , (
j i j i
m I m I m m I + = (4.6)

En virtud del teorema fundamental del clculo, nicamente existe una funcin que verifique las tres
propiedades simultneamente. De este modo, la medida cuantitativa de la informacin se encuentra
directamente a partir de las propiedades que queremos que verifique.

k a k
p m I log ) ( = (4.7)

Cuando la base del logaritmo es 2, la unidad de informacin se denomina bit. Consideremos como
ejemplo la informacin que proporciona una moneda al caer. Existen dos posibles mensajes (cara y
cruz), los dos con la misma probabilidad (1/2). La informacin asociada al mensaje cara ser:

bit 1 ) 2 / 1 ( log ) cara (
2
= = I (4.8)

Anlogamente, si consideramos una fuente que puede transmitir 8 mensajes equiprobables, la
informacin asociada a cada uno de los mensajes vendr dada por:

bit 3 2 log ) 8 / 1 ( log ) (
3
2 2
= = =
i
m I (4.9)

De acuerdo con estos resultados, para estimar la cantidad de informacin ligada a uno de los mensajes
de la fuente, es necesario establecer en primer lugar las caractersticas estadsticas de la fuente de
mensajes. Estas caractersticas pueden estimarse de forma experimental dejando que la fuente genere
mensajes y aproximando su probabilidad por la frecuencia relativa de los mismos. En general, si la
estimacin se realiza sobre una muestra suficientemente alta este procedimiento suele proporcionar
resultados satisfactorios.

4.3.1 Entropa de una fuente de mensajes
Conociendo la informacin asociada a cada mensaje podemos determinar la informacin media que
proporciona la fuente. Para ello debemos ponderar la informacin de cada mensaje por la probabilidad
de que se produzca:

= =
= =
N
k
N
k
k k k k
p p m I p H
1 1
2
log ) ( (4.10)

Esta funcin se conoce con el nombre de entropa y establece un lmite al nmero de bits medio con el
que podrn codificarse los mensajes de la fuente. Ningn codificador podr obtener cdigos cuyo
nmero de bits medio sea inferior a la entropa de la fuente.

Por otra parte, es posible demostrar que para un nmero de mensajes prefijado N, la entropa es
mxima cuando todos los mensajes son equiprobables. Esto significa que si la fuente no tiene ninguna
prioridad para producir unos mensajes con mayor frecuencia que otros, resulta ms compleja de
codificar de forma eficiente. En cambio, si algunos mensajes se producen con mucha frecuencia
mientras que otros son poco probables, la entropa disminuye y puede ser posible encontrar cdigos
que aprovechen esta circunstancia. Las transformaciones de seal se utilizan para sacar provecho de
esta idea. Si mediante una transformada de la seal podemos forzar a que los mensajes muestren
diferencias de probabilidad considerables, habremos dado un paso importante para reducir la cantidad
de informacin con la que podemos codificar la fuente.

Fig. 4.13 Histogramas y entropas de la imagen original y la imagen diferencias
0 2 0 0 4 0 0 6 0 0
0
1 0 0 0
2 0 0 0
3 0 0 0
4 0 0 0
5 0 0 0
6 0 0 0
7 0 0 0
0 50 100 150 200 250 300
0
100
200
300
400
500
600
700
800
900
1000
Histograma imagen original
H=7.58
Histograma imagen diferencia
H=5.80
0 2 0 0 4 0 0 6 0 0
0
1 0 0 0
2 0 0 0
3 0 0 0
4 0 0 0
5 0 0 0
6 0 0 0
7 0 0 0
0 50 100 150 200 250 300
0
100
200
300
400
500
600
700
800
900
1000
Histograma imagen original
H=7.58
Histograma imagen diferencia
H=5.80
Desde el punto de vista del histograma, los resultados anteriores indican que conviene obtener
grficos con picos fuertemente marcados que indiquen la existencia de mensajes muy probables. En la
figura 4.13 se comparan los histogramas de una imagen original (la que hemos venido considerando
en los ejemplos de las secciones anteriores) y de su imagen diferencia. La entropa de la imagen
original es de 7.58 bits, prxima a los 8 bits con los que ha sido codificada la imagen. En cambio, la
entropa de la imagen diferencia se sita sobre los 5.8 bits, lo que es un indicativo de que ser posible
codificarla de forma ms eficiente. El problema ahora se limita a buscar formas eficientes y
sistemticas de codificar esta informacin.

4.4 Cdigos de longitud variable
La idea bsica de los cdigos de longitud variable es asignar palabras cdigo de longitudes distintas en
funcin de la probabilidad de los mensajes. Los mensajes ms probables se codificarn con palabras
con un menor nmero de bits que los mensajes menos probables. Podemos considerar como ejemplo
los mensajes de la fuente que se resume en la tabla siguiente y en la que los cdigos asignados a cada
mensaje han sido elegidos sin seguir ningn procedimiento sistemtico.

Tabla 4.1 Ejemplo de cdigos de longitud variable

mensajes probabilidad cdigo
m
1
0.4 0
m
2
0.3 10
m
3
0.1 1100
m
4
0.1 1101
m
5
0.1 1110

Podemos calcular el nmero medio de bits que se utilizan para codificar esta fuente con este cdigo
arbitrario calculndo el nmero de bits utilizado para cada mensaje ponderado por la probabilidad de
que se produzca el mensaje.

=
= + + = =
N
k
k k medio
N p N
1
bits 2 . 2 ) 3 . 0 ( 4 ) 3 . 0 ( 2 ) 4 . 0 ( 1 (4.11)

Evidentemente, el nmero de bits medio est por encima de la entropa:

=
= =
N
k
k k
p p H
1
2
bits 04 . 2 log (4.12)

Para que los cdigos de longitud variable resulten eficaces es necesario disponer de procedimientos
sistemticos para generar estos cdigos directamente a partir de las caractersticas de las fuentes.
Adems, es fundamental que los cdigos obtenidos resulten eficientes, es decir, que permitan obtener
una tasa media de bits prxima a la entropa de la fuente. En las secciones siguientes examinamos
algunas alternativas basadas en los cdigos de Huffman y sus variantes ms utilizadas.

4.4.1 Cdigos de Huffman
El cdigo de Huffman (1951) es la tcnica ms utilizada para la eliminacin de la redundancia en la
codificacin. El procedimiento para obtener el cdigo de Huffman asociado a una fuente es
conceptualmente simple, aunque, como veremos, desde el punto de vista computacional resulta
complejo. Es posible demostrar que el cdigo de Huffman es ptimo en el sentido que consigue el
nmero ms pequeo de smbolos de cdigo por smbolo de fuente, con la restriccin de que los
mensajes deben codificarse uno a uno. Tambin puede demostrarse que el nmero de bits medio que
se consigue obtener con un cdigo de Huffman est siempre comprendido entre la entropa de la
fuente y la entropa ms uno:

1 + < < H N H
Huffman
(4.13)

El procedimiento para obtener el cdigo de Huffman puede resumirse en las siguientes etapas:

1) Ordenar los mensajes por probabilidades decrecientes.

2) Crear un rbol combinando siempre los dos nodos con menor probabilidad. El resultado
de la combinacin de los dos nodos es un nuevo nodo cuya probabilidad es la suma de
las probabilidades de los nodos que lo han construido. Continuar con este procedimiento
hasta obtener un nico nodo.

3) Para asignar los cdigos a los mensajes basta con recorrer el rbol desde la raz a cada
uno de los mensajes, asignando un 0 o un 1 en funcin de si tomamos una rama hacia
arriba o hacia abajo (la asignacin de ceros y unos a las ramas puede ser totalmente
arbitraria)

El procedimiento anterior resulta bastante ms claro si se ilustra con un ejemplo sencillo, como el que
se muestra en la figura 4.14. Obsrvese como los nodos van combinndose dos a dos, eligiendo
siempre los de probabilidad ms pequea. Si existen varios nodos con la misma probabilidad, pueden
combinarse dos cualesquiera. La probabilidad asignada al nodo raz deber ser siempre la unidad.

En la figura 5.15 se muestra el mismo rbol, pero ahora se utiliza para la asignacin de cdigos a los
mensajes. As, para determinar el cdigo que asignamos al mensaje m
4
deberemos partir del nodo raz,
realizar dos pasos hacia abajo y despus dos pasos ms hacia las ramas superiores. El cdigo
resultante para este mensaje es 1100. Ntese que si seguimos esta construccin del rbol de Huffman
el mensaje con menor probabilidad siempre queda codificado con todos los smbolos igual a la
unidad.

Una vez determinado el cdigo de Huffman para esta fuente, podemos calcular el nmero medio de
bits que se utilizan obteniendo un total de 2,4 bits. Si calculamos la entropa de la fuente original
obtendremos 2,344 bits, lo que da una idea de la calidad del cdigo.

Fig. 4.14 Proceso de creacin del cdigo de Huffman

Fig. 4.15 Proceso de generacin de cdigo a partir del rbol de Huffman

Una de las caractersticas de los cdigos de Huffman es que permiten decodificar la secuencia de
datos directamente a partir de la tabla de cdigos y sin necesidad de sealizar el principio y el final de
un mensaje. Esto puede no parecer trivial, ya que los cdigos son de longitud variable, pero se cumple
debido a que, por construccin del rbol, ninguno de los cdigos largos tiene como subcadena una
palabra cdigo ms corta. Para ilustrar el procedimiento de decodificacin consideremos la cadena de
bits 111011101001011111...., cuyo proceso de descodificacin se representa esquemticamente en la
figura 4.16. La decodificacin empezara comprobando si el primer bit (1) es una palabra cdigo,
buscndolo en la tabla de palabras cdigo con un nico bit. Como no es as, comprobaramos si los
m
1
; p
1
= 0.45
m
2
; p
2
= 0.2
m
3
; p
3
= 0.1
m
4
; p
4
= 0.1
m
5
; p
5
= 0.05
m
6
; p
6
= 0.05
m
7
; p
7
= 0.03
m
8
; p
8
= 0.02
0.05
0.1 0.15
0.2 0.35
0.55
1
m
1
; p
1
= 0.45
m
2
; p
2
= 0.2
m
3
; p
3
= 0.1
m
4
; p
4
= 0.1
m
5
; p
5
= 0.05
m
6
; p
6
= 0.05
m
7
; p
7
= 0.03
m
8
; p
8
= 0.02
0.05 0.05
0.1 0.1 0.15 0.15
0.2 0.2 0.35 0.35
0.55 0.55
11
m
1
; c
1
=0
0
1
m
2
; c
2
=10
0
1
m
3
; c
3
=1100
m
4
; c
4
=1101
0
1
0
1
m
5
; c
5
=11100
m
6
; c
6
=11101
m
7
; c
7
=11110
m
8
; c
8
=11111
0
1
0
1
0
1
m
1
; c
1
=0
0
1
m
1
; c
1
=0
0
1
m
2
; c
2
=10
0
1
m
2
; c
2
=10
0
1
m
3
; c
3
=1100
m
4
; c
4
=1101
0
1
0
1
m
3
; c
3
=1100
m
4
; c
4
=1101
0
1
0
1
m
5
; c
5
=11100
m
6
; c
6
=11101
m
7
; c
7
=11110
m
8
; c
8
=11111
0
1
0
1
0
1
m
5
; c
5
=11100
m
6
; c
6
=11101
m
7
; c
7
=11110
m
8
; c
8
=11111
0
1
0
1
0
1
dos primeros bits (11) pueden ser una palabra cdigo. Continuaramos con este procedimiento hasta
que encontramos la palabra 11101, que s se encuentra en la tabla, y que corresponde al mensaje m
6
.
Procediendo de este modo llegaramos a decodificar la secuencia de mensajes completa que se
corresponde con los cdigos c
6
, c
4
, c
1
, c
1
, c
2
y c
8
.

Fig. 4.16 Ejemplo de decodificacin de una secuencia de mensajes

Por otra parte, cuando se produce algn error de un bit en el canal, puede producirse un cambio de
palabra cdigo que supone la prdida del sincronismo y la posibilidad de que aparezcan varios errores
consecutivos. Eventualmente, el receptor puede detectar de forma automtica la aparicin de los
errores, debido a que no encuentra las palabras cdigo en las tablas o que la estadstica de aparicin no
se corresponde con la esperada. Los algoritmos para la deteccin de que se han producido errores y la
eventual sincronizacin con la cadena de datos son sumamente complejos.

En aplicaciones de almacenamiento de los datos en ficheros, es recomendable que la codificacin y la
decodificacin se realicen empleando buffers temporales de memoria con una longitud que sea un
mltiplo de 8 bits. Con ello, cuando el buffer est lleno, se pueden almacenar la secuencia de bits,
aprovechando una palabra de un byte o mltiplo del byte.

La obtencin del cdigo de Huffman, una vez se dispone de la estadstica de la seal, es
conceptualmente muy sencilla. No obstante, los algoritmos asociados son complejos y requieren
realizar bastantes simplificaciones y comparaciones en la tabla de mensajes. Otro de los problemas
importantes es la estimacin de las estadsticas con las que se producen los mensajes. Las
estimaciones de los mensajes menos probables son poco fiables y se requiere trabajar con muestras
muy grandes para obtenerlos. A menudo, se obtiene que la probabilidad de algunos mensajes es nula,
debido a que no se han producido ninguna vez en la secuencia que hemos analizado. Aunque el
procedimiento de Huffman puede aplicarse de la misma forma en estos casos, es posible que los
111011101001011111...
c
2
=10
c
3
=1100
c
4
=1101
c
5
=11100
c
6
=11101
c
7
=11110
c
8
=11111
c
1
=0
TABLA
1 1 1 0 1 c
6
=11101
111011101001011111...
1 1 0 1
c
4
=1101
111011101001011111...
0
c
1
=0
Secuencia de bits
111011101001011111...
c
2
=10
c
3
=1100
c
4
=1101
c
5
=11100
c
6
=11101
c
7
=11110
c
8
=11111
c
1
=0
TABLA
1 1 1 0 1 c
6
=11101 c
6
=11101
111011101001011111...
1 1 0 1
c
4
=1101 c
4
=1101
111011101001011111...
0
c
1
=0 c
1
=0
Secuencia de bits
valores de la tasa de bits media con que se codifica la fuente no sean tan ptimos como caba esperar.
Existen varias alternativas para simplificar el diseo de la tabla de codificacin de Huffman, algunas
de las cuales se exponen con cierto detalle en el siguiente apartado. Todas ellas son soluciones
subptimas que simplifican el anlisis de la fuente y la construccin de la tabla de codificacin.

4.4.2 Modificaciones del cdigo de Huffman
Consideraremos las dos variantes ms comunes del mtodo de Huffman: los cdigos truncados y los
cdigos de desplazamiento. Los cdigos truncados se basan en descartar los mensajes menos
probables del proceso de anlisis del cdigo de Huffman. Estos mensajes se codifican posteriormente
utilizando palabras de longitud fija precedidas de un prefijo proporcionado por el mismo anlisis de la
fuente simplificada. Las etapas de anlisis del cdigo se resumen en los siguientes puntos:

1. Se ordenan todos los N mensajes de la fuente por orden de probabilidad decreciente.
2. Se eligen los M mensajes ms probables y se genera un nuevo mensaje L que representa los
(N-M) mensajes descartados. La probabilidad de L es la suma de los mensajes con baja
probabilidad que representa.
3. Se construye el cdigo de Huffman asociado a la nueva fuente de M+1 mensajes.
4. Se construye el cdigo de los N-M mensajes de menor probabilidad, empleando como prefijo
el cdigo de Huffman asignado al nuevo mensaje L, seguido de un cdigo binario
convencional de longitud constante.

El procedimiento se resume esquemticamente en la figura 4.17, donde se supone que se descartan los
5 mensajes con menor probabilidad. La suma de las probabilidades de estos mensajes se inserta en la
tabla de mensajes previamente ordenados (en nuestro ejemplo es el 5 mensaje ms probable) y se
construye el cdigo de Huffman con esta nueva estadstica. El cdigo resultante se utiliza como
prefijo para asignar las palabras que representan los mensajes originales. En este ejemplo debemos
aadir tres bits adicionales para poder representar los 5 mensajes.

Fig. 4.17 Construccin de un cdigo de Huffman truncado
Mensajes
originales
Agrupacin
menos probables
Reordenacin
probabilidades
Cdigo de
Huffman
011
Codificacin del resto
de mensajes con este
prefijo
011 000
011 001
011 010
011 011
011 100
Mensajes
originales
Agrupacin
menos probables
Agrupacin
menos probables
Reordenacin
probabilidades
Reordenacin
probabilidades
Cdigo de
Huffman
011
prefijo
011 000
011 001
011 010
011 011
011 100
prefijo
011 000
011 001
011 010
011 011
011 100
Los cdigos de Huffman de desplazamiento tienen una filosofa de construccin bastante ms
compleja, aunque simplifican considerablemente el proceso de construccin de la tabla sin degradar
excesivamente las propiedades del cdigo. El procedimiento de construccin del cdigo de
desplazamiento se representa en la figura 4.18. Los mensajes o smbolos de la fuente original se
ordenan por probabilidades decrecientes y se dividen en K bloques, que contienen, todos ellos, el
mismo nmero R de mensajes (en nuestro ejemplo K=3 y R=7). Las probabilidades de todos los
mensajes de los K-1 bloques con menor probabilidad se suman y se construye un nuevo mensaje L, al
que se le asigna esta probabilidad. El procedimiento de Huffman convencional se aplica a esta nueva
fuente modificada, que contiene un total de R+1 mensajes.

La construccin del cdigo definitivo es ahora bastante simple. El cdigo asignado al nuevo mensaje
L es utilizado como cdigo de desplazamiento. Esto significa que, si no aparece, entenderemos que
hacemos referencia a un mensaje del primer bloque, si aparece una vez, referencia a un mensaje del
segundo bloque, si se repite dos veces, hace referencia a un mensaje del tercer bloque, y as
sucesivamente. Los mensajes dentro de cada uno de los bloques quedan codificados con los cdigos
que han obtenido los mensajes del primer bloque, en el mismo orden e independientemente de sus
probabilidades. Evidentemente, los cdigos de estos mensajes no han sido optimizados, pero, como su
probabilidad suele ser pequea, no tienen excesiva incidencia sobre la eficiencia del cdigo. Ntese
que aunque el nmero de bloques sea pequeo, el anlisis de Huffman se reduce notablemente, ya que
slo debe realizarse para R+1 mensajes de los KxR mensajes de la fuente.

En la figura 4.18 se representa la construccin de un cdigo para una fuente sencilla. En este caso, el
nuevo mensaje L tiene una probabilidad alta, por lo que el cdigo de desplazamiento asignado es
bastante corto. Este resultado suele ser general, sobre todo si el nmero de bloques en que se divide la
fuente es elevado. Probablemente, resulta ms simple comprender la construccin del cdigo a partir
de esta grfica que a partir del texto.

Fig. 4.18 Construccin de los cdigos de Huffman de desplazamiento
Mensajes
originales
Divisin en
bloques
Aplicar
Huffman
10
00
110
100
101
1110
1111
10
110
100
101
1110
1111
00 10
00 110
00 100
00 101
00 1110
00 1111
00 00 10
00 00 110
00 00 100
00 00 101
00 00 1110
00 00 1111
Huffman de
desplazamiento
Mensajes
originales
Divisin en
bloques
Aplicar
Huffman
10
00
110
100
101
1110
1111
10
110
100
101
1110
1111
00 10
00 110
00 100
00 101
00 1110
00 1111
00 00 10
00 00 110
00 00 100
00 00 101
00 00 1110
00 00 1111
Huffman de
desplazamiento
4.5 Otros tipos de cdigos
Los cdigos de longitud variable no son los nicos que pueden conseguir codificar de forma eficiente
una fuente de informacin y extraer su redundancia estadstica. En funcin de las caractersticas de la
fuente, existen cdigos ms o menos complejos que pueden conseguir eficiencias considerables. En
este apartado describiremos brevemente los cdigos RLE (Run Length Encoding), los cdigos LZW y
los principios bsicos de la codificacin aritmtica. El RLE y la codificacin aritmtica se emplean,
conjuntamente con los cdigos de Huffman, en distintas partes de la codificacin de imgenes
mediante JPEG o de secuencias de vdeo mediante MPEG.

4.5.1 Codificacin por longitud de series (Run Length Encoding RLE)
La codificacin por longitud de series es conceptualmente muy simple y empez a utilizarse a
mediados de la dcada de los 50 para la codificacin de documentos digitalizados. Actualmente, junto
con sus extensiones bidimensionales, es el mtodo estndar para la codificacin de documentos del
tipo facsmil. Para documentos de texto o grficos binarios, que nicamente contienen los niveles
blanco y negro, podemos codificar cada lnea indicando, de forma alternada, cuantos pxeles toman el
nivel blanco y cuantos el nivel negro en palabras sucesivas. Para ello, es necesario establecer que
siempre empezamos por uno de los niveles (p.ej. blanco). En el supuesto de que en realidad la lnea
empezara por negro, podramos codificar que hay una longitud inicial de cero blancos. Esta forma de
codificacin es bastante eficiente y comprime de forma notable este tipo de documentos.

A este procedimiento bsico, podemos aadir un cdigo de Huffman que tenga en cuenta la estadstica
con la que se producen los mensajes que indican la longitud de las series de blancos y negros.
Aquellas longitudes que se producen con mayor frecuencia sern codificadas con palabras de menor
longitud obteniendo una mejora global del cdigo.

La idea bsica del RLE puede extenderse a fuentes con varios mensajes o smbolos, pero en las que
predomine uno de los mensajes con gran probabilidad. Esta variante del RLE se utiliza en la
codificacin de los coeficientes de la transformada coseno de los bloques de imagen en los estndares
JPEG y MPEG. En este caso, muchos de los coeficientes de la transformada coseno, una vez
cuantificados, toman el valor nulo, por lo que resulta ms eficiente especificar la cantidad de
coeficientes consecutivos que toman este valor.

En imgenes multinivel, en las que todos los niveles tienen probabilidades parecidas, puede emplearse
la codificacin RLE aplicndola a los distintos planos de bits de la imagen. En la figura 4.19 se
representa una imagen de 256 niveles descompuesta en los planos de bits de cada pxel. La primera
imagen representa nicamente el bit ms significativo, la segunda imagen el segundo bit, etc. Como
ahora las imgenes son binarias, podemos aplicar el RLE como si se tratara de documentos de texto.
Evidentemente, la ganancia que obtenemos para la imagen asociada al bit ms significativo es
importante, debido a que existen series bastante largas de pxeles blancos o negros. A medida que
disminuimos el peso del bit, las series se reducen y la eficiencia de la codificacin baja. Una posible
alternativa es descomponer la imagen en planos de bits, pero representados en forma de cdigo Gray
en vez de binario natural. El cdigo Gray tiene la propiedad de que entre dos niveles consecutivos slo
se produce un cambio en uno de los bits. As, cuando la imagen pasa del nivel 127 al 128 en
codificacin binaria natural, cambian los valores de todos los planos de bits. En cambio, si utilizamos
la codificacin del nivel de gris mediante el cdigo de Gray, slo cambiara uno de los dgitos. El
resultado es que todos los planos de bits presentan zonas ms o menos uniformes en las que las series
de blancos y negros pueden codificarse con ganancias significativas.

El cdigo Gray puede obtenerse con cierta facilidad a partir del cdigo binario. Si la representacin de
un determinado nivel de gris en cdigo binario natural es b
7
b
6
b
5
b
4
b
3
b
2
b
1
b
0
, donde b
7
representa el bit
ms significativo y b
0
el bit menos significativo, la representacin en cdigo Gray g
7
g
6
g
5
g
4
g
3
g
2
g
1
g
0

puede obtenerse aplicando la siguiente relacin:

6 0
1
7 7
=
=
+
k si a a g
b g
k k k
(4.14)

Fig. 4.19 Representacin de una imagen multinivel en planos de bits en binario natural

4.5.2 Codificacin LZW
Esta codificacin fue introducida por Lemple y Ziv y posteriormente mejorada por Welch. Se utiliza
en muchos compresores de datos con aplicaciones informticas. La idea bsica es sustituir los
smbolos de 8 bits (bytes) que se encuentran en los ficheros convencionales por smbolos de 12 o ms
bits. Al representar las palabras con smbolos de 12 bits, disponemos de 4096 posibilidades, de las
cuales 256 se asignan a las palabras de 8 bits que disponamos en la fuente original. Las 3840 palabras
restantes se asignan dinmicamente a las series de bits que se producen ms a menudo. La primera vez
que se produce una cadena se registra tal cual, junto con una palabra cdigo que la representar a
partir de aquel momento. La tabla de cdigos se genera dinmicamente y se incluye en el fichero. Este
b7 b6 b5 b4
b3 b2 b1 b0
b7 b6 b5 b4
b3 b2 b1 b0
cdigo es muy eficiente para comprimir ficheros de tipo texto o binarios en los que las palabras ms
habituales quedan codificadas con 12 bits. Existen multitud de variantes sobre el algoritmo bsico.

4.5.3 Codificacin aritmtica
La codificacin aritmtica se basa en asociar nmeros reales comprendidos entre 0 y 1 a secuencias o
cadenas de mensajes de la fuente. Aunque en la prctica es difcil de implementar, suele conseguir
resultados de compresin excelentes, superiores, en la mayora de casos, a la codificacin de
Huffman. Recordemos que Huffman era un cdigo ptimo slo cuando se restringa que cada mensaje
de la fuente deba ser codificado con un smbolo. En el caso de la codificacin aritmtica se consiguen
mejores resultados debido a que los smbolos corresponden a cadenas de mensajes.

Existen diversas variantes de los cdigos aritmticos, sobre todo en lo que respecta a su
implementacin y los formatos de representacin de los nmeros reales con aritmtica finita.
Esencialmente, el proceso de codificacin se ilustra en la figura 4.20 para la siguiente cadena de
mensajes: a
1
a
3
a
1
a
2
a
4
. Para simplificar el procedimiento, suponemos que los mensajes proceden de una
fuente con 4 mensajes posibles a
1
, a
2
, a
3
y a
4
con probabilidades 0,4; 0,3; 0,2 y 0,1. El mensaje a
4
se
utiliza exclusivamente para indicar el fin de cadena. El nmero real asignado al mensaje se va
determinando progresivamente a medida que se codifican los distintos elementos de la cadena. Para
codificar el primer elemento, el intervalo real [0; 1) se divide en 4 porciones proporcionales a la
probabilidad de cada uno de los mensajes. El mensaje a
1
quedar codificado como el intervalo real [0;
0,4), el mensaje a
2
como el intervalo [0,4; 0,7) y as sucesivamente. En la figura se indica el intervalo
en el que ha sido codificado el primer elemento de la cadena. Para codificar el segundo elemento,
tomamos el intervalo definido por el primero y se vuelve a dividir en 4 intervalos con una longitud
proporcional a sus probabilidades, aplicando progresivamente este procedimiento a medida que se
incorporan ms elementos de la cadena.

Fig. 4.20 Ejemplo de codificacin aritmtica de una cadena de mensajes
0
0.4
0.7
0.9
1.0
a1 a1a3
0
0.16
0.28
0.36
0.40
a1a3a1
0.28
0.312
0.336
0.352
0.360
a1a3a1a2
0.28
0.2928
0.3024
0.3088
0.3120
a1a3a1a2a4
0.2928
0.29664
0.29952
0.30144
0.30240
0
0.4
0.7
0.9
1.0
a1 a1a3
0
0.16
0.28
0.36
0.40
a1a3a1
0.28
0.312
0.336
0.352
0.360
a1a3a1a2
0.28
0.2928
0.3024
0.3088
0.3120
a1a3a1a2a4
0.2928
0.29664
0.29952
0.30144
0.30240
En la grfica se observa que la secuencia que pretendamos codificar quedara asignada al intervalo
[0,30144; 0,30240). Cualquier nmero real dentro de este intervalo, por ejemplo el 0,302, codificara
de forma unvoca el mensaje. En este ejemplo, es suficiente con tres cifras decimales para codificar la
cadena de 5 mensajes, lo que representa una codificacin bastante eficiente de la fuente. Ntese que
los cdigos resultantes son de longitud variable, puesto que en funcin de la cadena de mensajes
podemos necesitar ms o menos dgitos para codificar el mensaje. La implementacin del codificador
y del codificar en tiempo real o mediante software no son evidentes y en la prctica existen distintas
estrategias para optimizar los tiempos de clculo cuya descripcin detallada escapa de los objetivos de
este texto.

4.6 Codificacin y predictores
Hemos visto que la codificacin diferencial se basa en utilizar el pxel anterior para realizar una
estimacin del pxel actual, con lo que obtenemos una seal diferencia cuya estadstica permite
realizar una codificacin eficiente de la fuente. La extensin natural de la codificacin diferencial son,
como ya hemos comentado, los predictores lineales. En general, los predictores utilizan una
combinacin lineal de las muestras anteriores para obtener una aproximacin a la muestra actual.
Suelen obtenerse excelentes resultados cuando la seal puede modelarse como una superposicin de
seales sinusoidales y, en principio, la estimacin es tanto mejor cuanto mayor es el nmero de
muestras que se utilizan en la prediccin. En codificacin de audio, donde la seal depende de una
nica variable temporal, suelen utilizarse modelos de prediccin que tienen en cuenta entre 6 y 12
muestras anteriores de la seal. Normalmente no se utiliza un mayor nmero de muestras debido a que
la correlacin entre la muestra actual y las pasadas disminuye apreciablemente con el transcurso del
tiempo y ya no resulta eficiente utilizarlas para estimar el valor actual de la seal. Los coeficientes del
predictor se pueden calcular de antemano, conociendo las caractersticas estadsticas de la seal de
audio, o calcularlos de forma adaptativa, de forma que vayan modificndose en el tiempo a medida
que varan las caractersticas de la seal. Existen algoritmos eficientes para ambas alternativas.

En codificacin de imagen y vdeo, la naturaleza espacial y temporal de la seal proporciona mucha
mayor libertad al diseador para elegir las muestras de seal que se utilizarn en la prediccin. Pueden
tomarse las muestras anteriores correspondientes a la misma lnea, las muestras de la lnea anterior, las
muestras de la misma posicin en la imagen o el cuadro anterior, etc. Decimos que realizamos
prediccin intra-trama cuando nicamente se utilizan muestras dentro de la misma imagen del pxel
que pretendemos predecir. Cuando se usan muestras de imgenes anteriores se dice que la prediccin
es inter-trama. En la figura 4.21 se muestran algunas posibles variantes del predictor diferencial en su
modalidad intra-trama. Los coeficientes situados encima de la plantilla indican cmo se pondera la
muestra en esta posicin para realizar la prediccin. Al igual que en el caso de seales de audio
podramos plantearnos obtener los coeficientes ptimos para una determinada estadstica de los
pxeles de la imagen. Para un predictor de orden unidad (por ejemplo la codificacin diferencial que
hemos considerado anteriormente) puede demostrarse que el valor con el que debe ponderarse la
muestra anterior viene dado por el coeficiente de correlacin entre la muestra que se pretende estimar
y la muestra que utilizamos para la estimacin:

) 0 (
) 1 (
1
r
r
a (4.15)
El valor de este coeficiente suele situarse muy prximo a la unidad, siendo tpicos valores entre 0,99 y
0,98. Este resultado indica que el peso unidad que hemos estado utilizando hasta este momento es
totalmente adecuado.

Fig. 4.21 Ejemplos de predictores intra-trama

Adems, debemos tener en cuenta que en tratamiento de imagen y vdeo, el nmero de muestras que
deben tratarse por segundo es mucho ms elevado que en tratamiento de audio. Este hecho justifica
que en muy raras aplicaciones (normalmente slo cuando la codificacin puede realizarse en tiempo
diferido) se utilicen los coeficientes ptimos y que normalmente se sustituyan por nmeros sencillos
como la unidad, 1/ 2, 3/ 4, etc, cuyos clculos pueden implementarse de forma eficiente. Los
coeficientes ptimos son, en general, valores reales que dificultan excesivamente el clculo y que, en
la mayora de los casos, no justifican las mejoras que introducen.

Para mejorar la estadstica de la seal de error, en ocasiones se utilizan soluciones adaptativas
simplificadas. En tratamiento de seal de audio, una solucin adaptativa significa que los coeficientes
del predictor se van cambiando muestra a muestra o cada cierto periodo de tiempo. Existen algoritmos
que permiten ir actualizando los coeficientes del predictor en funcin de la propia seal. En
tratamiento de imagen, las soluciones adaptativas normalmente consisten en elegir entre varias
estructuras de prediccin predefinidas aquella que mejor se adapta a las caractersticas de la seal.
Para ello, la imagen se divide en bloques o subimgenes de tamao prefijado (4x4, 8x8 o 16x16 son
los tamaos ms utilizados) y en cada bloque se evalan los errores que se obtienen utilizando
distintas estructuras de prediccin, eligiendo aquella estructura que obtiene una suma de errores
absolutos mnima. Para ilustrar este procedimiento consideremos el diagrama de la figura 4.22, donde
se representan los pxeles ms prximos al elemento de imagen que pretendemos estimar. El error
total que obtenemos en el bloque de anlisis viene dado por:

I j i
k k
j i e E
) , (
) ( ) (
) , ( (4.16)

1
Predictor de orden 1
1
0.5
0.5
1
0.5 -0.5
1
1
0.5
0.5
1
0.5 -0.5
donde e
(k)
(i,j) representa el error obtenido en el pxel (i,j) utilizando la estructura de prediccin k e I
representa el intervalo de validez de la subimagen que estamos analizando. E
(k)
nos proporciona el
error total que obtenemos utilizando la estructura de prediccin k. Este error total es la suma de los
errores absolutos obtenidos en cada pxel de la subimagen. Las diferentes estructuras de prediccin
que podramos utilizar vienen definidas, entre otras posibilidades, por:

) , (
) 4 (
) , (
) 3 (
) , (
) 2 (
) , (
) 1 (
) 5 . 0 5 . 0 ( ( ) , (
) ( ) , (
) ( ) , (
) ( ) , (
j i
j i
j i
j i
C A X j i e
C X j i e
B X j i e
A X j i e
+

(4.17)

En este ejemplo, se evalan las diferencias entre el pxel a estimar con el de la izquierda, el de arriba,
el de arriba a la izquierda o con el promedio entre el de arriba y el de la derecha. El anlisis podra
extenderse a otras combinaciones dentro de la misma imagen o incluso a estimaciones inter-trama.
Una vez evaluados los diferentes errores E
(k)
obtenidos para una subimagen, se elige el valor mnimo
y se proporciona la informacin al decodificador de cul ha sido la estructura utilizada para realizar la
prediccin de este bloque de imagen. Esto significa que todos los pxeles dentro del bloque se
codifican con la misma estructura, aunque previamente se determina que estructura es la que produce
un error mnimo. Obsrvese que en el supuesto de que la subimagen corresponda a un contorno
vertical, los errores obtenidos cuando utilizamos el pxel de la izquierda pueden ser considerables
debido a los cambios de nivel de gris asociados al contorno. En cambio, si utilizamos el pxel situado
en la lnea de arriba, el error de prediccin seguramente se reducir apreciablemente.

Fig. 4.22 Identificacin de elementos en estructuras de prediccin adaptativas

4.7 La transformada coseno discreta
La transformada coseno se utiliza en muchos estndares de compresin de imgenes estacionarias y de
vdeo como el JPEG y el MPEG. Las razones por la que se ha extendido su uso son muy variadas e
intentaremos explicar las ms significativas en este apartado. La codificacin de imagen utilizando
algn tipo de transformadas es bastante popular y se extiende a otras transformaciones como Fourier,
Walsh-Hadamard, Hart, Karhunen-Loeve, Wavelet, etc. Estos procedimientos de codificacin se
conocen con el nombre genrico de mtodos transformados y se distinguen de los mtodos predictivos
que hemos descrito en los apartados anteriores por realizar un cambio de dominio en la representacin
de la imagen. La codificacin mediante prediccin lineal tambin realiza una transformacin de los
datos, pero en este caso, la transformacin se realiza en el mismo dominio espacial o temporal de la
X A
C B D
Pixel a predecir
X A
C B D
Pixel a predecir
imagen mediante las diferencias entre los elementos reales y los estimados. No puede considerarse,
por tanto, un cambio de dominio de representacin de la imagen.

La codificacin mediante mtodos transformados y en concreto, mediante la transformada coseno, se
basa en el esquema de la figura 4.23. La imagen a comprimir se divide en bloques o subimgenes de
tamao reducido sobre las que se aplica la transformacin. El resultado de la transformada de cada
bloque se cuantifica y posteriormente se aplican cdigos eficientes para transmitir o almacenar esta
informacin. La compresin de imagen se produce principalmente durante el proceso de
cuantificacin, donde parte de la informacin se descarta o se cuantifica con un nmero de niveles
muy reducido. Veremos que la informacin de cada subimagen puede quedar muy bien empaquetada
en unos pocos coeficientes transformados, de modo que resulta suficiente con determinar que
coeficientes son los ms representativos y codificar la imagen utilizando nicamente estos elementos.
Evidentemente, tambin existe alguna ganancia de compresin debido a la codificacin de los
coeficientes mediante algoritmos eficientes, aunque en ningn modo es tan significativa como la
debida a la parte de cuantificacin.

Fig. 4.23 Proceso general de codificacin y descodificacin de imgenes mediante la transformada coseno

La decodificacin de la imagen se realiza aplicando el proceso inverso: los coeficientes se
descodifican y se aplica la transformada inversa, de manera que se recuperan los elementos de imagen
en el dominio espacial original. Posteriormente, es necesario recomponer la imagen a partir de los
bloques en los que se ha divido originalmente. Esta recomposicin de la imagen suele ser uno de los
principales problemas de los mtodos transformados. En efecto, debido a la cuantificacin de los
coeficientes transformados, la subimagen se recupera con cierto error respecto a la original. Este error
es muy crtico si se produce en los lmites de las subimgenes, debido a que al fusionar todos los
bloques aparecern cambios de nivel de gris bruscos que pueden reproducir la descomposicin en
bloques cuando se observa la imagen descomprimida. El problema es particularmente notorio con
algunas transformadas como la de Fourier o Walsh-Hadamard. La transformada coseno presenta
excelentes propiedades en la codificacin de los contornos de las subimgenes que, de hecho, ha sido
uno de los motivos principales por los que se ha elegido esta transformada en casi todos los estndares
Descomposicin
en bloques
NxN
Descomposicin
en bloques
NxN
Transformada
Coseno
Transformada
Coseno
Cuantificador
Cuantificador
Codificacin
mensajes
Codificacin
mensajes
Imagen
original
Imagen
comprimida
Decodificador
Mensajes
Decodificador
Mensajes
Transformada
Coseno
Inversa
Transformada
Coseno
Inversa
Fusin
Subimgenes
Fusin
Subimgenes
Imagen
comprimida
Imagen
reconstruida
Codificacin
Descodificacin
Descomposicin
en bloques
NxN
Descomposicin
en bloques
NxN
Transformada
Coseno
Transformada
Coseno
Cuantificador
Cuantificador
Codificacin
mensajes
Codificacin
mensajes
Imagen
original
Imagen
comprimida
Decodificador
Mensajes
Decodificador
Mensajes
Transformada
Coseno
Inversa
Transformada
Coseno
Inversa
Fusin
Subimgenes
Fusin
Subimgenes
Imagen
comprimida
Imagen
reconstruida
Codificacin
Descodificacin
de codificacin. La transformada Wavelet, que se incorporar en estndares ms recientes como el
JPEG-2000 o el MPEG-4, tambin dispone de estas propiedades.

Otro de los aspectos cruciales en la codificacin por mtodos transformados es la eleccin del tamao
de las subimgenes. En principio es aconsejable elegir los tamaos de los bloques para que exista
cierto grado de correlacin entre bloques adyacentes. Otra restriccin importante es que los tamaos
de las subimgenes deberan ser una potencia de 2 para facilitar el uso de algoritmos rpidos en la
implementacin de la transformacin. El factor de compresin que puede obtenerse aumenta a medida
que se utilizan bloques ms grandes, aunque tambin se incrementa la carga computacional. En la
mayora de aplicaciones pensadas para una resolucin espacial similar a la de los sistemas de
televisin, los bloques son de tamao 8x8 o 16x16.

Antes de introducirnos en los detalles de la transformada coseno analizaremos sus caractersticas
principales, que justifican su amplio uso en codificacin de imagen y que, posteriormente, nos
ayudarn a comprender algunas de sus particularidades. Estos aspectos se tratan sin ningn orden
preestablecido y nicamente pretendemos proporcionar una idea general de sus ventajas e
inconvenientes respecto a otros mtodos transformados.

1) Capacidad de compactacin de la energa en el dominio transformado. La transformada
coseno discreto (DCT- Discrete Cosinus Transform) consigue concentrar la mayor parte
de la informacin en unos pocos coeficientes transformados. Esto permite obtener
importantes ventajas para una codificacin eficiente de la imagen, puesto que basta con
codificar de forma precisa estos coeficientes principales para obtener una buena
representacin de todo el bloque de la imagen. Debe tenerse en cuenta que la capacidad
de compactacin de la energa en unos pocos coeficientes es un parmetro puramente
estadstico, lo que significa que siempre es posible encontrar un bloque de imagen en la
que la energa en el dominio transformado est dispersada entre todos los coeficientes.
No obstante, esto tiene una probabilidad de ocurrencia muy baja y no suele producirse
nunca si trabajamos con imgenes naturales. La capacidad de compactacin de la energa
de la DCT es muy superior a la que se obtiene con las transformadas de Walsh-
Hadamard, Hart y tambin Fourier. La transformada Karhunen-Loeve consigue una
compactacin ptima, aunque al precio de un elevado coste computacional. La
transformada Wavelet tambin consigue concentrar la energa en unos pocos
coeficientes, aunque en este caso, la posicin de los coeficientes con mayor energa
depende de la imagen.

2) Es una transformada independiente de los datos. Esto significa que el algoritmo es
independiente del contenido de la imagen. Prcticamente todas las transformadas que
hemos venido comentando son independientes de los datos, con la excepcin de la
Karhunen-Loeve, donde las matrices asociadas a la transformacin deben calcularse en
funcin de las caractersticas de la propia imagen. Por este motivo, la transformada de
Karhunen Loeve es ptima en el sentido de compactacin de energa.

3) Existen algoritmos eficientes para el clculo rpido. Existen algoritmos anlogos al de la
FFT para realizar la transformacin. Los algoritmos se encuentran disponibles en
circuitos integrados especializados en realizar esta transformacin. La restriccin para
poder utilizar estos algoritmos es que los bloques tengan un tamao que sea mltiplo de
una potencia de dos. Si no es as, debern aadirse ceros a las subimgenes, aunque esto
supone que aumenta notablemente el riesgo de que aparezca el efecto de bloques al
decodificar la imagen.

4) Errores reducidos en los contornos de los bloques. Probablemente ste es uno de los
motivos principales por los que se ha elegido la DCT frente a otras transformadas. La
presencia de errores de codificacin muy pequeos en los lmites de la subimagen es
necesaria para evitar la aparicin del efecto de bloques en la imagen reconstruida.
Compararemos las prestaciones de la DCT con la transformada de Fourier para ilustrar
esta caracterstica.

5) Identificacin e interpretacin frecuencial de los componentes transformados. Para
aprovechar al mximo la capacidad de compresin de un mtodo es conveniente que los
coeficientes puedan interpretarse desde el punto de vista frecuencial con facilidad. Esto
permite introducir conceptos psico-visuales, permitiendo dedicar un menor nmero de
bits a aquellas componentes que de antemano sabemos que no resultan crticas para el
sistema visual.

4.7.1 Definicin de la transformada coseno unidimensional
Nuestro objetivo en este apartado es presentar los conceptos elementales de la transformada coseno
unidimensional y razonar su uso en la compresin de informacin. No pretendemos realizar un
anlisis exhaustivo de las propiedades de esta transformada ni justificar matemticamente los
procedimientos utilizados en la codificacin de seales. Se supone no obstante, que el lector dispone
de conocimientos bsicos sobre la transformada discreta de Fourier, ya que la utilizaremos para
realizar algunas comparaciones entre ambas.

La transformada coseno discreta de una secuencia unidimensional x[n] de N muestras de longitud se
define como:

[ ] [ ] [ ]
( )
1 0 1 0
2
1 2
cos
1
0

,
_
N k N n
N
k n
n x k k C
N
n
(4.18)

donde el coeficiente [k] viene determinado por:

[ ]
'

1 ,...., 1 2/N
0 si / 1
N k si
k N
k (4.19)

La transformada inversa permite determinar la secuencia original a partir de los coeficientes C[k]
mediante el uso de la ecuacin:

[ ] [ ] [ ]
( )
1 0 1 0
2
1 2
cos
1
0

,
_
N k N n
N
k n
k C k n x
N
k
(4.20)

Existen otras variantes de esta transformada en las que las ecuaciones y factores numricos en la
funcin coseno son ligeramente distintos, pero que no sern consideradas en este texto.

Las ecuaciones anteriores tienen cierto parecido con las de la transformada discreta de Fourier, con la
salvedad de las expresiones en los ndices en la funcin y, sobre todo, en que las exponenciales
complejas se sustituyen por funciones coseno. La diferencia ms importante entre ambas funciones es
que la transformada discreta de Fourier (DFT, Discrete Fourier Transform) es compleja, mientras que
la DCT es real. Esto supone, ya de entrada, una mejor compactacin de la informacin, puesto que de
N muestras reales mantenemos un total de N coeficientes reales que las representan. En la figura 4.24
se muestran los resultados de aplicar la DCT y la DFT a un fragmento de 16 muestras de una lnea de
una imagen. Obsrvese que para representar la informacin mediante la DFT se requiere disponer
tanto del mdulo como de la fase mientras que con la DCT toda la informacin queda compactada en
los 16 coeficientes.

Ambas transformadas realizan una compactacin de la energa en unos pocos coeficientes que se
concentran en las zonas de baja frecuencia. En el caso de la DCT, los coeficientes con mayor energa
son los se corresponden con el origen (valor medio de la seal), el primer y el segundo coeficiente. En
la DFT tienen una magnitud considerable el coeficiente de continua, el primer coeficiente y el ltimo.
Recurdese que en la DFT los coeficientes centrales corresponden a alta frecuencia y que los situados
al final de la secuencia se corresponderan con las frecuencias negativas. As, como la seal es real, el
primer y ltimo coeficiente tienen el mismo mdulo y fases cambiadas de signo.

Fig. 4.24 Transformadas de Fourier y Coseno de una secuencia de 16 muestras

0 2 4 6 8 1 0 1 2 1 4 1 6
0 . 2 5
0 . 3
0 . 3 5
0 . 4
0 . 4 5
0 . 5
0 . 5 5
0 . 6
0 . 6 5
0 . 7
0 . 7 5
16 muestras de un
fragmento de imagen
0 2 4 6 8 1 0 1 2 1 4 1 6
- 1
- 0. 5
0
0 . 5
1
1 . 5
2
Transformada Fourier
Mdulo
DCT
DFT
0 2 4 6 8 1 0 1 2 1 4 1 6
0
1
2
3
4
5
6
7
8
0 2 4 6 8 1 0 1 2 1 4 1 6
- 3
- 2
- 1
0
1
2
3
4
Transformada Coseno
Discreto
Fase
0 2 4 6 8 1 0 1 2 1 4 1 6
0 . 2 5
0 . 3
0 . 3 5
0 . 4
0 . 4 5
0 . 5
0 . 5 5
0 . 6
0 . 6 5
0 . 7
0 . 7 5
16 muestras de un
fragmento de imagen
0 2 4 6 8 1 0 1 2 1 4 1 6
- 1
- 0. 5
0
0 . 5
1
1 . 5
2
Mdulo
DCT
DFT
0 2 4 6 8 1 0 1 2 1 4 1 6
0
1
2
3
4
5
6
7
8
0 2 4 6 8 1 0 1 2 1 4 1 6
- 3
- 2
- 1
0
1
2
3
4
Transformada Coseno
Discreto
Fase
De acuerdo con estos resultados, podemos cuestionarnos cmo se reconstruira la seal original si los
coeficientes con valor ms pequeo se suponen nulos y no se codifican. En principio, como estos
coeficientes tienen un valor pequeo, representan nicamente una pequea fraccin de la energa de la
seal, por lo que los errores de reconstruccin debern ser tambin pequeos. Podra argumentarse
que si nicamente se codifican los coeficientes con mayor energa, nunca podremos codificar
correctamente los cambios rpidos, es decir, las componentes de alta frecuencia en la imagen. Esto no
tiene por qu ser cierto si nuestra poltica es la de codificar todos aquellos componentes que tengan
una magnitud representativa, sean de baja o de alta frecuencia, y eliminar los que tengan una energa
reducida. Esta es la poltica que se utiliza en la mayora de estndares de compresin que
consideraremos.

En la figura 4.25 representamos las seales reconstruidas utilizando nicamente 11 y 9 coeficientes en
las ecuaciones de reconstruccin de la seal mediante los coeficientes transformados (ecuaciones de la
transformada inversa). Como puede observarse, en las dos transformadas, las aproximaciones
obtenidas son bastante buenas. Los coeficientes que se han descartado son los asociados a la parte de
alta frecuencia tanto para la DFT como para la FFT.

Fig. 4.25 Reconstruccin de la informacin original utilizando slo parte de los coeficientes transformados

Para justificar estos resultados es necesario indicar que tanto la DFT como la DCT son transformadas
ortonormales. Esto significa que la energa de la seal puede determinarse, bien como la suma de las
muestras al cuadrado, o bien como la suma de los coeficientes transformados al cuadrado. La energa
del error de reconstruccin ser, por tanto, proporcional a la energa de los coeficientes que no hayan
sido utilizados en la reconstruccin. Si estos coeficientes son pequeos, el error de reconstruccin
IDCT 11 coeficientes
IDCT 9 coeficientes
IDFT 11 coeficientes
IDFT 9 coeficientes
0 2 4 6 8 1 0 1 2 1 4 1 6
0 . 2 5
0 . 3
0 . 3 5
0 . 4
0 . 4 5
0 . 5
0 . 5 5
0 . 6
0 . 6 5
0 . 7
0 . 7 5
0 2 4 6 8 1 0 1 2 1 4 1 6
0 . 2 5
0 . 3
0 . 3 5
0 . 4
0 . 4 5
0 . 5
0 . 5 5
0 . 6
0 . 6 5
0 . 7
0 . 7 5
0 2 4 6 8 1 0 1 2 1 4 1 6
0 . 2 5
0 . 3
0 . 3 5
0 . 4
0 . 4 5
0 . 5
0 . 5 5
0 . 6
0 . 6 5
0 . 7
0 . 7 5
0 2 4 6 8 1 0 1 2 1 4 1 6
0 . 2 5
0 . 3
0 . 3 5
0 . 4
0 . 4 5
0 . 5
0 . 5 5
0 . 6
0 . 6 5
0 . 7
0 . 7 5
IDCT 11 coeficientes
IDCT 9 coeficientes
IDFT 11 coeficientes
IDFT 9 coeficientes
0 2 4 6 8 1 0 1 2 1 4 1 6
0 . 2 5
0 . 3
0 . 3 5
0 . 4
0 . 4 5
0 . 5
0 . 5 5
0 . 6
0 . 6 5
0 . 7
0 . 7 5
0 2 4 6 8 1 0 1 2 1 4 1 6
0 . 2 5
0 . 3
0 . 3 5
0 . 4
0 . 4 5
0 . 5
0 . 5 5
0 . 6
0 . 6 5
0 . 7
0 . 7 5
0 2 4 6 8 1 0 1 2 1 4 1 6
0 . 2 5
0 . 3
0 . 3 5
0 . 4
0 . 4 5
0 . 5
0 . 5 5
0 . 6
0 . 6 5
0 . 7
0 . 7 5
0 2 4 6 8 1 0 1 2 1 4 1 6
0 . 2 5
0 . 3
0 . 3 5
0 . 4
0 . 4 5
0 . 5
0 . 5 5
0 . 6
0 . 6 5
0 . 7
0 . 7 5
tambin lo ser. Por otra parte, conviene insistir en una diferencia importante entre los resultados que
se obtienen con cada una de las transformadas. Aunque los errores totales de la aproximacin sean
prcticamente iguales para las dos transformadas, la DCT consigue un error prcticamente nulo en los
dos extremos de la seal, mientras que en la DFT, ambos extremos son recuperados con errores
considerables. Este resultado es extremadamente importante y supone que la DFT apenas tenga
aplicacin prctica en la codificacin de imgenes por bloques. En efecto, si codificamos la seal por
bloques y luego la reconstruimos superponiendo los errores resultantes, los errores en la codificacin
de los puntos extremos producirn cambios de nivel abruptos que sern fcilmente visibles,
produciendo el mencionado efecto de bloques en la imagen reconstruida.

La razn por la que la DCT produce resultados excelentes en los puntos extremos no es trivial ni
sencilla de explicar. Para ello, deben interpretarse la DCT y la DFT como si se tratara de desarrollos
en serie de Fourier de seales peridicas. La idea de esta interpretacin es sencilla, se trata de
determinar una seal peridica, cuyo desarrollo en serie de Fourier, produce los mismos coeficientes
que los que obtenemos aplicando la DCT o la DFT. Los resultados se ilustran en la figura 4.26, donde
se representa una seal de duracin finita x[n] junto con sus extensiones peridicas equivalentes a la
DCT y a la DFT. En el segundo caso, la extensin peridica consiste simplemente en repetir la forma
bsica de la seal en el tiempo. El desarrollo en serie de Fourier de esta seal peridica producir los
mismos coeficientes transformados que la DFT. Sin embargo, para obtener los coeficientes de la DCT
se debe realizar la extensin peridica de la seal base de una forma algo ms compleja, reflejando la
seal base respecto a la ltima muestra y recorrindola en sentido inverso. El periodo fundamental de
la seal es ahora el doble que su duracin original. Ntese que, como esta seal base tiene simetra
respecto a los coeficientes centrales, las exponenciales complejas de la serie de Fourier cancelarn sus
componentes imaginarios dando lugar a coeficientes reales.

Fig. 4.26 Desarrollos peridicos implcitos en la DCT y la DFT

Con estos resultados es evidente que las mejoras en la aproximacin de los puntos extremos en la
DCT se deben a que la forma en que se realiza su extensin peridica implica que no aparezcan
Seal base
2D
D
DFT DCT
Seal base DCT
Seal base DFT
Extensin peridica DCT
Extensin peridica DFT
Seal base
2D
D
DFT DCT
Seal base DCT
Seal base DFT
Extensin peridica DCT
Extensin peridica DFT
cambios bruscos en la secuencia. En la extensin peridica asociada a la DFT, los cambios entre el
origen y el final de la secuencia base slo pueden aproximarse correctamente si se tienen en cuenta
todos los trminos de alta frecuencia, ya que la aparicin de las discontinuidades slo pueden
aproximarse mediante el uso de estos componentes. Si estos no intervienen en la reconstruccin de la
seal, se producen errores significativos en estas regiones.

En este punto conviene recordar que hemos comentado que es conveniente imponer que los tamaos
de los bloques sean una potencia de 2, para poder utilizar algoritmos de clculo rpido. En el contexto
de la DFT, es habitual introducir ceros adicionales a la seal para que la longitud final sea una
potencia de 2; sin embargo, con la DCT, la introduccin de ceros tiene como coste adicional que se
rompe con la naturaleza continua de su extensin peridica, por lo que perderemos la propiedad de
aproximar con precisin las muestras extremas del bloque de seal. En este caso, pues, es
extremadamente importante que los tamaos de los bloques sean una potencia de 2.

4.7.2 Extensin de la transformada coseno a dos dimensiones
La transformada coseno puede extenderse de forma directa a dos dimensiones. La ecuacin que se
utiliza para la transformada directa es:

[ ] [ ] [ ] [ ]
( ) ( )
,
_
+

,
_
+

1
0
1
0
2
1 2
cos
2
1 2
cos , ,
N
n
M
m
M
l m
N
k n
m n x l k l k C (4.21)

donde suponemos que el bloque de imagen x[n,m] tiene unas dimensiones de N filas por M columnas,
lo que define el mbito de validez de los ndices n y k entre 0 y N-1 y de los ndices m y l entre 0 y M-
1. En general slo trataremos con bloques cuadrados cuyos tamaos son, como hemos comentado en
el apartado anterior, una potencia de 2.

La transformada inversa puede obtenerse de forma anloga:

[ ] [ ] [ ] [ ]
( ) ( )
,
_
+

,
_
+

1
0
1
0
2
1 2
cos
2
1 2
cos , ,
N
k
M
l
M
l m
N
k n
l k C l k m n x (4.22)

Las transformadas bidimensionales pueden obtenerse a partir de las transformadas unidimensionales.
Para ello, es necesario aplicar la transformada unidimensional a las filas del bloque de imagen y
posteriormente, sobre los resultados obtenidos, aplicar nuevamente la transformada unidimensional
sobre las columnas. Este esquema de tratamiento de la imagen mediante transformadas
unidimensionales se ilustra en la figura 4.27. Evidentemente, puede intercambiarse el orden del
anlisis entre filas y columnas. En general, los algoritmos que procesan la imagen de acuerdo con la
expresin bidimensional de la ecuacin 4.22 suelen ser ms eficientes que los algoritmos
unidimensionales.

En la figura 4.28 se muestra el resultado de aplicar la transformada coseno a los niveles de gris de un
bloque de la imagen. Obsrvese cmo los coeficientes de mayor peso quedan concentrados alrededor
de la esquina superior izquierda. Esta figura pretende mostrar el concepto de los mtodos
transformados desde un punto de vista puramente computacional. La matriz de la izquierda, en el
dominio espacial y la matriz de la derecha, en el dominio de la transformada coseno, representan
exactamente la misma informacin y puede pasarse de una matriz a la otra aplicando la transformada
directa o la transformada inversa. Es evidente que, si los resultados obtenidos con este bloque de
imagen son generalizables a cualquier otro bloque, la representacin en el dominio transformado
realiza una compactacin considerable de la energa de la seal en unos pocos coeficientes.

Fig. 4.27 Clculo de la transformada coseno de una imagen a partir de transformadas 1D

Fig. 4.28 Ejemplo numrico de una transformada coseno de un bloque de imagen
DCT- 1D
Por filas
Imagen
Intermedia
DCT- 1D
Por columnas
Transformada
Coseno 2D
Imagen
Original
DCT- 1D
Por filas
Imagen
Intermedia
DCT- 1D
Por columnas
Transformada
Coseno 2D
Imagen
Original
112 121 110 111 117 127 123 124 135
109 114 117 111 118 119 121 124 127
113 112 106 105 115 124 130 135 138
108 111 113 115 114 108 110 100 105
97 100 95 91 86 82 95 91 77
64 64 71 60 53 55 53 39 48
66 71 73 66 73 66 64 68 72
74 82 91 95 84 97 104 99 112
73 75 80 96 93 115 142 163 147
3.4566 -0.1800 0.0404 -0.0085 -0.0424 -0.0157 0.0080
0.4573 0.1073 -0.0001 0.0263 0.0400 -0.0435 -0.0198
0.3914 -0.2934 0.0460 -0.0023 -0.0005 -0.0011 -0.0052
-0.4465 0.1948 -0.0244 -0.0221 0.0203 -0.0514 0.0090
0.0677 -0.0267 0.0081 0.0227 -0.0347 0.0354 -0.0061
0.1118 0.0566 -0.0318 -0.0200 0.0214 -0.0204 0.0058
-0.0528 -0.0462 0.0116 0.0143 0.0254 -0.0076 -0.0061
-0.0086 -0.0158 0.0206 0.0131 -0.0040 -0.0182 0.0318
0.0751 -0.0661 0.0500 0.0325 -0.0069 0.0214 -0.0440
-0.0160 0.0028
-0.0031 0.0110
0.0057 -0.0333
0.0021 0.0128
-0.0122 -0.0182
-0.0215 -0.0026
0.0054 -0.0041
-0.0120 -0.0121
0.0082 -0.0067
Imagen Original Transformada Coseno
Transformada Directa
Transformada Inversa
112 121 110 111 117 127 123 124 135
109 114 117 111 118 119 121 124 127
113 112 106 105 115 124 130 135 138
108 111 113 115 114 108 110 100 105
97 100 95 91 86 82 95 91 77
64 64 71 60 53 55 53 39 48
66 71 73 66 73 66 64 68 72
74 82 91 95 84 97 104 99 112
73 75 80 96 93 115 142 163 147
3.4566 -0.1800 0.0404 -0.0085 -0.0424 -0.0157 0.0080
0.4573 0.1073 -0.0001 0.0263 0.0400 -0.0435 -0.0198
0.3914 -0.2934 0.0460 -0.0023 -0.0005 -0.0011 -0.0052
-0.4465 0.1948 -0.0244 -0.0221 0.0203 -0.0514 0.0090
0.0677 -0.0267 0.0081 0.0227 -0.0347 0.0354 -0.0061
0.1118 0.0566 -0.0318 -0.0200 0.0214 -0.0204 0.0058
-0.0528 -0.0462 0.0116 0.0143 0.0254 -0.0076 -0.0061
-0.0086 -0.0158 0.0206 0.0131 -0.0040 -0.0182 0.0318
0.0751 -0.0661 0.0500 0.0325 -0.0069 0.0214 -0.0440
-0.0160 0.0028
-0.0031 0.0110
0.0057 -0.0333
0.0021 0.0128
-0.0122 -0.0182
-0.0215 -0.0026
0.0054 -0.0041
-0.0120 -0.0121
0.0082 -0.0067
Imagen Original Transformada Coseno
Transformada Directa
Transformada Inversa
En la figura 5.29 se representan, utilizando niveles de gris, una subimagen de 16x16 elementos y su
transformada coseno. En este ejemplo, los niveles altos de la transformada coseno se representan
como blancos, mientras que a los niveles bajos se les ha asignado el negro. Tambin se representa un
diagrama en tres dimensiones de los coeficientes transformados. Nuevamente, los niveles de los
coeficientes decrecen a medida que nos alejamos del extremo superior izquierdo, siendo la mayora
prximos a cero.

Fig. 4.29 Representacin de un bloque de imagen y su transformada coseno

La ecuacin 4.22 sugiere una interpretacin interesante de la transformada coseno. Podemos agrupar
los factores constantes y las funciones coseno en funciones genricas y expresar la imagen como:

[ ] [ ] [ ]

1
0
1
0
,
, , ,
N
k
M
l
l k
m n H l k C m n x (4.23)

donde H
kl
[n,m] representa:

[ ] [ ] [ ]
( ) ( )
,
_
+

,
_
+

M
l m
N
k n
l k m n H
l k
2
1 2
cos
2
1 2
cos ,
,
(4.24)

y pueden interpretarse como un base de subimgenes de tamao NxM cuya forma depende de los
coeficientes k y l. De acuerdo con este punto de vista, los coeficientes transformados C[k,l] nos
indican en qu medida participa cada una de estas subimgenes en la obtencin de la subimagen
original. Por tanto, los bloques originales pueden considerarse como una superposicin de estas
imgenes base donde los coeficientes transformados indican el peso de la imagen base en la
Bloque de Imagen 16x16
Transformada Coseno 2D
Representacin 3D de la
transformada coseno
0
5
10
15
20
0
5
10
15
20
-2
0
2
4
6
8
Compactacin de la Energa Bloque de Imagen 16x16
Transformada Coseno 2D
Representacin 3D de la
transformada coseno
0
5
10
15
20
0
5
10
15
20
-2
0
2
4
6
8
0
5
10
15
20
0
5
10
15
20
-2
0
2
4
6
8
0
5
10
15
20
0
5
10
15
20
-2
0
2
4
6
8
Compactacin de la Energa
reconstruccin de la imagen final. Los coeficientes prximos a cero pueden, por tanto, eliminarse sin
que afecten a la calidad de la imagen reconstruida, ya que su matriz asociada apenas tiene
contribucin en la imagen original.

En la figura 4.30 se representa la imagen base obtenida para k=0 y l=2, tanto en forma de niveles de
gris como en grfico tridimensional. La subimagen es constante en el sentido horizontal y tiene una
oscilacin lenta en el vertical, concretamente de un periodo completo. Por tanto, el coeficiente
asociado a esta matriz base tendr en cuenta las variaciones lentas en el sentido vertical de la imagen
original. Ntese que en el ejemplo de la figura 5.29, en el que la imagen era bsicamente un contorno
horizontal (variaciones de baja frecuencia en el sentido vertical), los coeficientes transformados de
mayor peso eran los que se obtenan para los primeros valores de la variable l (l=0, l=1, l=2, l=3 y
l=4) manteniendo la variable k=0. Este resultado indica que predominaban los cambios lentos en el
sentido vertical.

Fig. 4.30 Representacin de la imagen base H
02
[n,m]

Tal y como se desprende de la ecuacin 4.24, las imgenes base estn formadas por productos de dos
funciones cosenoidales cuyas frecuencias estn directamente relacionadas con las variables k y l. La
variable k acta directamente sobre el eje vertical (componente n de la imagen) mientras que la l lo
hace sobre el eje horizontal. A medida que k o l aumentan, aumenta la frecuencia de la funcin
coseno, por lo que se producen un mayor nmero de oscilaciones. En consecuencia, los valores de k y
l pequeos representan zonas de baja frecuencia mientras que los valores altos representan alta
frecuencia.

Las imgenes base que obtenemos para todos los pares de valores k y l con una transformada coseno
de 8x8 muestras se representan en la figura 4.31. Si observamos la primera fila de imgenes base
(k=0) vemos que la frecuencia horizontal de la seal va aumentando a medida que aumenta el valor de
l. En cambio, si mantenemos l=0 y nos desplazamos en el sentido vertical, aumenta la frecuencia
vertical manteniendo la imagen constante en el eje horizontal. Las zonas donde tanto l como k son
elevados corresponden a zonas de alta frecuencia en los dos sentidos. Es importante que el lector
retenga dnde se sitan las imgenes base y sus contenidos frecuenciales para interpretar
correctamente los resultados de una transformada coseno.
0
2
4
6
8
0
2
4
6
8
-0.2
-0.1
0
0.1
0.2
0
2
4
6
8
0
2
4
6
8
-0.2
-0.1
0
0.1
0.2
0
2
4
6
8
0
2
4
6
8
-0.2
-0.1
0
0.1
0.2
0
2
4
6
8
0
2
4
6
8
-0.2
-0.1
0
0.1
0.2

Fig. 4.31 Representacin de las imgenes base de la transformada coseno 2D de 8x8

El resultado de una transformada puede interpretarse directamente a partir del conjunto de las
imgenes base. En la figura 4.32 se muestran los valores numricos que se obtienen en la
transformada 4x4 de un bloque de imagen. Estos valores indican el grado en que interviene cada
imagen base en la reconstruccin del bloque de imagen original. La posicin de las imgenes base es
la misma que la de los coeficientes en la transformada, por lo que los resultados de la transformada
pueden proporcionar una idea inmediata del contenido frecuencial de la seal. En la figura 4.33 se
representa una imagen y los resultados de aplicar la transformada coseno a los bloques de 16x16
pxeles que la constituyen. Las transformadas coseno se representan invertidas en nivel de gris, es
decir, los valores prximos a cero se muestran en blanco y los valores altos en negro. Los resultados
de las transformadas se representan en la misma posicin que el bloque de imagen al cual
corresponden.

Advirtase que en las zonas que en la imagen original son uniformes se obtiene una transformada
coseno en la que prcticamente slo intervienen los primeros coeficientes de la zona superior
izquierda, mientras que en las zonas con detalles de alta frecuencia (plumas, sombrero, etc) tambin
son importantes los coeficientes de alta frecuencia, aumentando el contenido de las matrices
transformadas en estas regiones. Obsrvese tambin cmo en las zonas con presencia de contornos
verticales nicamente son significativos los coeficientes de alta frecuencia situados en la parte
superior izquierda de las matrices transformadas.
10 20 30 40 50 60
10
20
30
40
50
60
10 20 30 40 50 60
10
20
30
40
50
60
10 20 30 40 50 60
10
20
30
40
50
60
Un buen mtodo de codificacin deber ser capaz de advertir todas estas diferencias y codificar ms o
menos coeficientes en funcin de las caractersticas de la transformada. La propiedad de que la
posicin de los coeficientes transformados est directamente relacionada con el contenido frecuencial
de la imagen base puede ser aprovechada para mejorar la compresin, basndonos en las
caractersticas del sistema visual.

Fig 4.32 Interpretacin de la transformada coseno como combinacin lineal de imgenes base

Fig. 4.33 Representacin de las transformadas coseno de los bloques de una imagen

El sistema visual es bastante crtico con codificaciones imprecisas de las componentes de baja
frecuencia, por lo que es conveniente que estas regiones sean codificadas con bastante exactitud.
Respecto a la alta frecuencia, el sistema visual tolera bastante bien que su codificacin sea imprecisa,
siempre que est presente en la imagen decodificada. Si no est presente, se observa una prdida en
7 5 0.4 0.2
4 1 0.25 0.1
0.3 0.2 0.08 0.01
0.1 0.05 0.02 0.003
La imagen x[n,m] puede representarse como:
7 H
00
+5 H
01
+4 H
10
+0.3 H
02
+1 H
11
+0,4 H
02
+....
Transformada Coseno
7 5 0.4 0.2
4 1 0.25 0.1
0.3 0.2 0.08 0.01
0.1 0.05 0.02 0.003
La imagen x[n,m] puede representarse como:
7 H
00
+5 H
01
+4 H
10
+0.3 H
02
+1 H
11
+0,4 H
02
+....
Transformada Coseno
los detalles de la imagen y un desenfoque aparente de la misma que resulta molesto. La codificacin
imprecisa de la alta frecuencia significa que pueden utilizarse cuantificadores con pocos niveles. El
sistema visual acepta bastante bien que los cambios de nivel de gris en un contorno no coincidan
exactamente con los de la imagen original, siempre y cuando existan estos cambios bruscos que
permiten definir los objetos y aportan nitidez a la imagen resultante. Bsicamente, existen dos
estrategias para codificar los coeficientes de la transformada coseno: la codificacin por zonas y la
codificacin por umbral, cuya filosofa examinaremos con cierto detalle en los siguientes apartados.

4.7.3 Codificacin por zonas
La codificacin por zonas se basa en establecer un procedimiento para determinar qu coeficientes
transformados son codificados y cules no. El procedimiento para determinar las zonas que se
codifican puede ser de aplicacin general, es decir, invariable para todas las imgenes que se
codifican, o depender del contenido especfico de la imagen. En el primer caso, suele suponerse que
las imgenes pueden modelarse como algn proceso estocstico predefinido (normalmente Markov)
con el que puede realizarse una estimacin a priori de las varianzas y mrgenes dinmicos de los
coeficientes transformados. A partir de este modelo y en funcin de la compresin deseada, se decide
qu coeficientes sern codificados. Esto da lugar a una mscara como la de la figura 4.34, en la que
los coeficientes que se codifican se representan como un uno, mientras que los que no se codifican se
representan como un cero. En general, slo se codifican los coeficientes para los que se estima una
varianza significativa en funcin del contenido de la imagen, que suelen ser de baja frecuencia y se
sitan cerca del coeficiente de continua.

En la mayora de aplicaciones es habitual utilizar distintas resoluciones del cuantificador en funcin
de la posicin de los coeficientes. As, los coeficientes ms importantes se codifican con un mayor
nmero de bits, mientras que los menos significativos o los que el sistema visual no percibe con tanta
sensibilidad se codifican con menor precisin. Una forma de indicar el nmero de bits con que se
codifica cada coeficientes es mediante una mscara como la de la figura 4.34, pero en la que se indica
especficamente el nmero de bits utilizado para cada coeficiente. En la figura 4.35 se muestra una
posible distribucin de los bits en funcin de la posicin de los coeficientes.

Fig. 4.34 Ejemplo de mscara de coeficientes para la codificacin por zonas
1 1 1 1 1 0 0 0
1 1 1 0 0 0 0 0
1 1 0 0 0 0 0 0
1 0 0 0 0 0 0 0
1 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
1 1 1 1 1 0 0 0
1 1 1 0 0 0 0 0
1 1 0 0 0 0 0 0
1 0 0 0 0 0 0 0
1 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0

Fig. 4.35 Codificacin por zonas con nmero de bits variable en funcin de la importancia del coeficiente

Una variante de la codificacin por zonas fija consiste en evaluar, para cada imagen, la dinmica de
las transformadas coseno de todos los bloques que la constituyen y decidir, posteriormente, cmo
debe realizarse la asignacin de zonas a codificar en funcin de la imagen. El procedimiento consiste
en determinar las transformadas coseno de cada bloque de la imagen y posteriormente estimar la
potencia o la varianza de cada uno de los coeficientes. Para codificar la imagen se utilizarn los
coeficientes con los que se haya obtenido una varianza mayor.

Fig. 4.36 Una imagen y los 8 coeficientes transformados ms representativos

Esta estrategia tiene la ventaja de que, si la imagen tiene mucho contenido en una determinada
frecuencia espacial o direccin, estos coeficientes tendrn mayor importancia y sern codificados
correctamente. Generalmente, se dispone de un nmero total de bits con el que debe realizarse la
codificacin de la imagen y stos se asignan en funcin de la importancia relativa de cada coeficiente.
Este procedimiento tiene la ventaja de que la imagen se codifica de forma ms eficiente, aunque es
necesario realizar un estudio previo de la varianza de los coeficientes transformados, lo que supone
12 8 6 4 2 2 0 0
8 6 2 2 0 0 0 0
6 2 2 0 0 0 0 0
4 2 0 0 0 0 0 0
2 0 0 0 0 0 0 0
2 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
12 8 6 4 2 2 0 0
8 6 2 2 0 0 0 0
6 2 2 0 0 0 0 0
4 2 0 0 0 0 0 0
2 0 0 0 0 0 0 0
2 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
una mayor carga computacional. Tambin deberemos almacenar, junto con los coeficientes, la
mscara zonal que ha sido utilizada y los bits asignados a cada uno de los coeficientes. En la figura
4.36 se representa una posible mscara obtenida utilizando este procedimiento y utilizando
nicamente los 8 coeficientes ms representativos. En este caso, la imagen tiene muchos detalles en el
sentido horizontal y vertical, por lo que los coeficientes con mayor varianza se concentran en la
primera fila y primera columna.

La seleccin entre un mtodo de codificacin zonal fijo o uno adaptado a la imagen depende de las
caractersticas de las imgenes con que operemos, el tiempo de proceso que podamos dedicar y el
factor de compresin que deseemos obtener.

4.7.4 Codificacin por umbral
Esta estrategia suele proporcionar mejores resultados que la codificacin por zonas y consiste en
utilizar nicamente aquellos coeficientes que superen un determinado umbral. Los coeficientes por
debajo de este lmite se suponen nulos. El anlisis de umbral se realiza de forma independiente para
cada bloque. En general, la mayora de los coeficientes de un bloque transformado no superarn el
umbral y se codificarn como ceros. El inconveniente es que, al no conocer a priori qu coeficientes
superarn o no el umbral, deberemos codificarlos todos. Sin embargo, como la mayora son nulos,
pueden codificarse de forma muy eficiente utilizando alguna variante de los mtodos de codificacin
mediante series de ceros.

Para optimizar el nmero de ceros consecutivos que aparecen al codificar la matriz transformada,
suelen ordenarse los coeficientes en la secuencia que se representa en la figura 4.37. El recorrido en
zigzag diagonal permite que los coeficientes de baja frecuencia sean los primeros en codificarse,
independientemente de que correspondan a frecuencias horizontales o verticales. Los ltimos
coeficientes siempre corresponden a frecuencias elevadas, por lo que, lo ms probable, es que la
mayora de ellos sean nulos y se produzcan series largas de ceros consecutivos.

Fig. 4.37 Secuencia de ordenacin de los coeficientes transformados en la codificacin por umbral
1
64
1
64
La ventaja de este procedimiento es que, si en un bloque aislado de la imagen existe una componente
de alta frecuencia significativa, su coeficiente transformado superar el umbral y ser codificado
correctamente, proporcionando una excelente calidad en la imagen reconstruida. En general, la
codificacin por umbral suele obtener unos factores de compresin algo inferiores a la codificacin
zonal. No obstante, la calidad final de las imgenes es bastante superior. Los estndares JPEG y
MPEG utilizan variantes de la codificacin por umbral de la transformada coseno.

En la figura 4.38 se representa una posible codificacin de un bloque transformado mediante la
tcnica de umbral. Los resultados se representan de forma esquemtica, indicando el nivel para los
coeficientes que superan el umbral y el nmero de elementos para las secuencias de ceros
consecutivos (se muestran precedidas de una C). Para optimizar la compresin es habitual insertar un
cdigo especial, que indica que todos los elementos restantes de la matriz no superan el umbral y que
por lo tanto pueden aproximarse por cero. Este cdigo se indica con el smbolo END en este ejemplo.
Como en el caso de la codificacin zonal pueden utilizarse cuantificadores con distinta precisin en
funcin de la posicin del coeficiente, con lo que conseguimos adecuar los bits dedicados a cada
trmino a las caractersticas del sistema visual humano. En las secciones siguientes describiremos
cmo se realizan estas asignaciones de bits a los coeficientes en los estndares de codificacin ms
populares.

Fig. 4.38 Ejemplo de codificacin por umbral

4.8 Codificacin de imgenes estacionarias: el estndar JPEG
El estndar de codificacin de imgenes estacionarias JPEG ha tenido un gran xito y actualmente es
soportado por prcticamente todas las aplicaciones informticas que requieren el manejo de imgenes.
Tambin se utiliza como formato de almacenamiento bsico en cmaras de fotografa digital y en
algunas tarjetas de digitalizacin de vdeo en las que cada fotograma se codifica en JPEG de forma
individual, lo que permite obtener una secuencia de imgenes comprimidas de elevada calidad que,
72 12 11 7 1 3 0 0
18 14 5 2 1 0 0 0
10 6 0 0 0 7 0 0
8 1 0 0 0 0 0 0
2 0 0 0 0 0 0 0
1 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
Cdigo: 72, 12, 18, 10, 14, 11, 7, 5, 6, 8, 2, 1, C1, 2, 1, 3, 1, C3, 1, C9, 7, END
72 12 11 7 1 3 0 0
18 14 5 2 1 0 0 0
10 6 0 0 0 7 0 0
8 1 0 0 0 0 0 0
2 0 0 0 0 0 0 0
1 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
Cdigo: 72, 12, 18, 10, 14, 11, 7, 5, 6, 8, 2, 1, C1, 2, 1, 3, 1, C3, 1, C9, 7, END
posteriormente, puede recodificarse mediante sistemas que aprovechen no slo la redundancia
espacial, sino tambin la temporal. Hasta la aparicin de otros codificadores ms adecuados, el
formato JPEG tambin se utiliz para transmitir imgenes de vdeo conferencia de baja calidad en
tiempo real.

El formato JPEG recibe su nombre del grupo IEC JTC1/SC29/WG10 de la ISO, conocido como el
Joint Photographic Experts Group, que en 1982 inician las sesiones para establecer un conjunto de
formatos que permitan obtener una codificacin eficiente de imgenes estacionarias. El objetivo
principal del grupo de trabajo es establecer un conjunto de recomendaciones, de uso pblico, que
mitiguen la aparicin de formatos propietarios para la codificacin de imgenes en soporte
informtico. En 1986 se incorpora el grupo SGVIII del CCITT para trabajar conjuntamente en la
definicin bsica del formato. Las primeras recomendaciones aprobadas del estndar aparecen en
1991.

Actualmente el JPEG es un formato de alta difusin en multitud de aplicaciones. Peridicamente se
incorporan extensiones, revisiones, mejoras y adiciones con la intencin de actualizar sus prestaciones
a la tecnologa actual. As, recientemente se ha redefinido parte del estndar (JPEG 2000)
introduciendo mtodos basados en la transformada wavelet que permiten mantener la calidad de
imagen para factores de compresin muy elevados. Tambin se ha propuesto una nueva estrategia
para la compresin sin prdidas conocida como JPEG LS (JPEG LosslesS), que est adquiriendo una
amplia difusin.

Los codificadores JPEG se orientan a imgenes multinivel monocromas o de color (mltiples espacios
de coordenadas de color) y pueden considerarse como un conjunto de herramientas que admiten
diferentes modos y estrategias de compresin en funcin de las caractersticas del sistema en el que
debe utilizarse. El JPEG no est diseado para imgenes binarias de documentos grficos o texto, para
las que existe un conjunto de mtodos especficos que se agrupan bajo el estndar JBIG.

Los objetivos que se propusieron la comisin encargada de definir el estndar JPEG pueden
sintetizarse en los siguientes puntos:

a) Conseguir unos codificadores y decodificadores cuyas tasas de compresin y calidades
de imagen se situaran cerca de los lmites de la tecnologa actual.

b) Los mtodos propuestos deban ser tiles para codificar imgenes monocromticas en
niveles de gris, imgenes de color o imgenes multicomponente (p.ej. imgenes
obtenidas por satlites de inspeccin que proporcionan componentes en bandas distintas
al espectro ptico). Adems, los mtodos propuestos deban ser independientes del
tamao y resolucin espacial de la imagen.

c) La implementacin de los mtodos deba poder realizarse mediante software que pueda
ejecutarse en mltiples plataformas de forma eficiente y rpida. Los algoritmos deben
poder realizarse mediante circuitos integrados dedicados de coste reducido o medio.

Los resultados y la difusin del estndar JPEG confirman que todos estos objetivos bsicos han sido
ampliamente logrados.
Los modos de compresin definidos por el estndar JPEG son:

a) Modo de codificacin secuencial. Define los mtodos utilizados para comprimir las
imgenes siguiendo un orden de codificacin de los bloques de izquierda a derecha y de
arriba abajo. El decodificador recupera la imagen en el mismo orden. Existen diversas
variantes de este mtodo, la ms popular es el denominado mtodo base (baseline) que
describiremos con cierto detalle posteriormente.

b) Modo de codificacin progresivo. La imagen se codifica en mltiples exploraciones
utilizando siempre la misma resolucin espacial. El decodificador puede obtener, de
forma rpida, una primera aproximacin de la imagen, que posteriormente se refina al
avanzar el proceso de decodificacin. Es particularmente til para el acceso a imgenes
localizadas en centros remotos en los que las comunicaciones son lentas.

c) Modo de codificacin sin prdidas. Originalmente el JPEG defini un modo sin prdidas
basado en la codificacin diferencial y en estructuras de prediccin simples con
caractersticas muy parecidas a las que hemos considerado en apartados anteriores. Este
modo de codificacin obtiene factores de compresin relativamente bajos (1:2) cuyo uso
en aplicaciones informticas o de transmisin de datos ha sido moderado. Actualmente
se ha propuesto un nuevo mtodo sin prdidas o con prdidas muy pequeas (JPEG LS)
que est creando grandes expectativas.

d) Modo de codificacin jerrquica. La imagen se codifica con distintos niveles de
resolucin, lo que facilita que pueda ser mostrada en distintos tipos de display. La
resolucin ms baja es la primera que se obtiene en el decodificador. A partir de esta
imagen preliminar puede irse decodificando el resto de datos hasta obtener la resolucin
deseada. El proceso de decodificacin puede interrumpirse en cualquier momento.

En esta seccin analizaremos con detalle el denominado modo secuencial base del estndar JPEG, que
es el algoritmo ms utilizado y que forma la base para la codificacin de las imgenes intra en el
estndar MPEG. Proporcionaremos ejemplos detallados de cmo se realizara la codificacin de
imgenes en blanco y negro y su extensin a imgenes de color. Tambin veremos cmo puede
extenderse el modo secuencial base a un modo de codificacin progresivo. Los modos de codificacin
sin prdidas y la codificacin jerrquica no sern considerados.

4.8.1 JPEG: modo secuencial base (baseline)
Este modo de codificacin es, como hemos comentado, el ms ampliamente difundido y constituye la
base para la codificacin de las imgenes de referencia en los estndares de transmisin para
videoconferencia (H.261, H.263), multimedia (MPEG-1) y televisin digital (MPEG-2). Por el
momento consideraremos nicamente la codificacin de imgenes monocromticas con 256 niveles
de gris (8 bits). Otros modos de codificacin del JPEG admiten imgenes de 12 bits. Desde el punto
de vista conceptual, los procedimientos utilizados son anlogos.

En el esquema de la figura 4.39 se representa el procedimiento bsico para codificar la imagen, que se
descompone en bloques de 8x8 pxeles ordenados de forma secuencial, primero por columnas (de
izquierda a derecha) y posteriormente por filas (de arriba abajo). Se extrae la componente de nivel de
gris medio (se resta el nivel 128) a cada uno de los bloques, con lo que las imgenes resultantes
quedan codificadas entre los niveles 128 y 127. A estas subimgenes se les aplica la transformada
DCT bidimensional, obteniendo los resultados con una precisin de 3 bits adicionales respecto a la
precisin de la entrada (11 bits). Los coeficientes resultantes quedan, por tanto, representados dentro
del margen dinmico [1024, 1023]. A estos coeficientes se les aplican tablas de recuantificacin, que
pueden ser definidas por el propio usuario (debern incluirse las tablas en las cabeceras del fichero) o
utilizar las tablas que por defecto recomienda el estndar (tablas de Lohscheller). Finalmente, se
realiza una codificacin de longitud variable de los coeficientes resultantes.

Fig. 4.39 Procedimiento de codificacin del modo secuencial base (baseline)

La cuantificacin de los coeficientes obtenidos mediante la transformada coseno presenta ciertas
peculiaridades que deben ser consideradas con detalle. El tratamiento del coeficiente de continua
(DC), que corresponde al coeficiente (0,0) de la matriz transformada, se debe codificar con mayor
precisin que los coeficientes de alterna (AC). Esto es debido a que los errores en este coeficiente
supondran una variacin del nivel de gris medio de todo el bloque, con lo que la estructura de
codificacin por bloques podra resultar visible en la imagen decodificada. Por este motivo, los
coeficientes DC se codifican en modo diferencial, respecto al coeficiente de continua del bloque
anterior. Este tipo de codificacin supone una extensin del posible margen dinmico de la diferencia
que se extender entre los valores de [-2047, 2047], ya que, aunque con poca probabilidad, es posible
que se produzcan las diferencias entre dos valores extremos de la componente de continua, es decir:
1023-(-1024) 1024-(1023).

Las tablas de cuantificacin indican la importancia relativa de cada coeficiente transformado y suelen
representarse como el paso de cuantificacin con el que se recodificar cada elemento. En la figura
4.40 se representa la tabla de cuantificacin de Lohscheller, que se recomienda para la cuantificacin
de la componente de luminancia en imgenes estticas con una resolucin igual a la del formato ITU
601. Esta tabla se obtiene de forma experimental, a partir de pruebas de calidad subjetivas que tienen
en cuenta la respuesta del sistema visual humano. Obsrvese como el paso de cuantificacin aumenta,
es decir, se utilizan menos niveles, a medida que aumentan las frecuencias. Existen diferencias de
simetra entre las componentes horizontales y verticales que slo se justifican a partir de la naturaleza
experimental con la que se han obtenido los resultados. Tambin debe observarse que el paso de
cuantificacin utilizado para el coeficiente de continua es mayor que los pasos de cuantificacin
utilizados para los componentes AC de baja frecuencia. Este hecho podra parecer contradictorio con
Descomponer
Imagen en
Bloques
Descomponer
Imagen en
Bloques
DCT
DCT
Cuantificador
variable
Cuantificador
variable
Tabla de
cuantificacin
Tabla de
cuantificacin
Codificacin
entrpica
Codificacin
entrpica
Tabla cdigos
HUFFMAN
Tabla cdigos
HUFFMAN
Imagen
comprimida
Descomponer
Imagen en
Bloques
Descomponer
Imagen en
Bloques
DCT
DCT
Cuantificador
variable
Cuantificador
variable
Tabla de
cuantificacin
Tabla de
cuantificacin
Codificacin
entrpica
Codificacin
entrpica
Tabla cdigos
HUFFMAN
Tabla cdigos
HUFFMAN
Imagen
comprimida
la mayor precisin que requiere la codificacin de la componente de continua. Sin embargo, debe
tenerse en cuenta que esta componente se codifica de forma diferencial por lo que, en realidad, el
nmero de niveles con el que se codifica es mayor que el nmero de niveles utilizado para las
componentes AC. As, teniendo en cuenta que el margen dinmico de la componente AC es el doble
que el del resto de componentes, el nmero de niveles de cuantificacin que se utilizan para codificar
esta componente tambin es mayor que el que se utiliza para el resto de componentes (es decir;
2V
max
/16 > V
max
/11).

Fig. 4.40 Matriz de Lohscheller para la cuantificacin de los coeficientes transformados de luminancia

En general, las matrices de cuantificacin dependen del tipo de componente de color que se est
considerando. Las matrices de Lohscheller para las seales de diferencia de color para imgenes con
una resolucin equivalente a la del estndar ITU 601 se proporcionan en la figura 4.41.

Desde un punto de vista operativo, las matrices de cuantificacin se utilizan para determinar el nivel
real con el que se codificar cada coeficiente transformado. El clculo del nivel real se realiza
dividiendo los coeficientes de la DCT por el nmero de pasos de cuantificacin especificados por la
matriz de Lohscheller y aproximando el resultado obtenido por el entero ms prximo.

,
_
uv
uv
uv
Q
DCT
V round (4.25)

donde V
uv
representa los coeficientes definitivos que deberemos codificar, DCT
uv
los coeficientes
originales obtenidos mediante la transformada coseno y Q
uv
la matriz de cuantificacin. En la figura
4.42 se muestra un ejemplo del proceso de cuantificacin completo que se aplica a un bloque de
luminancia de 8x8 pxeles de la imagen original. La matriz superior izquierda muestra los valores
originales de los pxeles de la imagen, mientras que en la de la derecha se ha realizado la sustraccin
16 11 10 16 24 40 51 61
12 12 14 19 26 58 60 55
14 13 16 24 40 57 69 56
14 17 22 29 51 87 80 62
18 22 37 56 68 109 103 77
24 35 55 64 81 104 113 92
49 64 78 87 103 121 120 101
72 92 95 98 112 100 103 99
Matriz de cuantificacin de luminancia Q
uv
16 11 10 16 24 40 51 61
12 12 14 19 26 58 60 55
14 13 16 24 40 57 69 56
14 17 22 29 51 87 80 62
18 22 37 56 68 109 103 77
24 35 55 64 81 104 113 92
49 64 78 87 103 121 120 101
72 92 95 98 112 100 103 99
Matriz de cuantificacin de luminancia Q
uv
del nivel de gris medio. En la matriz izquierda de la lnea inferior se muestra el resultado de aplicar la
transformada coseno al bloque de datos. La componente continua obtenida para este bloque de datos
tiene el valor 1002. En este ejemplo, suponemos que en el bloque anterior habamos obtenido una
componente continua de valor 945, por lo que el resultado que finalmente debemos codificar es la
diferencia entre las dos componentes 1002-945 = 57. La matriz de la parte inferior derecha es el
resultado de la cuantificacin mediante la matriz de Lohscheller.

Fig 4.41 Matriz de Lohscheller para la cuantificacin de los coeficientes transformados de crominancia

Fig. 4.42 Ejemplo de cuantificacin de una subimagen mediante las matrices de Lohscheller

17 18 24 47 99 99 99 99
18 21 26 66 99 99 99 99
24 26 56 99 99 99 99 99
47 66 99 99 99 99 99 99
99 99 99 99 99 99 99 99
99 99 99 99 99 99 99 99
99 99 99 99 99 99 99 99
99 99 99 99 99 99 99 99
Matrices de cuantificacin de crominancia Q
uv
17 18 24 47 99 99 99 99
18 21 26 66 99 99 99 99
24 26 56 99 99 99 99 99
47 66 99 99 99 99 99 99
99 99 99 99 99 99 99 99
99 99 99 99 99 99 99 99
99 99 99 99 99 99 99 99
99 99 99 99 99 99 99 99
17 18 24 47 99 99 99 99
18 21 26 66 99 99 99 99
24 26 56 99 99 99 99 99
47 66 99 99 99 99 99 99
99 99 99 99 99 99 99 99
99 99 99 99 99 99 99 99
99 99 99 99 99 99 99 99
99 99 99 99 99 99 99 99
Matrices de cuantificacin de crominancia Q
uv
87 87 89 112 130 155 203 210
85 91 91 109 125 153 192 215
86 82 100 105 116 143 186 210
79 84 91 91 124 147 186 211
79 86 85 102 121 145 172 200
80 84 84 100 115 133 162 200
90 76 91 101 115 133 152 199
84 86 87 97 112 131 151 190
-41 -41 -39 -16 2 27 75 82
-43 -37 -37 -19 -3 25 64 87
-42 -46 -28 -23 -12 15 58 82
-49 -44 -37 -37 -4 19 58 83
-49 -42 -43 -26 -7 17 44 72
-48 -44 -44 -28 -13 5 34 72
-38 -52 -37 -27 -13 5 24 71
-44 -42 -41 -31 -16 3 23 62
57 -321 101 -30 17 -4
46 -33 3 5 -14 13
3 8 -3 2 5 4
1 -4 -5 5 4 0
1 -6 -3 8 -7 -4
1 -4 2 -1 2 3
-5 3 0 -4 -3 4
0 5 -4 -1 2 6
-1 0
-14 4
-2 -4
-7 -5
-7 1
5 8
-4 0
4 -2
4 -29 10 -2 1 0 0 0
4 -3 0 0 -1 0 0 0
0 1 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
Bloque
original
Extraccin
Gris
Medio
(-128)
DC
K
-DC
K-1
= 1002-945
Resultado DCT
Cuantificacin
Lohscheller
,
_
uv
uv
Q
DCT
round
87 87 89 112 130 155 203 210
85 91 91 109 125 153 192 215
86 82 100 105 116 143 186 210
79 84 91 91 124 147 186 211
79 86 85 102 121 145 172 200
80 84 84 100 115 133 162 200
90 76 91 101 115 133 152 199
84 86 87 97 112 131 151 190
-41 -41 -39 -16 2 27 75 82
-43 -37 -37 -19 -3 25 64 87
-42 -46 -28 -23 -12 15 58 82
-49 -44 -37 -37 -4 19 58 83
-49 -42 -43 -26 -7 17 44 72
-48 -44 -44 -28 -13 5 34 72
-38 -52 -37 -27 -13 5 24 71
-44 -42 -41 -31 -16 3 23 62
57 -321 101 -30 17 -4
46 -33 3 5 -14 13
3 8 -3 2 5 4
1 -4 -5 5 4 0
1 -6 -3 8 -7 -4
1 -4 2 -1 2 3
-5 3 0 -4 -3 4
0 5 -4 -1 2 6
-1 0
-14 4
-2 -4
-7 -5
-7 1
5 8
-4 0
4 -2
57 -321 101 -30 17 -4
46 -33 3 5 -14 13
3 8 -3 2 5 4
1 -4 -5 5 4 0
1 -6 -3 8 -7 -4
1 -4 2 -1 2 3
-5 3 0 -4 -3 4
0 5 -4 -1 2 6
-1 0
-14 4
-2 -4
-7 -5
-7 1
5 8
-4 0
4 -2
4 -29 10 -2 1 0 0 0
4 -3 0 0 -1 0 0 0
0 1 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
Bloque
original
Extraccin
Gris
Medio
(-128)
DC
K
-DC
K-1
= 1002-945
Resultado DCT
Cuantificacin
Lohscheller
,
_
uv
uv
Q
DCT
round
Obsrvese que, tal y como esperbamos, la mayora de coeficientes cuantificados toman el valor cero,
de modo que la codificacin combinada entre cdigos de longitud variable y mtodos de longitud de
series puede resultar muy eficiente. Debemos notar tambin que en ningn momento se presupone que
el resultado de los coeficientes de alta frecuencia ser nulo. Esto significa que si en una subimagen
estos coeficientes fueran realmente significativos, sus valores seran cuantificados y, por lo tanto, las
componentes de alta frecuencia podran recuperarse de la informacin comprimida. En consecuencia,
la compresin JPEG no necesariamente presupone una prdida de los detalles y componentes de alta
frecuencia de la imagen. Las matrices de cuantificacin tienen en cuenta la importancia relativa de
cada coeficiente y su incidencia en la visualizacin de la imagen.

Por otra parte, las matrices de cuantificacin permiten un control directo sobre la calidad de la imagen.
Si utilizamos matrices con unos pasos mayores, obtendremos una concentracin de toda la energa de
los coeficientes alrededor de la componente DC, por lo que la imagen se codificar utilizando un
menor nmero de bits. Sin embargo, un mayor paso de cuantificacin supone que los coeficientes se
aproximan de forma ms tosca, por lo que la calidad de la imagen reconstruida empeora. En general,
cuando se disminuye el factor de calidad del compresor JPEG, se observa una prdida de las
componentes de alta frecuencia. Esto es fcilmente comprensible si tenemos en cuenta que a medida
que aumentamos el paso de cuantificacin es posible que todas las componentes de alta frecuencia
queden aproximadas como ceros, por lo que en realidad no resultan codificadas.

Una vez los coeficientes han sido cuantificados, debe procederse a su codificacin mediante cdigos
de longitud variable (Huffman) y cdigos de longitud de series (RLE). El estndar JPEG proporciona
diversas recomendaciones sobre las tablas de Huffman que pueden ser utilizadas. Tambin es posible,
utilizar extensiones del mtodo base, que permiten que el usuario proporcione sus propias tablas de
Huffman, especialmente adaptadas al tipo de imgenes que se pretende comprimir. La ganancia media
que se obtiene por el uso de cdigos de Huffman propios se sita entre el 2,4 % y el 7,9 % de mejora
en el factor de compresin, por lo que, teniendo en cuenta la mayor carga computacional asociada a
esta filosofa, suele emplearse en muy pocas implementaciones. Tambin es posible sustituir los
cdigos de longitud variable de Huffman por cdigos aritmticos. En este caso puede obtenerse un
factor de mejora adicional del 2,5 % respecto al uso de cdigos de Huffman propios.

Consideraremos la codificacin de los coeficientes utilizando las tablas recomendadas por el JPEG.
Los procedimientos y tablas utilizados para codificar los coeficientes AC y DC son conceptualmente
distintos, por lo que sern considerados de forma separada.

Los coeficientes AC se ordenan mediante una exploracin en zigzag como la que hemos ilustrado en
la figura 4.37. La estrategia concreta de codificacin puede considerarse una mezcla entre cdigos de
Huffman modificados y cdigos de longitud variable. Cada coeficiente se codifica utilizando dos tipos
de palabras que denominaremos A y B. La palabra B se utiliza para indicar el nivel de los coeficientes
no nulos en binario natural en complemento a 1. El nmero de bits que se utilizan para la codificacin
depende del nivel del coeficiente y se especifica en la palabra del tipo A. As, para codificar un
coeficiente con nivel 3, utilizaremos nicamente 2 bits, con el cdigo 11. Un coeficiente de nivel 23 se
codificara con 5 bits y su cdigo binario natural 10111. Si el coeficiente fuera negativo (-23), se
seguiran utilizando 5 bits, pero ahora el cdigo se expresara en complemento a 1, es decir, 01000. En
resumen, las palabras del tipo B expresan directamente el valor del coeficiente no nulo en binario con
complemento a uno, utilizando un nmero de bits variable que previamente est definido en la palabra
de tipo A que la precede. El contenido de las palabras de tipo A es un tanto ms complejo, ya que se
utilizan para codificar la longitud de la serie de ceros y el nmero de bits del siguiente coeficiente no
nulo. La informacin que contiene una palabra de tipo A se descompone, por tanto, en dos
componentes que suelen denominarse R/S (Run/Size que se asocial a la longitud de la serie de ceros
y al tamao en bits del siguiente dato no nulo).

Para analizar con mayor profundidad como se combinan los dos tipos de palabras en la codificacin
de una serie de coeficientes AC, consideremos el siguiente ejemplo, que correspondera a una lectura
de los coeficientes transformados de una subimagen ordenados en zigzag:

12, 156, -13, 0, 0, 0, 5, 0, 0, 0, 0, 3, 0, 0, 0, ......resto de coeficientes nulos

El primer coeficiente AC a codificar toma el valor 12 y no tiene ninguna serie de ceros que le preceda.
Por tanto, el cdigo de la palabra A tendr un valor R=0 y S=4. El primer parmetro indica que no
existe ningn cero que precede al elemento y el segundo representa el nmero de bits necesario para
codificar el nivel del coeficiente (12). Este nmero de bits puede calcularse de forma muy simple
como el nmero de bits necesario para representar el valor absoluto del coeficiente en binario natural,
en el que el bit ms significativo toma el valor 1. As, para representar el nivel 37 deberemos
considerar el cdigo binario del nmero 37 (10011) y contar el nmero de bits con el que puede
realizarse la codificacin (5). Como el margen dinmico de los coeficientes AC est situado entre [-
1023, 1023], el valor mximo de S queda limitado a 10 bits (vase la tabla 4.2).

Siguiendo con este esquema, la secuencia de palabras A y B con las que codificaramos la secuencia
anterior sera:

A(0/4), B
12
, A(0/7), B
156
, A(0/4), B
-13
, A(3/3), B
5
, A(4/2), B
3
, A(EOB)

Ntese cmo las palabras del tipo A van indicando simultneamente la longitud de ceros consecutivos
en la secuencia de coeficientes que preceden a la codificacin de un coeficiente. Los cdigos de las
palabras B pueden determinarse con facilidad expresando el valor del coeficiente en complemento a 1
con el nmero de bits definido en la palabra A. As, B
12
=1100, B
156
=10011100, B
-13
=0010 (en
complemento a 1), B
5
=101, B
3
=11.

Es interesante subrayar que la representacin en complemento a uno permite especificar de forma
unvoca el nmero de bits en funcin del nivel de los coeficientes, sean positivos o negativos. En la
tabla 4.2 se muestra una relacin entre el nmero de bits y el margen de valores de coeficientes que
pueden representarse.

Tabla 4.2 Relacin entre nmero de bits (S) y niveles de los coeficientes

Nmero de bits (S) Niveles positivos Niveles Negativos
1 {1} {-1}
2 {3,2} {-2,-3}
3 {7,6,5,4} {-4,-5,-6,-7}
4 {15,14,13,12,...8} {-8,-9,....-15}
5 {31,30,....,16} {-16,-17,...-31}

Las palabras del tipo A tambin pueden utilizarse para indicar que el resto de coeficientes de la
secuencia son nulos. Para ello se utiliza una palabra especial que se indica con el cdigo EOB. Con
objeto de optimizar los cdigos de longitud variable con que se codificarn las palabras del tipo A el
nmero mximo de una secuencia de ceros que se permite codificar es 15. En el supuesto de que un
bloque de coeficientes tuviera ms de 15 ceros consecutivos, se utiliza la palabra A(15/0), que indica
la presencia de 16 ceros consecutivos. Pueden concatenarse varias palabras de este tipo. As, si un
coeficiente de valor no nulo estuviera precedido por 34 coeficientes nulos, se utilizara la secuencia
A(15/0), A(15/0), A(2/S), B para codificarlo.

Las palabras del tipo A se codifican mediante un cdigo de Huffman que tiene en cuenta la estadstica
con la que se producen estos mensajes. Las tablas pueden ser confeccionadas por el propio usuario o
utilizar las que se recomiendan en el estndar. Los cdigos y tablas para codificar las componentes de
luminancia o de color son distintos. En la figura 4.43 se proporciona un fragmento de los cdigos de
Huffman recomendados para codificar la componente de luminancia.

Fig. 4.43 Tablas de Huffman de los cdigos (R/S) para las componentes de luminancia (fragmento)

La codificacin de los componentes DC es algo ms simple. Tambin se utilizan dos tipos de
mensajes A y B. Los mensajes del tipo B codifican el valor del coeficiente de continua en binario
natural en complemento a 1 de forma totalmente anloga a como se codificaban los coeficientes AC.
No obstante, los mensajes del tipo A son ms simples, puesto que slo se requiere codificar el nmero
de bits (S) que se utilizan para representar los niveles de los coeficientes. Los mensajes del tipo A se
codifican mediante tablas de Huffman que utilizan la estadstica de los componentes DC. Las tablas de
Huffman recomendadas por el estndar para la seal de luminancia se proporcionan en la grfica de la
figura 4.44.

0/0 EOB 1010
A(R/S) Cdigo Huffman
0/1
0/2
0/3
0/4
0/5
0/9
0/10
1/1
1/2
1/3
1/4
00
01
100
1011
11010
1111111110000010
1111111110000011
1100
11011
1111001
111110110
1/8 1111111110000110
1/9
1/10
2/1
2/2
2/3
2/4
2/5
2/6
2/7
2/8
2/9
2/10
1111111110000111
1111111110001000
11100
11111001
1111110111
111111110100
1111111110001001
1111111110001010
1111111110001011
1111111110001100
1111111110001101
1111111110001110
0/0 EOB 1010
0/1
0/2
0/3
0/4
0/5
0/9
0/10
1/1
1/2
1/3
1/4
00
01
100
1011
11010
1111111110000010
1111111110000011
1100
11011
1111001
111110110
1/8 1111111110000110
1/9
1/10
2/1
2/2
2/3
2/4
2/5
2/6
2/7
2/8
2/9
2/10
1111111110000111
1111111110001000
11100
11111001
1111110111
111111110100
1111111110001001
1111111110001010
1111111110001011
1111111110001100
1111111110001101
1111111110001110
En la figura 4.45 se proporciona un ejemplo completo de codificacin de los coeficientes DC y AC de
los coeficientes transformados de una subimagen de 8x8 elementos. En la parte de la derecha se
indican los cdigos que se obtienen para cada uno de los coeficientes ordenados segn la exploracin
en zigzag convencional. Los cdigos utilizados se han obtenido de las tablas de Huffman
recomendadas. Ntese que toda la matriz puede codificarse utilizando nicamente 59 bits.

Fig. 4.44 Tablas de Huffman para la codificacin del nmero de bits de los coeficientes DC (luminancia)

Fig. 4.45 Ejemplo de codificacin de un bloque de coeficientes transformados previamente cuantificados
0
A(S)
00
Cdigo
1 010
2 011
3 100
4 101
5 110
6 1110
7 11110
8 111110
9 1111110
10 11111110
11 111111110
0
A(S)
00
Cdigo
1 010
2 011
3 100
4 101
5 110
6 1110
7 11110
8 111110
9 1111110
10 11111110
11 111111110
4 -29 10 -2 1 0 0 0
4 -3 0 0 -1 0 0 0
0 1 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
Coeficiente de continua: S=3 100; valor 4 100
100100
Coeficientes AC: -29 A(0/5) 11010 valor 29 00010
1101000010
4 A(0/3) 100; valor 4 100
100100
0, -3 A(1/2) 11011 valor 3 01
1101101
10 A(0/4) 1011 valor 10 1010
10111010
-2 A(0/2) 01; valor -2 01
0101
0, 1 A(1/1) 1100 valor 1 1
11001
0, 0, 0, 0, 0, 1 A(5/1) 1111010 valor 1 1
11110101
0,-1 A(1/1) 1100 valor 1 0
11000
Total: 100100 1101000010 100100 1101101 10111010 0101 11001 11110101 11000
4 -29 10 -2 1 0 0 0
4 -3 0 0 -1 0 0 0
0 1 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
4 -29 10 -2 1 0 0 0
4 -3 0 0 -1 0 0 0
0 1 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
Coeficiente de continua: S=3 100; valor 4 100
100100
Coeficientes AC: -29 A(0/5) 11010 valor 29 00010
1101000010
4 A(0/3) 100; valor 4 100
100100
0, -3 A(1/2) 11011 valor 3 01
1101101
10 A(0/4) 1011 valor 10 1010
10111010
-2 A(0/2) 01; valor -2 01
0101
0, 1 A(1/1) 1100 valor 1 1
11001
0, 0, 0, 0, 0, 1 A(5/1) 1111010 valor 1 1
11110101
0,-1 A(1/1) 1100 valor 1 0
11000
Total: 100100 1101000010 100100 1101101 10111010 0101 11001 11110101 11000
El procedimiento de decodificacin del JPEG es bastante trivial, al menos desde un punto de vista
conceptual, una vez comprendida la codificacin. En la figura 4.46 se muestra el esquema general de
un decodificador, que, en esencia, es una rplica invertida del esquema del codificador que se ha
presentado en la figura 4.39. En la figura se indica especficamente que las tablas de Huffman y los
cuantificadores utilizados pueden recuperarse directamente de la imagen comprimida.

Fig. 4.46 Diagrama general del proceso de decodificacin JPEG

La descripcin de los procedimientos de codificacin utilizados en el JPEG que se han presentado en
este apartado pretende, nicamente, proporcionar una perspectiva global de la sistemtica y
metodologa utilizada para la codificacin de imgenes estticas. El estndar completo proporciona
los detalles sobre cmo se estructura la informacin de las tablas en las cabeceras de los ficheros y
otras extensiones y variantes. Existen programas de dominio pblico que pueden encontrarse en
diversos web's y ftp's oficiales del ISO o paralelos.

4.8.2 Codificacin de imgenes con mltiples componentes.
Aunque el objetivo bsico en la creacin del estndar JPEG era la interoperabilidad entre distintas
aplicaciones o sistemas de almacenamiento y transmisin de imgenes, muchos aspectos formales no
han sido especificados en las recomendaciones, proporcionando cierto grado de libertad a los
desarrolladores y fomentando la libre competencia entre distintas opciones de implementacin.
Probablemente, esta ha sido una de las causas principales de su amplia aceptacin en el mercado, ya
que, aun siendo un estndar, los desarrolladores disponen de un entorno genrico en el que pueden
competir para optimizar la calidad de sus productos.

Existen muchos detalles que no estn especificados en el estndar, como las dimensiones de las
imgenes, los procedimientos para convertir imgenes que no estn codificadas con 8 o 12 bits de
resolucin o los espacios de color idneos para la representacin de las imgenes en distintos tipos de
dispositivos. No obstante, el estndar JPEG proporciona un amplio conjunto de especificaciones para
trabajar con imgenes con mltiples componentes e incluso con distintas resoluciones en cada una de
Recomponer
Imagen en
Bloques
Recomponer
Imagen en
Bloques
DCT
Inversa
DCT
Inversa
Cuantificador
variable
Cuantificador
variable
Tabla de
cuantificacin
Tabla de
cuantificacin
Decodificador
entrpico
Decodificador
entrpico
Tabla cdigos
HUFFMAN
Tabla cdigos
HUFFMAN
Imagen
comprimida
Imagen
recuperada
Recomponer
Imagen en
Bloques
Recomponer
Imagen en
Bloques
DCT
Inversa
DCT
Inversa
Cuantificador
variable
Cuantificador
variable
Tabla de
cuantificacin
Tabla de
cuantificacin
Decodificador
entrpico
Decodificador
entrpico
Tabla cdigos
HUFFMAN
Tabla cdigos
HUFFMAN
Imagen
comprimida
Imagen
recuperada
las componentes, proporcionando mtodos flexibles para la codificacin. El estndar permite trabajar
con un total de hasta 255 componentes, con 8 o 12 bits de resolucin para los mtodos con prdidas y
con 2 a 16 bits para los mtodos sin prdidas. Un ejemplo de imgenes con varias componentes son
las imgenes en color. Otro ejemplo son las imgenes de inspeccin de la tierra por satlite en las que
pueden capturarse imgenes en distintas bandas espectrales fuera del margen visible.

Las distintas componentes de la imagen pueden tener resoluciones espaciales distintas. En imgenes
en color, es habitual que la componente de luminancia presente una resolucin doble a las
componentes diferencia de color, tanto en el sentido horizontal como en el vertical. El estndar admite
distintas posibilidades para codificar varias componentes. Una primera alternativa sera codificar cada
una de las componentes de forma secuencial. As, en una imagen en color, primero podramos
codificar la componente de luminancia, despus la componente de color C
r
y finalmente la
componente C
b.
. Otra alternativa consiste en intercalar (interleaving) los bloques correspondientes a
las distintas componentes. En el caso de imgenes en color, en las que la relacin de muestras entre la
componente de luminancia y las seales diferencia de color es de 2:1, es habitual codificar un bloque
de 8x8 elementos de la componente de luminancia, seguido de un bloque de 4x4 elementos de la
componente C
r
y de un bloque de 4x4 de la componente C
b
. Todas estas alternativas y posibilidades
son un claro ejemplo de la flexibilidad y capacidad de adaptacin del estndar JPEG a las necesidades
del usuario.

4.8.3 Modo progresivo
El modo progresivo es una alternativa del JPEG pensada para facilitar el acceso a bases de datos de
imgenes a travs de lneas de baja velocidad o en aplicaciones de internet. Cuando un usuario remoto
accede a una imagen JPEG codificada en el modo bsico, recuperar la imagen en el mismo orden en
que ha sido codificada, es decir, de izquierda a derecha, por filas, y de arriba abajo. A medida que va
decodificndose la imagen, el usuario la observa con la misma calidad con la que ha sido codificada.
Esto significa que, en muchos casos, slo nos daremos cuenta de que la imagen no es la que nos
interesa cuando el proceso de transmisin de los datos est en una fase avanzada.

El modo progresivo resuelve este problema transmitiendo primero slo una parte de la informacin de
cada bloque y, gradualmente, transmitiendo el resto de los datos hasta proporcionar la imagen
completa. Con ello, el usuario remoto puede obtener una primera aproximacin global de la imagen
desde los inicios de la transmisin. Esta estrategia de transmisin requiere utilizar un buffer de
memoria considerable para almacenar todos los coeficientes de la imagen. A menudo el modo
progresivo se confunde con el modo jerrquico. La diferencia entre los dos es que en el primero la
resolucin (nmero de pxeles) de la imagen transmitida es siempre igual a la de la imagen original,
simplemente se vara el orden en el que se transmite la informacin. En el modo jerrquico se
transmite primero una versin de la imagen con menor resolucin y posteriormente se va refinando,
aumentando la resolucin en el dispositivo de representacin. Con este modo podemos adaptarnos a
las caractersticas del display del usuario y simultneamente facilitar el proceso de seleccin de
imgenes. Sin embargo, es algo ms complejo que el modo progresivo.

Existen dos alternativas para realizar la transmisin de los bloques de los coeficientes que se conocen
como la seleccin espectral y las aproximaciones sucesivas. La idea bsica de la seleccin espectral se
ilustra en la figura 4.47 y consiste en transmitir primero los coeficientes ms significativos de cada
uno de los bloques que forman la imagen (por ejemplo el coeficiente de DC y los dos primeros
coeficientes AC). Una vez finalizada la transmisin de estos coeficientes para todos los bloques de la
imagen, se transmiten los siguientes mas significativos (por ejemplo el 3, 4 y 5 de la exploracin en
zigzag de los AC) y as sucesivamente hasta haber transmitido todos los coeficientes. La realizacin
de esta codificacin es bastante sencilla y, teniendo en cuenta la nueva ordenacin de los coeficientes,
pueden utilizarse variantes de los mtodos de Huffman y RLE considerados en el modo bsico. Su
problema bsico es que las primeras imgenes que se obtienen en el receptor no contienen
componentes de alta frecuencia, por lo que se vern bastante borrosas.

Fig. 4.47 Idea bsica de la seleccin espectral en el modo progresivo

En la ordenacin mediante aproximaciones sucesivas se mejora algo la calidad de la imagen recibida,
ya que se transmiten todas las componentes frecuenciales de todos los bloques de la imagen. La tasa
de transmisin se mantiene baja debido a que, en una primera fase (scan), slo se transmiten los bits
ms significativos de los coeficientes. Posteriormente se va refinando la imagen del receptor
transmitiendo el resto de bits. En la figura 4.48 se muestra una estrategia de transmisin basada en las
aproximaciones sucesivas. En este caso, en la primera pasada se envan los 4 bits ms significativos.
En las fases sucesivas se van enviando los bits adicionales, uno a uno.

Mediante el uso de estrategias que combinan la seleccin espectral con las aproximaciones sucesivas,
pueden obtenerse calidades muy aceptables en las primeras fases de la transmisin. Una estrategia
muy utilizada consiste en transmitir el coeficiente de continua con toda la precisin posible y 3 o 4
coeficientes AC con slo los bits ms significativos. Posteriormente se van transmitiendo el resto de
bits de los coeficientes AC.
Coef. 61
Coef. 62
Coef. 63
Coef. 3
Coef. 4
Coef. 5
Coef. 0
Coef. 1
Coef. 2
Bloques
Imagen
Orden
transmisin
coeficientes
Coef. 61
Coef. 62
Coef. 63
Coef. 61
Coef. 62
Coef. 63
Coef. 3
Coef. 4
Coef. 5
Coef. 3
Coef. 4
Coef. 5
Coef. 0
Coef. 1
Coef. 2
Coef. 0
Coef. 1
Coef. 2
Bloques
Imagen
Orden
transmisin
coeficientes

Fig. 4.48 Aproximaciones sucesivas en el modo progresivo

4.8.4 Calidades subjetivas obtenidas con el JPEG
El modo bsico del JPEG obtiene unos excelentes compromisos entre factor de compresin y calidad
de imagen. Las pruebas de calidad subjetiva suelen realizarse con usuarios especialistas que deben
valorar entre 0 y 5 la calidad de la imagen reconstruida. Las valoraciones numricas se corresponden
con las siguientes descripciones:

Pobre: 0-1
Moderada: 1-2
Buena: 2-3
Muy buena: 3-4
Excelente: 4
Indistinguible: 5

Entre las calidades muy buena y buena suelen aparecer efectos de prdidas en detalles de alta
frecuencia. En la calidad moderada empieza a apreciarse ligeramente el efecto de bloque y las
prdidas en altas frecuencias son evidentes. En la calidad pobre, los efectos de bloque son muy
notables.

Generalmente, la compresin de una imagen se expresa en bits por pxel (bpp). Una imagen en color
que utilice las tres componentes R, G y B con una resolucin de 8 bits por componente tiene un total
de 24 bpp. El formato ms habitual de las imgenes sin comprimir es el formato 4:2:2, en el que la
luminancia tiene el doble de muestras que cada una de las seales diferencia de color. Estas imgenes
estn expresadas con 16 bpp. Las imgenes en el formato 4:2:0 tienen 12 bpp. Las calidades subjetivas
obtenidas con el JPEG en funcin de los bpp son:

0,25-0,5 bpp Moderada-Buena
0,5-0,75 bpp Buena-Muy Buena
0,75-1,5 bpp Excelente
1,5-2 bpp Indistinguibles
7 6 5 4
MSB
Envo
datos
3
Envo
datos
2
Envo
datos
1
Envo
datos
0
Envo
datos
7 6 5 4
MSB
Envo
datos
3
Envo
datos
3
Envo
datos
2
Envo
datos
2
Envo
datos
1
Envo
datos
1
Envo
datos
0
Envo
datos
0
Envo
datos

Con el estndar JPEG 2000, basado en la transformada wavelet, se consiguen an mejores
valoraciones, especialmente para tasas de compresin por debajo de 0,1 bpp, que suelen ser valoradas
con calidades entre moderadas y buenas. La transformada wavelet es una alternativa a la transformada
coseno que mejora los factores de compresin y en la que, en baja calidad, los defectos tpicos de
bloque u oscilaciones alrededor de las zonas de alta frecuencia son menos visibles. Esta transformada
se usa en aplicaciones de vdeo telefona (MPEG-4) y en algunos codecs de vdeo para aplicaciones
informticas (ficheros de vdeo para Windows).

En la figura 4.49 se muestran algunos ejemplos de imgenes codificadas con JPEG a distintas tasas de
compresin. Como puede observarse los defectos son evidentes en las dos imgenes con mayor factor
de compresin.

Fig. 4.49 Ejemplos de imgenes codificadas con JPEG a distintos factores de compresin

En nuestra descripcin del formato JPEG no se han considerado algunas extensiones del mtodo
secuencial base que suelen usarse con cierta frecuencia. Entre estas extensiones destaca la existencia
de variantes que permiten el uso de hasta 4 tablas de cdigos de longitud variable para los coeficientes
DC y 4 tablas para los coeficientes AC. Recurdese que en el mtodo base slo existen dos tablas para
cada tipo de coeficiente (unas para la luminancia y otras para las seales diferencia de color). Otro
tipo de extensin es el uso de cdigos aritmticos en sustitucin de los cdigos de longitud variable,
que permiten una compresin adicional de entre el 2.5 % y el 5 %. Tambin, como ya hemos
comentado, existen extensiones para tratar imgenes cuantificadas con 12 bits.

0,4 bpp 0,1 bpp
1,2 bpp 16 bpp
0,4 bpp 0,1 bpp
1,2 bpp 16 bpp
4.9 Codificacin de secuencias de vdeo: MPEG
El xito del estndar ISO JPEG motiv la creacin de un grupo de expertos dedicado a considerar y
evaluar distintas estrategias de codificacin de secuencias de vdeo digital y a promover la
estandarizacin de metodologas adaptadas a distintos tipos de aplicaciones. El Moving Pictures
Experts Group es un comit de la ISO (ISO IEC/JTC1/SC29/WG11) creado en 1988 y que ha sido el
responsable de la aparicin de varios estndares para la codificacin de vdeo. El primer estndar
propuesto se conoce con el nombre de MPEG-1 y est orientado al almacenamiento y reproduccin de
seales de vdeo y audio en soporte CD-ROM para su uso en aplicaciones multimedia. Posteriormente
se propuso un estndar de codificacin, conocido como MPEG-2, con una calidad suficiente para la
transmisin de seales de televisin digital (calidad broadcasting) que ha sido ampliamente aceptado
como sistema de compresin de vdeo y audio en distintas aplicaciones y formatos de registro y
transmisin de vdeo. As, el MPEG-2 fue aprobado como formato de compresin para la transmisin
de seales de televisin digitales por el organismo DVB (Digital Video Broadcasting) y fue aceptado
como formato de transmisin de vdeo en redes ATM por el ATM Video Coding Experts Group.
Tambin se ha incluido en el DVD-Video (Digital Versatile Disc) para la codificacin de vdeo y
audio y se utiliza en distintos productos para el almacenamiento de vdeo en formato comprimido bajo
soportes de disco duro o cinta magntica.

El comit MPEG continua dedicado a la elaboracin de nuevos formatos como el MPEG-4 (de
reciente aparicin) o el MPEG-7 y sigue aportando modificaciones, alternativas, mejoras y adiciones a
los formatos ya existentes para mantenerlos constantemente actualizados a las capacidades
tecnolgicas de los sistemas actuales. Las tareas de estandarizacin del MPEG han tenido un gran
xito comercial debido a que la filosofa usada para establecer las normativas slo especifican la
sintaxis y la semntica del flujo de bits que debe recibir el decodificador, proporcionando libertad
sobre los procedimientos de codificacin y decodificacin utilizados para producir o interpretar este
flujo. Esto ha facilitado la libre competencia entre distintos productos, que pueden conseguir mejores
o peores relaciones entre calidad de imagen y sonido y factor de compresin en funcin de los
algoritmos y arquitecturas hardware utilizadas para la compresin. Uno de los propsitos iniciales de
la creacin del MPEG era promover estndares de codificacin de vdeo de libre uso con el objetivo
de facilitar la libre competencia y minimizar el impacto en el mercado de productos propietarios que
dominaran el mercado o que dificultaran la compatibilidad entre distintos productos de vdeo digital.
Actualmente, despus de la amplia implantacin del MPEG-2, puede decirse que se ha logrado este
objetivo inicial.

La inclusin de una seal de vdeo y audio en un soporte como el CD, que originalmente haba sido
pensado para incluir nicamente la informacin asociada a un canal de audio estereofnico, represent
un importante problema tecnolgico durante el desarrollo del estndar MPEG-1, ya que los factores de
compresin que deban utilizarse, si se parta de un formato de vdeo digital como el ITU 601 4:2:2, se
situaban entre 100 y 200. El flujo de datos que admite un CD-ROM de simple velocidad (150
Kbytes/s) es de unos 1,2 Mbps mientras que el flujo de bits implcito en una seal de vdeo 4:2:2 es de
aproximadamente 160 Mbps.

La solucin al problema se obtuvo reduciendo la calidad de la imagen en un doble proceso de
reduccin espacial y temporal. Este proceso significa una reduccin inicial de los datos basada en el
remuestreo temporal y espacial, por lo que no puede considerarse como una verdadera compresin de
vdeo. Por una parte, la resolucin de las imgenes se redujo a la mitad, tanto en la direccin
horizontal como en la vertical (formato SIF), produciendo imgenes de 360x240 para NTSC (30
imgenes por segundo) y de 360x288 para PAL (25 imgenes por segundo). Ntese que con esta
seleccin las dos versiones de vdeo tienen el mismo nmero de pxeles por segundo (2,592x10
6
).
Tambin son habituales los formatos de pxel cuadrado 320x240 para NTSC y 384x288 para PAL.
Los formatos SIF estndar suelen reducirse ligeramente en el sentido horizontal a 352x240 para NTSC
y 352x288 para PAL, con el objeto de que estas dimensiones sean un mltiplo de 16 y faciliten la
compensacin de movimiento. Estos formatos reducidos se conocen con el nombre de SPA
(Significant Pel Area). En cualquiera de los casos la resolucin espacial de las imgenes es
aproximadamente la cuarta parte de la del estndar ITU 601. Esta reduccin supone una prdida de
calidad considerable en las imgenes si se comparan con el formato estndar de radiodifusin. La
resolucin que se obtiene para estas dimensiones de la imagen es equivalente a la del formato de
registro en cinta magntica VHS. El lector puede argumentar que, en general, un vdeo en cinta
magntica VHS se ve mejor que la mayora de vdeos en formato MPEG-1. Esto puede deberse a
varios motivos. Por una parte, muchos vdeos MPEG-1 son producidos a partir de registros en cinta
magntica que, en algunos casos, son tambin VHS, por lo que existen ruidos previos a la
digitalizacin que dificultan considerablemente las tareas de compresin. Adems, an en el caso que
el vdeo MPEG-1 se produzca a partir de copias de calidad, el sistema visual es mucho ms crtico con
el formato digital, tal y como se presenta en la pantalla del ordenador, debido a la mayor claridad con
que aparece cualquier defecto en el proceso de digitalizacin o codificacin.

Otra simplificacin importante en el MPEG-1 es que no admite vdeo entrelazado, por lo que slo se
requiere codificar uno de los dos campos de la seal original. Esta reduccin tiene bastante sentido si
tenemos en cuenta que la presentacin de estas secuencias suele realizarse sobre soporte informtico,
de modo que la propia tarjeta de vdeo es la que se encarga de aumentar la frecuencia de refresco de la
pantalla por encima del nmero de imgenes y evitar la aparicin del parpadeo (flicker). Veremos que
una de las dificultades adicionales del MPEG-2 es que debe ser capaz de codificar vdeos
entrelazados, lo que impone ciertas restricciones a los procesos de compresin de las imgenes. Es
importante mencionar que la sintaxis del MPEG-1 admite imgenes de hasta 4095x4095 con 60
imgenes por segundo. No obstante, estos tipos de secuencias estn pensadas para usos especficos y
no permiten obtener flujos de informacin prximos a la velocidad del CD-ROM, de modo que, en la
prctica, las restricciones ms habituales sobre el formato de la seal de vdeo son las que hemos
descrito.

A pesar de la reduccin espacial y temporal de la seal de vdeo, el flujo resultante sigue siendo
elevado (unos 40 Mbps), por lo que es necesario aplicar procedimientos de compresin de gran
eficiencia. Veremos que la compresin basada en la extraccin de la redundancia espacial de cada
fotograma no es suficiente y deben utilizarse tcnicas de reduccin basadas en la redundancia
temporal entre las imgenes. Las tasas ms habituales del MPEG-1 se sitan por debajo de los 1,8
Mbps.

El estndar MPEG-1 fue publicado en noviembre de 1992, mientras ya se estaba desarrollando un
nuevo formato de compresin de vdeo para aplicaciones que exigan una mayor calidad y que en
principio estaba orientado a cubrir las necesidades de la radiodifusin de seales de televisin digital
con definicin convencional (equivalente al PAL o al NTSC). El estndar MPEG-2, mantiene cierto
grado de compatibilidad con las secuencias de bits producidas por el MPEG-1 y pretende cubrir otras
aplicaciones de mayor ancho de banda. Produce unos flujos de bits que se sitan entre los 2 Mbps y
los 15 Mbps. Su diseo es sumamente flexible y cubre un amplio espectro de sistemas de vdeo que
van desde los formatos digitales ITU 601 4:2:2, ITU 601 4:2:0, HDTV (televisin de alta definicin)
4:2:0, EDTV (televisin con definicin mejorada) 4:2:0, formatos CIF y SIF, formatos HHR 4:2:0,
algunos de ellos en versiones de exploracin progresiva, otros con exploracin entrelazada y algunos
con ambos tipos de exploracin. Para que el MPEG-2 pueda cubrir todo este amplio espectro de
aplicaciones ha sido necesario definir subconjuntos de la sintaxis y semntica de la secuencia de bits
en la forma de distintos perfiles y niveles. Muchos de los aspectos de la codificacin de vdeo utilizada
por el MPEG-1 y el MPEG-2 son comunes, diferencindose fundamentalmente en las dimensiones de
las imgenes que deben tratar, por lo que durante nuestra exposicin sern tratados ambos estndares
conjuntamente. La diferencia ms importante entre el MPEG-1 y el MPEG-2 es que este ltimo debe
ser capaz de tratar seales de vdeo entrelazadas. Los algoritmos de clculo de la DCT y la
compensacin de movimiento deben contemplar los sistemas entrelazados de forma distinta, por lo
que comentaremos estos detalles especficos de forma separada.

Recientemente ha aparecido el estndar MPEG-4 que se orienta a la transmisin de seales de vdeo y
audio con velocidades muy bajas (64 kbps), fundamentalmente para aplicaciones de vdeo telefona,
aplicaciones multimedia, intranets e internet. Las secuencias de bits estn especialmente diseadas
para hacer frente a las altas variabilidades del canal este tipo de comunicaciones, en donde es fcil que
se produzcan reducciones de la velocidad, prdidas parciales de datos, etc. Por ello, la trama o stream
de vdeo y audio suele estar escalada de modo que, en funcin de la tasa de bits recibida, el receptor
puede visualizar las imgenes con mayor o menor calidad. El escalado permite realizar
comunicaciones fiables desde los pocos kbps de algunas conexiones de internet hasta los 4 Mbps que
pueden obtenerse para intranets, pero deben soportarse complejos protocolos de multiplexacin y
demultiplexacin de datos para hacer frente a la alta variabilidad de las redes. El MPEG-4 proporciona
mayor flexibilidad que el MPEG-2 para el uso de tcnicas de compresin basadas en la forma de onda
permitiendo el uso de la transformada wavelet, la codificacin vectorial y la realizacin de
transformaciones afines (que admiten rotacin de los bloques) para la compensacin de movimiento.
Adems permite realizar una codificacin orientada a objetos, pudiendo utilizar codificadores fractales
o morfolgicos, modelado de objetos y descriptores de escenas en las que incluso se prev la
posibilidad de manipular parte de los contenidos por parte de los usuarios. Actualmente tambin se
est desarrollando el MPEG-7, que pretende dar soporte para el manejo de descriptores asociados a
informacin de vdeo y audio para multimedia. Este estndar est orientado a aplicaciones de
bsqueda en bases de datos de contenidos audiovisuales y especifica los procedimientos para insertar
los descriptores de imagen, vdeo, grficos 3D, etc. Ni el MPEG-4 ni el MPEG-7 estn pensados para
aplicaciones de difusin de vdeo para televisin digital convencional.

En los apartados siguientes describiremos los procedimientos bsicos utilizados para la compresin de
la seal de vdeo en el MPEG-1 y el MPEG-2. Nuestro objetivo es que el lector disponga de una idea
global sobre los mtodos utilizados para la compresin y de cmo se forma la secuencia de bits que
aporta la informacin de las seales de vdeo, audio y control. Las descripciones sern bastante ms
superficiales que las utilizadas en la descripcin del JPEG debido, por una parte, a la mayor
complejidad del sistema de codificacin y, por otra, a la gran cantidad de posibilidades, formatos de
imagen y tipos de bloques que existen en el MPEG, cuya exposicin detallada requerira, como
mnimo, un libro completo dedicado a los pormenores del estndar. Creemos que esta presentacin
ser suficiente para que el lector adquiera una idea suficientemente clara de los distintos
procedimientos que intervienen en la compresin de la seal de vdeo y de la interrelacin entre ellos.
Pueden encontrarse detalles adicionales en numerosos textos dedicados a la codificacin MPEG que
se proporcionan en el apartado de bibliografa. Tambin existe gran cantidad de informacin en
distintos servidores de internet en la forma de artculos divulgativos o programas ejemplo de la
codificacin MPEG. El estndar oficial MPEG-1 puede encontrarse en los documentos ISO/IEC
11172-1 (estructura de multiplexacin de datos), ISO/IEC 11172-2 (codificacin de vdeo) y ISO/IEC
11172-3 (codificacin de audio). El MPEG-2 se encuentra en los documentos ISO/IEC 13818-1
(Mltiplex), ISO/IEC 13818-2 (Vdeo) y ISO/IEC 13818-3 (Audio).

4.9.1 Uso de la redundancia temporal para la compresin de vdeo.
El JPEG aprovecha la redundancia existente entre los pxeles adyacentes de una imagen para realizar
una considerable reduccin en el volumen de datos sin que se produzcan prdidas aparentes de
calidad. En una secuencia de vdeo, podramos aplicar el JPEG a cada uno de los fotogramas para
obtener una seal comprimida. De hecho, este procedimiento se utiliza en muchas tarjetas de
digitalizacin de vdeo para PC y permite obtener una primera versin de la secuencia que deseamos
almacenar en el disco duro. Tngase en cuenta, que el flujo que requiere la digitalizacin de una seal
de televisin en el formato ITU-601 4:2:0 es de unos 30 Mbytes/s, bastante por encima de los flujos
que permiten los discos duros actuales, incluso discos con bus SCSI II. Por ello, es necesario aplicar
una primera compresin mediante hardware o software que permita el almacenamiento de la seal.
Los mtodos basados en comprimir la seal de vdeo fotograma a fotograma mediante mtodos
parecidos al JPEG se denominan Motion-JPEG (MJPEG) y suelen ser mtodos propietarios de cada
fabricante o desarrollador. El nombre genrico que reciben estos algoritmos es un tanto confuso, por
cuanto no aprovechan la redundancia temporal existente en las imgenes ni realizan ninguna
estimacin del movimiento de los objetos contenidos en las mismas. El principal problema de este
procedimiento de compresin es que, si deseamos mantener una calidad aceptable, se obtiene un flujo
de datos del orden de 8-10 Mbytes/s (60-80 Mbps, para imgenes de 720x576), que aun siendo
suficiente para su almacenamiento en una unidad de disco duro, es excesivo para su transmisin como
seal de televisin digital o su almacenamiento en un soporte CD-ROM. La codificacin mediante M-
JPEG tiene ciertas ventajas durante el proceso de edicin y manipulacin del vdeo, pues todos los
fotogramas se obtienen con la misma calidad y su decodificacin es independiente del resto de
fotogramas de la secuencia. Por ello, estos formatos se seguirn manteniendo, a pesar de la aparicin
del MPEG y su optimizacin en la compresin de la seal, en este tipo de aplicaciones.

Para obtener factores de compresin adecuados a la transmisin como seal de televisin es necesario
aprovechar la redundancia temporal existente entre las sucesivas imgenes. Tngase en cuenta que,
dada la naturaleza de la mayor parte de escenas, gran parte de los objetos y elementos permanecen en
la misma posicin y con las mismas caractersticas de un fotograma a otro. Esto indica que es posible
obtener una excelente aproximacin de la informacin contenida en un fotograma aprovechando la
informacin que disponemos del fotograma anterior. En la figura 4.50 se muestran dos fotogramas
consecutivos de una secuencia de vdeo. En este ejemplo, las diferencias slo son apreciables cuando
se realiza la resta entre las dos imgenes. En la figura 4.51 se muestra el resultado de realizar esta
diferencia. Sobre la imagen diferencia hemos calculado el valor absoluto y para hacer ms evidentes la
diferencia entre niveles se ha multiplicado por un factor 3, finalmente se ha representado en vdeo
inverso. La imagen resultante indica de forma clara el resultado que esperbamos, ya que la mayor
parte de los elementos estn prximos al cero, por lo que se ha reducido la entropa de forma notable,
pudiendo codificar la imagen de forma eficientemente mediante el uso de cdigos RLE, de longitud
variable o aritmticos. Existen algunas zonas de la imagen en las que se observa que las diferencias
aumentan de nivel y que se corresponden, aproximadamente, con los contornos de los objetos. Esto se
debe al movimiento de la cmara, que est realizando un ligero movimiento horizontal y al de los
propios objetos (el barquero est dando la vuelta a la barca).

Fig. 4.50 Ejemplo de dos fotogramas consecutivos de una secuencia de vdeo con poco movimiento

Fig. 4.51 Resultado de la imagen diferencia entre los dos fotogramas
Fotograma 1
(25 imgenes/ seg)
Fotograma 2
(25 imgenes/ seg)
Fotograma 1
(25 imgenes/ seg)
Fotograma 2
(25 imgenes/ seg)
La idea de utilizar la imagen anterior para predecir la actual se utiliza en diversos codecs para la
produccin de vdeo en soporte informtico (AVI, Internet). La ventaja de esta estrategia es que puede
desarrollarse sin necesidad de un soporte hardware adicional en la mayora de plataformas y en un
tiempo reducido (en algunos casos tiempo real). El procedimiento general suele conocerse con el
nombre de codificacin de fotogramas en diferencias (frame differencing) y, como no existe ningn
estndar al respecto, existen multitud de variantes que son propietarias del desarrollador.
Normalmente, la secuencia de vdeo se descompone en fotogramas clave (key frame) y fotogramas
diferencia (delta frames) tal y como se representa en la figura 4.52. Los fotogramas clave deben
codificarse de forma independiente del resto de fotogramas, teniendo en cuenta nicamente la
redundancia espacial de la imagen. Generalmente se utilizan variantes del JPEG o mtodos de
codificacin vectorial (como en el Cinepack o el Indeo 3.2) para codificar estos fotogramas. Las
imgenes delta se codifican utilizando como base de prediccin las imgenes anteriores. Es
conveniente que peridicamente se inserte un fotograma clave en la secuencia codificada para evitar la
propagacin de errores de codificacin en las imgenes delta.

Fig. 4.52 Descomposicin de una secuencia de vdeo en fotogramas clave y diferencia (delta)

Una posible estrategia de codificacin de las diferencias consiste en descomponer las imgenes delta
en bloques de 8x8 o 16x16 elementos y comparar cada uno con el bloque equivalente de la imagen
clave precedente. Si la diferencia entre ambos bloques no supera un determinado umbral, el valor de
este bloque en la imagen delta se mantiene igual al que tena en la imagen clave. En cambio, cuando la
diferencia es significativa debe volver a codificarse. La ventaja del tratamiento por bloques es que, si
se utilizan mtodos transformados para codificar las imgenes clave, no es necesario descomprimirlas
y pueden compararse directamente los coeficientes de ambas subimgenes. El uso de un umbral para
determinar si es necesario recodificar los bloques de las imgenes delta es bastante crtico. Si el
umbral es excesivamente bajo, la probabilidad de superar el umbral es alta por lo que la codificacin
pierde eficiencia. Si el umbral es alto, es posible que no se detecten movimientos pequeos, por lo que
aparecen errores significativos en la imagen. Adems, estos errores resultan a veces muy molestos, ya
que aparecen en las partes que tienen movimiento, produciendo deformaciones de los objetos.
Consideremos por ejemplo el desplazamiento horizontal de una cara sobre un fondo constante. En
funcin del valor del umbral, es posible que en algunos bloques correspondientes a la zona de la cara
se detecte movimiento, mientras que en otros no. Esto puede llegar a producir que el sujeto aparezca
con la boca deformada o con tres ojos (situaciones que en realidad se producen en algunos codecs para
videoconferencia en internet). De todos modos, la resolucin espacial del sistema visual a los objetos
en movimiento es ms baja que para los objetos estticos y los errores suelen desaparecer al cabo de
uno o dos fotogramas o, a lo sumo, con el siguiente fotograma clave. La ganancia de compresin de
este tipo de codificadores est directamente relacionada con el movimiento que presentan las
imgenes. En imgenes de televisin donde existen abundantes cambios de plano y movimientos de
cmara, estos codificadores proporcionan muy poca compresin. En cambio, suelen presentar
excelentes resultados en aplicaciones de videoconferencia en las que la cmara permanece esttica y el
sujeto presenta un movimiento muy reducido o en aplicaciones de vdeo vigilancia de cmaras de
seguridad en las que slo se producen movimientos significativos durante las entradas y salidas de
individuos. La carga computacional asociada al codificador es muy reducida. Por ello, tambin son
utilizados con frecuencia en aplicaciones de transmisin de vdeo a baja velocidad de imgenes con
poco movimiento.

Una mejora respecto a la estrategia anterior consiste en enviar la seal de error entre la prediccin y la
imagen real. Con ello, se mejora notablemente la calidad de las imgenes al precio de una menor
eficiencia de compresin y mayor complejidad de clculos, tanto en el compresor como en el
descompresor.

Uno de los parmetros que tambin suele resultar crtico es la frecuencia con la que se intercalan los
fotogramas clave, que, evidentemente, depende del tipo de imgenes que se transmitan. En
aplicaciones de vdeo conferencia suele recomendarse utilizar un fotograma clave por cada 10 o 15
fotogramas reales.

4.9.2 Compensacin de movimiento
La compensacin de movimiento es una tcnica de prediccin temporal que intenta optimizar los
resultados obtenidos por la codificacin diferencial analizando el movimiento que realizan los objetos
dentro de la imagen y compensndolos. Evidentemente, los clculos involucrados en la realizacin de
esta estrategia son sumamente ms complejos, pero la mejora en factor de compresin es muy notable.
Si consideramos las imgenes del ejemplo de las figuras 4.50 y 4.51 observamos que la mayor parte
de diferencias entre las dos imgenes se deben al propio movimiento de la cmara, por lo que podran
reducirse con un ligero desplazamiento relativo entre ellas. En general, la codificacin diferencial
presenta problemas cuando se producen desplazamientos de los objetos dentro de la imagen o
aparecen nuevos motivos que pueden ser debidos al movimiento de la cmara, el cambio de ngulo de
visin (zoom) el desplazamiento real de los objetos o los cambios de plano; situaciones, todas ellas,
que son bastante habituales en la realizacin de programas de televisin, documentales o pelculas. En
la figura 4.53 se muestra un ejemplo de un desplazamiento de cmara en una imagen simplificada. La
figura muestra cul sera la zona de la imagen utilizada para predecir el bloque de inters mediante
una codificacin diferencial. Obviamente, el error de prediccin es en este caso igual a la imagen que
deseamos predecir, por lo que la ganancia del codificador es nula. La figura 4.54 muestra el bloque
que utilizaramos para la prediccin si utilizamos tcnicas de compensacin de movimiento. Es
evidente, que, en este ejemplo, el error de prediccin puede llegar a ser exactamente nulo, por lo que
no resultara necesario volver a codificar el bloque, nicamente tendramos que transmitir el vector de
desplazamiento que tenemos que utilizar en la imagen de referencia para construir este fragmento de
imagen.

Fig. 4.53 Ejemplo de bloques utilizados para realizar la prediccin en una codificacin diferencial

Fig. 4.54 Ejemplo del bloque utilizado para la prediccin en una codificacin por compensacin de movimiento
Imagen de referencia
Imagen a codificar
Redundancia temporal
Imagen a codificar
Imagen a codificar
Imagen a codificar
En la prctica las cosas no suelen ser tan simples y no resulta trivial encontrar en la imagen precedente
un bloque que se corresponda exactamente con el fragmento que deseamos codificar. Los objetos
pueden sufrir deformaciones, cambios de perspectiva o de tamao (ngulo de visin) o incluso
trasladarse en el espacio mediante rotaciones. Todos estos cambios no quedan cubiertos con la simple
introduccin de un vector de traslacin, por lo que las ganancias de prediccin y los factores de
compresin no sern tan ideales como sugerimos en este ejemplo. Incluso en nuestro problema
simplificado se observa que una parte de los objetos que estn visibles en la segunda imagen no eran
accesibles en la primera. El procesador deber ser capaz de identificar las regiones de la imagen con
nuevos componentes y codificarlos basndose nicamente en la redundancia espacial, como si se
tratara con una imagen estacionaria. Estas consideraciones pretenden insistir sobre la dificultad de
predecir con exactitud todos los fragmentos de la imagen. No obstante, resulta evidente que la nueva
estrategia puede permitir obtener resultados muy eficientes en un gran nmero de secuencias de vdeo
reales.

En sntesis, el proceso para codificar un bloque de una imagen mediante la compensacin de
movimiento consiste en determinar que zona o bloque de la imagen de referencia puede utilizarse de
forma ms eficiente para realizar la prediccin del bloque actual. Una vez determinada esta regin,
deberemos transmitir el vector de desplazamiento asociado (nicamente las dos componentes de
desplazamiento horizontal y vertical) y el error que se produce al utilizar esta estimacin de la imagen
en sustitucin de la imagen original. El decodificador, que se supone que de algn modo ya ha
decodificado la imagen que utilizamos como referencia, puede recuperar la informacin del bloque
actual utilizando el bloque desplazado de la imagen de referencia y aadiendo el error que se ha
transmitido. La seal de error puede transmitirse de forma directa o utilizando mtodos transformados.
El MPEG determina la transformada coseno de la seal de error, la cuantifica y la transmite mediante
cdigos de longitud variable, con lo que se consigue una compresin adicional sobre la forma de onda
de esta seal. El decodificador, por tanto, debe realizar la transformacin inversa sobre la seal de
error antes de reconstruir el fragmento de imagen. El procesador del codificador debera ser capaz de
decidir en que casos resulta ms conveniente utilizar la compensacin de movimiento o codificar
directamente el bloque original sin ningn tipo de prediccin. Para ello debe evaluar el nmero de bits
final con el que se transmitira cada opcin. Estos clculos son sumamente complejos, pues deberan
evaluarse todas las alternativas antes de realizar la decisin, por lo que a menudo se simplifican
teniendo en cuenta resultados parciales de la estimacin de movimiento y la varianza de la imagen. En
el caso en que se decida transmitir la informacin original sin hacer uso de ninguna prediccin o
compensacin de movimiento, deber advertirse al decodificador de nuestra decisin. Obsrvese que
la codificacin diferencial puede considerarse un caso particular de la codificacin con compensacin
de movimiento, en la que todos los vectores de desplazamiento son nulos.

En la prctica, las direcciones y mdulos de los vectores de desplazamiento asignados a bloques
prximos suelen ser parecidos. Tngase en cuenta que los bloques suelen ser ms pequeos que los
objetos, por lo que si un objeto se desplaza en una determinada direccin todos los bloques que lo
constituyen tambin se desplazan en la misma direccin y distancia. Por ello, el MPEG no codifica
directamente los vectores de movimiento, sino las diferencias entre vectores de movimiento de
bloques adyacentes. Esto permite que muchos vectores sean prximos a cero, por lo que pueden
usarse cdigos de longitud variable para optimizar la tasa de bits final. Ntese que, durante el proceso
de compresin, cualquier detalle, por pequeo que sea, debe ser optimizado con el objeto de reducir la
informacin total que debe transmitirse.
El estndar MPEG no establece ninguna recomendacin sobre el mtodo mediante el que puede
realizarse la estimacin del vector de desplazamiento o sobre los procedimientos para decidir cundo
un bloque debe codificarse mediante la transmisin del error y su compensacin de movimiento o
transmitir directamente el bloque utilizando mtodos de compresin intra-trama. Los procedimientos y
algoritmos utilizados para realizar estos clculos corresponden al desarrollador de productos y por ello
existen multitud de codificadores MPEG con distintas prestaciones, velocidades y calidades de
codificacin. Es importante subrayar que toda la carga computacional del proceso de estimacin de
los vectores de movimiento y las decisiones de cmo debe codificarse cada bloque recae sobre el
codificador. El receptor nicamente deber interpretar correctamente las informaciones transmitidas y
utilizarlas realizar la compensacin de movimiento y restablecer una aproximacin a la imagen
original. En la figura 4.55 se muestra grficamente cmo se utiliza un fragmento de la imagen de
referencia para aproximar un bloque de la imagen actual. La figura no indica explcitamente que sobre
esta primera aproximacin del bloque deber transmitirse la seal de error transformada, cuantificada
y codificada mediante cdigos de Huffman para que el receptor pueda recuperar, aunque sea con
prdidas, los datos originales.

Fig. 4.55 Transmisin de los vectores de movimiento para realizar la prediccin de un bloque de la imagen

Una extensin de la compensacin de movimiento que se utiliza en el MPEG es la compensacin de
movimiento bidireccional. La idea bsica consiste en codificar una imagen utilizando no slo las
imgenes de referencia del pasado, sino tambin imgenes de referencia futuras. En principio podra
argumentarse que esta extensin no es causal y por tanto irrealizable, pero, evidentemente, siempre
podemos introducir un retardo prefijado en el codificador y el decodificador que nos permita utilizar
imgenes de referencia futuras. La solucin en el codificador consiste, simplemente, en utilizar un
buffer de memoria suficientemente grande como para disponer de imgenes clave o de referencia
futuras durante el proceso de codificacin de la imagen actual. El problema es que el decodificador
deber disponer tambin de las imgenes clave futuras para poder decodificar una imagen que ha sido
construida a partir de vectores de desplazamiento basados en imgenes futuras. Para ello, es suficiente
con intercambiar el orden de transmisin de las imgenes, que no necesariamente debe coincidir con
I P
Vector
de
movimiento
I P
Vector
de
movimiento
el orden con el que son presentadas en el display. Si el decodificador recibe primero las imgenes
clave, puede almacenarlas en memoria interna y utilizarlas para decodificar las imgenes en las que se
ha utilizado este tipo de compensacin de movimiento. Una vez decodificadas todas las imgenes
pueden presentarse en el orden que corresponde.

En la figura 4.56 se muestra un esquema que ilustra la codificacin mediante compensacin
bidireccional. Para codificar un bloque de la imagen B, puede utilizarse como referencia la imagen I y
la imagen P (de momento, los smbolos utilizados para describir las imgenes son simplemente
notacin, veremos que esta notacin describe distintos tipos y caractersticas de imagen en el MPEG).
El procesador debe ahora calcular dos vectores de movimiento que se denominan forward (hacia
delante) y backward (hacia atrs). El clculo del vector de movimiento hacia adelante se realiza
buscando la regin de la imagen de referencia previa que ms se aproxima al bloque que deseamos
codificar. Anlogamente, el vector hacia atrs se determina utilizando la imagen clave siguiente. A
partir de estos dos vectores, el procesador puede considerar distintas posibilidades para codificar el
bloque de inters:

a) Codificar el error de prediccin forward: Esta seal de error se obtiene como la
diferencia entre los pxeles del bloque original y los pxeles del bloque que se ha
determinado como idneo en la imagen de referencia precedente.
b) Codificar el error de prediccin backward: De forma anloga al caso anterior, se obtiene
como la diferencia entre el bloque original y el bloque desplazado de la imagen de
referencia posterior.
c) Codificar el error de prediccin bidireccional: En este caso, el bloque original se
compara con el promedio entre los bloques estimados por el vector de movimiento
forward y el backward.
d) Codificar el bloque sin utilizar ninguna prediccin: Si los errores obtenidos en los casos
anteriores requieren un nmero de bits considerable, puede resultar rentable codificar
directamente el fragmento de imagen utilizando procedimientos intra-trama.

Fig. 4.56 Uso de la compensacin de movimiento bidireccional
Vector
de
Movimiento
forward
I B P
Vector
de
Movimiento
backward
Vector
de
Movimiento
forward
I B P
Vector
de
Movimiento
backward

Evidentemente, la compensacin bidireccional representa un incremento considerable de la
complejidad computacional del algoritmo. El procesador debe considerar distintas posibilidades para
codificar cada bloque de la imagen resultante y decidir cul de ellas es la ptima. La decisin debera
basarse en el nmero de bits total que se requiere para codificar el bloque, considerando todas las
posibles alternativas, lo que significa que no slo deberan calcularse los errores de prediccin sino
que adems deberan transformarse mediante la DCT, cuantificarse y determinar el nmero de bits
necesario para codificarlos utilizando las tablas de Huffman. No obstante, para simplificar los
clculos, los codificadores de MPEG suelen interrumpir los clculos y tomar decisiones en fases
intermedias, basndose en las caractersticas de los distintos errores de prediccin obtenidos y de los
pxeles del bloque de imgenes.

El uso de tcnicas de compensacin de movimiento bidireccionales fue introducido en el estndar
MPEG-1 y aporta bastante ventajas respecto a la compensacin forward, que ya haba sido utilizada
en el estndar H-261 para la transmisin de videoconferencia por redes de baja velocidad. Entre las
ventajas de la compensacin de movimiento en los dos sentidos temporales deben citarse:

a) La prediccin backward permite predecir objetos que no aparecen en la imagen de
referencia previa, pero que s estn presentes en la imagen que estamos codificando y en
la imagen de referencia futura. Sera el caso de un movimiento horizontal de cmara en
el que aparecen nuevos objetos en la escena. Estos nuevos objetos estn disponibles en la
referencia futura, por lo que pueden utilizarse para nuestra prediccin. Otro ejemplo ms
drstico es cuando se produce un cambio de plano entre las dos imgenes de referencia.
En este caso, si la imagen que estamos considerando ya forma parte del nuevo plano
deberemos utilizar nicamente predicciones backward.
b) En el caso en que el bloque de imagen se encuentre tanto en la imagen de referencia
anterior como en la posterior, puede resultar rentable utilizar el promedio entre los dos
bloques para reducir el ruido propio de la imagen y mejorar la codificacin.

Los modelos de movimiento utilizados en el MPEG-1 y el MPEG-2 cubren nicamente las
traslaciones de los objetos. Estos movimientos son los ms habituales en escenas de cine y televisin.
El MPEG-4 permite tambin utilizar modelos de movimiento basados en transformaciones afines que
incorporan las posibles rotaciones de los objetos.

4.9.3 Algoritmos para la estimacin de los vectores de movimiento
La estimacin de los vectores de movimiento es una de las tareas que requieren mayor dedicacin por
parte del codificador. Los estndares MPEG no establecen ningn mtodo para la estimacin de estos
vectores, dejando libertad a los desarrolladores de hardware y de software para que utilicen los
algoritmos que consideren ms adecuados. Una correcta estimacin de los vectores de movimiento
puede significar una drstica reduccin en la tasa de bits y un aumento de la calidad final con la que se
visualizan las imgenes.

Existen distintas procedimientos alternativos para realizar la estimacin de los vectores de
movimiento. La primera decisin importante suele ser determinar el rea de la imagen de referencia en
la que se realizar la bsqueda del vector de movimiento. Tal y como se muestra en la figura 4.57, el
rea de bsqueda estar situada en las proximidades de la posicin del bloque que deseamos codificar,
pero en las coordenadas de la imagen de referencia. El rea de la zona de bsqueda depende de los
modelos de movimiento mximo que se admita. Tambin es una funcin de la diferencia de tiempos
entre la imagen a predecir y la de referencia. Cuanto mayor es esta diferencia, mayor es el
desplazamiento que pueden experimentar los objetos entre las dos imgenes.

Fig. 4.57 Regin de bsqueda del vector de movimiento en la imagen de referencia

La mayora de las variantes utilizadas en los productos MPEG actuales corresponden a la categora de
los denominados algoritmos de block matching (ensamblaje de bloques). Los algoritmos de block
matching comparan los pxeles del bloque que se pretende estimar con los de la imagen de referencia
y establecen una medida de distancia entre los dos bloques. El vector de movimiento ptimo se
obtiene en la posicin de la regin de anlisis en la que se encuentra un valor mnimo de la distancia
entre los dos bloques. La figura 4.58 muestra la zona por la que debe desplazarse el bloque que
deseamos codificar dentro de la regin de bsqueda de la imagen de referencia. La bsqueda
exhaustiva supone que debemos calcular la distancia entre las dos subimgenes para todos los posibles
desplazamientos. La carga computacional aumenta por tanto con el rea de la regin de bsqueda y
con el tamao de los bloques. En el MPEG-1 se utilizan bloques de imagen de 16x16 pxeles
(denominados macrobloques), por lo que en cada clculo de distancia deben evaluarse un total de 256
pxeles. En el MPEG-2 tambin se utilizan macrobloques de 16x16 pxels o de 16x8. Comentaremos y
justificaremos estos detalles ms adelante.

Las funciones de distancia ms utilizadas son el error cuadrtico, el error absoluto y la correlacin
cruzada entre las dos imgenes. Las siguientes ecuaciones indican los clculos involucrados en cada
una de estas distancias:
Imagen a codificar
Bloque a codificar
Zona de
bsqueda
Zona de
bsqueda
Error cuadrtico:

[ ] [ ] ( )
+ + =
I m n
r
m j n i u m n b j i VM
) , (
2
, , ) , ( (4.26)
Error absoluto:

[ ] [ ]
+ + =
I m n
r
m j n i u m n b j i VM
) , (
, , ) , ( (4.27)
Correlacin cruzada:

[ ] [ ]
[ ] [ ]
2 / 1
) , (
2
2 / 1
) , (
2
) , (
, ,
, ,
) , (
+ +
+ +
=

I m n
r
I m n
I m n
r
j m i n u m n b
m j n i u m n b
j i VM (4.28)

donde b[n,m] representa el bloque de imagen que estamos codificando y u
r
[n,m] la imagen de
referencia. Las coordenadas (i, j) deben variarse para toda la regin de bsqueda. El vector de
desplazamiento se obtiene como los valores (i, j) que producen un mnimo en la funcin VM(i,j). De
todas estas funciones, la que se utiliza con mayor frecuencia es la del error absoluto, ya que produce
unos resultados similares a las dems y tiene una implementacin ms simple. Ntese que el uso de
funciones de distancia entre los pxeles no es ms que una simplificacin para determinar el bloque
ptimo. En rigor, el procedimiento ideal para determinar el vector de movimiento consistira en
evaluar el nmero total de bits con que puede codificarse el bloque de inters en funcin de la zona
utilizada como referencia. No obstante, es evidente que esta estrategia requerira unos clculos
sumamente complejos y adems no aportara excesivas mejoras.

Fig. 4.58 Procedimiento de bsqueda exhaustiva del vector de movimiento con block-matching
Zona de bsqueda en imagen de referencia
N
N
Bloque
a
estimar
Bloque
a estimar
Block Matching
M
M
Zona de bsqueda en imagen de referencia
N
N
Bloque
a
estimar
Bloque
a estimar
Block Matching
M
M
Las medidas de distancia que nos proporcionan las ecuaciones anteriores pueden utilizarse para
evaluar si la compensacin de movimiento nos permitir obtener una buena prediccin del bloque.
Obsrvese que si la distancia mnima que hemos calculado es excesivamente grande, significa que el
error entre el bloque original y la referencia desplazada tambin ser grande (de hecho, estamos
evaluando el error entre ambas imgenes). Cuando la varianza de la seal de error es excesiva, puede
resultar ms rentable codificar el bloque con mtodos convencionales de intra-trama. As pues, la
decisin de codificar el bloque mediante compensacin de movimiento o como intra-trama puede
tomarse una vez determinada la distancia mnima que obtenemos en el proceso de clculo del vector
de movimiento.

Una vez determinado el valor del vector de movimiento, podemos refinar la estimacin utilizando
desplazamientos fraccionales. Los desplazamientos fraccionales suponen que la estimacin del
movimiento puede realizarse con una precisin superior al pxel. Para ello, podemos interpolar el
bloque a codificar en un factor 2 en cada direccin y compararlo con la zona de la imagen de
referencia que se ha detectado como vlida, tambin interpolada en un factor 2. El procedimiento de
block matching puede aplicarse ahora a los 8 pxeles vecinos al punto inicial y detectar si la medida de
distancia obtenida es menor que la que disponamos inicialmente. En la figura 4.59 se muestran los
pxeles de la imagen de referencia iniciales, los interpolados y los elementos sobre los que se calcular
la distancia con el bloque a codificar. El grfico presupone que el vector de movimiento inicial se
sita en el centro de la matriz interpolada y que esta matriz se extiende, como mnimo, a las
dimensiones del bloque interpolado (32x32 pxeles en MPEG-1). La interpolacin de la imagen que se
suele utilizar es lineal, lo que significa que se realiza primero una interpolacin por filas, tomando el
valor medio entre dos muestras como valor interpolado y posteriormente una interpolacin por
columnas con la misma operacin. El mtodo propuesto podra extenderse a factores de interpolacin
superiores, pero los resultados obtenidos no suponen una mejora significativa.

Fig. 4.59 Clculo del vector de movimiento con desplazamientos fraccionales
Pxeles
originales
Pxeles
interpolados
Pxeles
examinados
VM pxel
Pxeles
originales
Pxeles
interpolados
Pxeles
examinados
VM pxel
La bsqueda exhaustiva supone un coste computacional excesivo, por lo que la mayora de algoritmos
implementan alguna simplificacin del problema, orientando la bsqueda del vector ptimo sin
necesidad de realizar todos los clculos de distancia posibles. Los mtodos ms usados son la
bsqueda logartmica, la bsqueda en la direccin del gradiente conjugado, la bsqueda en tres etapas
y la bsqueda jerrquica, que es la que suele proporcionar un mejor compromiso entre el resultado
obtenido y la complejidad computacional. Las primeras alternativas que se han citado se basan en
realizar la bsqueda del vector de desplazamiento ptimo examinando nicamente un conjunto
reducido de puntos en las primeras etapas del clculo. A partir de los resultados obtenidos, se va
refinando la bsqueda hasta determinar la posicin en la que obtenemos una distancia mnima. La
ventaja de estos mtodos es que no es necesario examinar todos los posibles vectores de
desplazamiento para obtener el mnimo. No obstante, es probable que la convergencia del mtodo se
produzca en un mnimo local, cuyo valor no coincide exactamente con el mnimo absoluto que
obtendramos con la bsqueda exhaustiva. Sin embargo, la simplificacin en los clculos y la reducida
probabilidad de que se produzcan estos errores justifican el uso de estas estrategias.

El mtodo de bsqueda en tres pasos se representa esquemticamente en la figura 4.60. Inicialmente
se calcula la distancia del bloque a codificar situado con un desplazamiento nulo respecto a la imagen
de referencia. Tambin se calculan las 8 distancias indicadas como el paso 1 y que estn situadas en
los diferentes cuadrantes de la regin de bsqueda. El paso de bsqueda, es decir, la distancia que
separa los distintos pxeles que son examinados, en esta primera iteracin es de 4 (tanto en la
direccin horizontal, vertical y diagonal). Con estos clculos, se determina el punto para el que hemos
obtenido distancia mnima y se examinan sus 8 vecinos situados a un paso de bsqueda mitad (es
decir 2). Nuevamente se toma el valor mnimo y se calculan las distancias entre el bloque a codificar y
las imgenes de referencia con los 8 vecinos situados a un paso de bsqueda unidad. La posicin en la
que obtenemos el valor mnimo se toma como el vector de desplazamiento.

Fig. 4.60 Procedimiento de bsqueda en tres pasos

1
1 1
1
1 1 1
1
1
2 2
2
2 2 2
2
2
3 3
3
3 3 3
3
3
1
1 1
1
1 1 1
1
1
2 2
2
2 2 2
2
2
3 3
3
3 3 3
3
3
La bsqueda en tres etapas requiere realizar el anlisis de un nmero fijo de puntos. En cada etapa
necesita determinar 8 distancias entre el bloque a codificar y la imagen de referencia. En nuestro
ejemplo, el nmero total de puntos examinados es 25 (8 por cada iteracin ms el punto central). Con
ello, la distancia mxima a la que puede obtenerse el vector de desplazamiento respecto al centro es de
(7,7). Por tanto, la regin de bsqueda se extiende en un margen de (-7,7) respecto a la posicin
central, tanto en la direccin horizontal como la vertical. Si deseamos ampliar la regin de bsqueda,
puede utilizarse un paso de bsqueda inicial de 8 o 16. La filosofa del procedimiento sera la misma,
aunque ahora el nmero de etapas necesarias para determinar el punto final aumentara (5 etapas para
un paso inicial de 16). Ntese que esta estrategia supone un ahorro considerable respecto a la
bsqueda exhaustiva. En nuestro ejemplo la bsqueda exhaustiva hubiera requerido examinar un total
de 225 puntos (15x15), mientras que ste mtodo permite obtener una solucin examinando tan slo
25 puntos. Otra de las ventajas de la bsqueda en tres etapas es que, por su propia construccin,
siempre converge.

Otra estrategia de bsqueda simplificada es usar el algoritmo de direcciones conjugadas, cuya idea
general se muestra en la figura 4.61. En este caso, la bsqueda se inicia en el pxel central y se
examinan los dos pxeles adyacentes en la direccin horizontal. Si la distancia mnima se encontrara
para el pxel central, se dara por terminada la bsqueda en esta direccin. En caso contrario, se toma
como nuevo punto de partida el que ha obtenido el valor mnimo y se continan examinando sus
vecinos horizontales (de hecho, slo es necesario examinar uno de ellos, ya que el otro ya habr sido
calculado previamente). La bsqueda en el eje horizontal termina cuando encontramos un punto cuyos
dos vecinos presentan una medida de distancia mayor. Por tanto, el procedimiento consiste
simplemente en buscar un mnimo local en la direccin horizontal examinando pxeles vecinos. Una
vez localizado este mnimo se realiza la bsqueda en el sentido vertical hasta encontrar otro mnimo
local. Finalmente, se aplica el mismo procedimiento en el sentido diagonal hasta obtener el vector de
desplazamiento final.

Fig. 4.61 Bsqueda del vector de desplazamiento mediante direcciones conjugadas
1 1 1 1 1 1
2
2
2
2
2
2
3
3
3
1 1 1 1 1 1
2
2
2
2
2
2
3
3
3
La bsqueda por direcciones conjugadas no tiene un nmero predeterminado de puntos a evaluar. El
clculo total depender de la posicin del vector de movimiento, siendo reducido cuando el mnimo se
site cerca del punto inicial. Para mejorar la velocidad del algoritmo, puede cambiarse el punto inicial
por una estimacin previa del vector de movimiento, que normalmente es el vector de movimiento que
hemos obtenido en el bloque analizado anteriormente (recurdese que bloques prximos tendrn
vectores de movimiento parecidos). El algoritmo no tiene ninguna restriccin en cuanto al tamao de
la regin de inspeccin, que puede ser tan grande como deseemos. No obstante, es posible que no
encuentre un mnimo local dentro del rea especificada, en cuyo caso deberemos tomar como mnimo
los valores obtenidos en los lmites de la zona de bsqueda.

La bsqueda jerrquica suele obtener unos resultados excelentes con una complejidad computacional
moderada. El procedimiento consiste en reducir la resolucin espacial de la zona de bsqueda y del
bloque que estamos comparando, con el objeto de simplificar los clculos y obtener una primera
aproximacin del vector de desplazamiento. Suponiendo que la zona de bsqueda se reduce a una
matriz de 64x64 y que utilizamos un bloque de 16x16 pxeles, podemos realizar, tal y como se indica
en la figura 4.62, una primera reduccin a 32x32 y 8x8 y posteriormente una segunda simplificacin a
16x16 y 4x4 respectivamente. Con este tamao de imgenes reducido se puede aplicar un
procedimiento de bsqueda exhaustiva o uno de bsqueda simplificada para determinar una primera
estimacin del vector de movimiento. Posteriormente, se reconstruyen las imgenes con resolucin
doble y se inspeccionan los 8 pxeles vecinos del vector candidato, quedndonos con el mnimo como
nuevo candidato. El procedimiento puede aplicarse hasta obtener las imgenes con la resolucin
original o incluso continuarlo una etapa ms si queremos obtener un vector de movimiento final con
una resolucin fraccionaria. El nmero de niveles de descomposicin de las imgenes depende de los
tamaos del rea de bsqueda y del bloque. Dos o tres etapas de descomposicin suelen resultar
suficientes. Los resultados proporcionados por la bsqueda jerrquica suelen ser bastante mejores que
los de los mtodos precedentes, sobre todo en los casos en los que el rea de bsqueda es de
dimensiones considerables.

Fig. 4.62 Idea general del procedimiento de bsqueda jerrquica del vector de movimiento
Diezmado
2
Diezmado
2
Bsqueda
exhaustiva o
simplificada
Reconstruir
2
Refinar
bsqueda
Reconstruir
2
Diezmado
2
Diezmado
2
Bsqueda
exhaustiva o
simplificada
Reconstruir
2
Refinar
bsqueda
Reconstruir
2
4.9.4 Tipos de imgenes en el MPEG
El MPEG-1 y el MPEG-2 definen distintos tipos de imgenes dentro de la secuencia de vdeo en los
que se utilizan tcnicas de codificacin distintas. El objetivo final es conseguir un sistema robusto,
que pueda recuperarse automticamente de los posibles errores en la recepcin de los datos y que a su
vez presente un factor de compresin considerable. Por ello, se definen subsecuencias o grupos de
imgenes en los que se combina la compresin intra-trama, con compresiones basadas en la
compensacin de movimiento forward y compresiones basadas en la compensacin bidireccional. Los
tipos de imgenes que pueden aparecer en la secuencia codificada son:

a) Imgenes I (Intra-trama). El procedimiento de compresin utilizado es muy parecido al
del JPEG. Las imgenes se descomponen en bloques de 8x8 pxeles que son
transformados mediante la transformada coseno. Los coeficientes transformados son
cuantificados mediante tablas pre-establecidas y finalmente se codifican mediante
cdigos de longitud variable. Por tanto, estas imgenes se codifican de forma
independiente sin aprovechar ningn tipo de redundancia temporal. Se utilizan para el
acceso aleatorio a distintas partes de la secuencia de vdeo en CD-ROM (MPEG-1) o en
el DVD-Vdeo (MPEG-2). Las imgenes I pueden utilizarse para realizar la prediccin
mediante compensacin de movimiento de las imgenes P y B que se describen a
continuacin.
b) Imgenes P (Predicted). La codificacin de estas imgenes se realiza utilizando
compensacin de movimiento forward a partir de una imagen I u otra imagen P previa.
Estas imgenes pueden propagar errores y se utilizan para realizar la prediccin de otras
imgenes P o B.
c) Imgenes B (Bidireccionales). Se obtienen usando compensacin de movimiento
bidireccional a partir de imgenes I o P. No se utilizan para predecir ninguna otra imagen
por lo que no propagan los errores.
d) Imgenes D. Estas imgenes slo se utilizan en el MPEG-1. Son imgenes intra-trama en
las que nicamente se codifica el coeficiente de continua de la transformada coseno. Se
utilizan nicamente en los modos de avance rpido del vdeo para obtener una secuencia
de alta velocidad pero baja calidad.

La relacin y proporcin de cada tipo de imgenes en la secuencia MPEG puede ser definida por el
codificador, admitindose diversas posibilidades. Una de las secuencias utilizadas con mayor
frecuencia se ilustra en la figura 4.63 y est formada por una secuencia bsica de 12 imgenes en las
que interviene una imagen del tipo I, dos del tipo P y 6 del tipo B. Las posibles secuencias de
imgenes se denominan grupo de imgenes (Group Of Pictures GOP) y suelen identificarse
mediante dos parmetros N y M que identifican el nmero total de imgenes de la secuencia y el
nmero de imgenes que hay entre dos imgenes que pueden utilizarse como imgenes de referencia
(I o P). En nuestro ejemplo, la secuencia GOP tiene los parmetros N=12 y M=3.

Atendiendo a la estructura de la figura 4.63, la imagen P1 se codificara utilizando compensacin de
movimiento forward sobre la imagen I1. Anlogamente, la imagen P2 utilizara la compensacin de
movimiento tomando como referencia a P1 y la P3 tomara como referencia P2. Obsrvese que este
proceso es muy sensible a los posibles errores en la decodificacin de la secuencia que se propagaran
al resto de imgenes. En efecto, si debido al ruido se produce un error en la decodificacin de una de
las imgenes I o P, esta imagen quedar almacenada en la memoria del decodificador y se utilizar
para reconstruir el resto de imgenes a partir de los vectores de movimiento y los errores de
prediccin recibidos. Aunque los nuevos errores de prediccin se reciban correctamente, las nuevas
imgenes no estarn exentas de errores, por cuanto se estn utilizando como referencia una imagen
incorrecta. Por ello, es importante dedicar un nmero considerable de bits a las imgenes que se
utilizan como referencia para garantizar que no existe una propagacin de errores considerable.
Adems, las transmisiones digitales de los datos debern contener cdigos protectores de error para
garantizar la correcta decodificacin de la informacin y mantener una tasa de bits errneos baja. Los
cdigos de proteccin de error debern adaptarse a las caractersticas del canal y estn definidos por la
normativa de transmisin regulada por el DVB. Tambin se incluyen potentes cdigos de proteccin
de errores en los formatos de almacenamiento digital como el CD-ROM o el DVD. El MPEG no se
ocupa de las protecciones que deben asignarse a los datos pues siempre dependen de las caractersticas
de la aplicacin y del ruido existente en el canal de transmisin (radiodifusin terrena, satlite, cable)
o en el soporte fsico de los datos (DVD, cinta magntica, etc).

Fig. 4.63 Una posible secuencia de imgenes en MPEG (N=12, M=3)

Las imgenes B se codifican utilizando la compensacin de movimiento bidireccional sobre las
imgenes de referencia ( I o P) ms prximas. As, la imagen B6 se codifica utilizando como
referencia las imgenes P2 o P3. Esta forma de codificar la informacin representa ciertos problemas
en los sistemas de acceso aleatorio basados en el MPEG, como el DVD-Vdeo. Para decodificar una
imagen del tipo B, como por ejemplo la B6, deberemos decodificar primero las imgenes del tipo I,
despus P1, que permite decodificar P2 y esta a su vez permite decodificar P3. Una vez disponemos
de P2 y P3 podemos proceder a decodificar B6. Por ello, las nicas imgenes que permiten el acceso
aleatorio real son la imgenes del tipo I, que son las que siempre quedan referenciadas cuando
queremos acceder a una escena concreta. Dependiendo del modelo de decodificador es posible que un
DVD Vdeo, en el modo de avance rpido, slo muestre las imgenes de tipo I o de tipo I y P,
omitiendo las del tipo B. Adems, la parada de imagen suele realizarse tambin en una imagen I o P.
Las imgenes de tipo B suelen tener asignado un nmero de bits muy reducido, por lo que la calidad
es muy baja. En modo de reproduccin normal el sistema visual interpola estos problemas no
advirtiendo la falta de calidad de las imgenes. No obstante, cuando la imagen est parada estos
problemas pueden resultar demasiado evidentes. La reproduccin de la secuencia en sentido inverso a
velocidad normal (es decir decodificando todas las imgenes) suele ser una opcin que slo
I1 I1 P1 P2 P3 B1 B2 B3 B4 B5 B6 B7 B8 I1 I1 P1 P2 P3 B1 B2 B3 B4 B5 B6 B7 B8
incorporan los reproductores de DVD de gama ms alta. En la figura 4.64 se muestra un grupo de
imgenes (GOP) con parmetros N=9 y M=3 en el que se indican qu imgenes se utilizan como
referencia para la codificacin de cada una.

Fig. 4.64 Grupo de imgenes con M=3, N=9 en el que se indican las relaciones de prediccin

Como las imgenes B no se utilizan como referencia de ninguna otra imagen, no propagan los errores.
Esto significa que, en la prctica, los errores cometidos en estas imgenes no tienen tanta incidencia
sobre las prestaciones del sistema, por lo que generalmente son las imgenes en las que se aplica la
mayor compresin. Aunque el MPEG permite una gran libertad en la asignacin de los bits,
podramos decir que las relaciones de bits que se dedican a cada uno de los tipos de imgenes son
aproximadamente de 5, 3 y 1 para las imgenes I, P y B respectivamente. No obstante, estas relaciones
pueden cambiar en funcin del contenido de la secuencia de vdeo y de las caractersticas del
codificador.

4.9.5 Orden de transmisin de las imgenes
El uso de prediccin bidimensional, junto con el objetivo de reducir al mximo posible la memoria del
decodificador, impone que el orden en el que se transmiten las imgenes sea distinto del orden en el
que deben visualizarse. Si no existieran estas restricciones sobre la memoria del decodificador, ste
podra almacenar en un buffer las imgenes recibidas y decodificarlas cuando hubiera recibido toda la
informacin necesaria. El MPEG establece que no se necesite almacenar ms de dos imgenes de
referencia en el decodificador, ms una memoria adicional para la imagen que se est codificando en
cada momento. Para ello, es necesario cambiar el orden de transmisin de manera que las imgenes
I P P I B B B B B B B B P B B
N=9
M=3
P I P P I B B B B B B B B P B B
N=9
M=3
P
del tipo B se reciban siempre despus de haber recibido las referencias que se han utilizado en su
codificacin. En la figura 4.65 se muestra el orden de transmisin de las imgenes junto con la
informacin que dispone el decodificador en cada una de las dos memorias de imgenes referencia y
en la memoria de decodificacin de imgenes B. Tambin se indica cmo se reconstruye la secuencia
de visualizacin y el retardo que sta tiene respecto a la seal transmitida.

Fig. 4.65 Orden de transmisin y de visualizacin de la secuencia de imgenes MPEG (N=9, M=3)

El MPEG define el concepto de grupo cerrado de imgenes (closed GOP) cuando la codificacin de la
secuencia permite presentar imgenes en el display justo una imagen despus de recibir una imagen
intra-trama (I). El grupo cerrado de imgenes tiene inters en algunos sistemas de acceso aleatorio
como el DVD, en los que las imgenes I se utilizan como referencia de inicio de pasajes. Una de las
caractersticas del DVD es que debe permitir el salto de determinados pasajes (p.ej. visionado del
vdeo sin mostrar escenas violentas o de contenido ertico) sin que el espectador advierta ningn tipo
de discontinuidad. Esto supone que cuando se produce un salto en la secuencia normal puedan seguir
vindose las imgenes sin ningn tipo de interrupcin.

Para obtener un grupo cerrado es necesario realizar algunas restricciones sobre la forma en la que se
codifican las imgenes. Obsrvese en la figura 4.65, que despus de recibir la imagen I
0
, deberamos
mostrar por pantalla las imgenes B
-2
y B
-1
. Sin embargo, en una codificacin convencional, estas
imgenes no podran decodificarse, debido a que nos hemos saltado la imagen P
-3
que se utiliza para la
compensacin de movimiento forward, por lo que deberamos esperar dos cuadros adicionales hasta
poder empezar con la decodificacin de la secuencia.

Para evitar este problema, la definicin de grupos cerrados se restringe a que todas las imgenes B que
preceden a una imagen I sean codificadas utilizando nicamente compensacin de movimiento
backward. Con ello, las imgenes B
-2
y B
-1
podrn decodificarse utilizando nicamente I
0
. En la figura
4.64 que muestra las relaciones de prediccin entre las distintas imgenes, hemos indicado mediante
lneas discontinuas las relaciones que no se utilizan en la definicin de los grupos cerrados. En la
transmisin de seales de televisin, donde el flujo de imgenes es constante y no puede ser
configurado por el usuario no suelen utilizarse los grupos cerrados. La definicin de grupo cerrado
Orden Natural:
Orden Transmisin:
Memoria 1 Decodificador:
Memoria Imag. Decodif:
Imagen mostrada display:
P
-3
B
-2
B
-1
I
0
B
1
B
2
P
3
B
4
B
5
P
6
B
7
B
8
I
9
I
0
B
-2
B
-1
P
3
B
1
B
2
P
6
B
4
B
5
I
9
P
-3
P
-3
P
-3
P
3
I
0
I
0
I
0
I
0
I
0
I
0
P
6
P
6
P
6
P
6
P
3
P
3
P
3
P
3
P
3
I
9
B
-2
B
-1
B
1
B
2
B
4
B
5
P
-3
B
-2
B
-1
I
0
B
1
B
2
P
3
B
4
B
5
P
6
Orden Natural:
Orden Transmisin:
Memoria Imag. Decodif:
Imagen mostrada display:
P
-3
B
-2
B
-1
I
0
B
1
B
2
P
3
B
4
B
5
P
6
B
7
B
8
I
9
I
0
B
-2
B
-1
P
3
B
1
B
2
P
6
B
4
B
5
I
9
P
-3
P
-3
P
-3
P
3
I
0
I
0
I
0
I
0
I
0
I
0
P
6
P
6
P
6
P
6
P
3
P
3
P
3
P
3
P
3
I
9
B
-2
B
-1
B
1
B
2
B
4
B
5
P
-3
B
-2
B
-1
I
0
B
1
B
2
P
3
B
4
B
5
P
6
significa que todas las imgenes existentes en el GOP puede decodificarse sin necesidad de recurrir a
otras imgenes de un GOP anterior.

4.9.6 Algunos ejemplos con secuencias y codificadores ideales
Antes de entrar en los detalles de la codificacin usada para cada tipo de imagen y de la estructura de
la trama MPEG consideraremos algunos aspectos de carcter general sobre las propiedades y
caractersticas que deberan presentar los codificadores ideales trabajando con secuencias
simplificadas.

La secuencia de vdeo ms simple es un plano fijo estacionario. En este caso, toda la informacin de
vdeo estara contenida en las imgenes I, cuya codificacin se repetira peridicamente durante la
transmisin de estas imgenes en la secuencia MPEG. Evidentemente, la trama MPEG contendra
informaciones de cabecera sobre sincronismos, sobre los tipos de codificacin utilizados en los
distintos tipos de imagen y otros detalles relativos a la estructura de la trama de datos, pero
esencialmente, la totalidad de la informacin de vdeo estara dedicada a la codificacin de imgenes
intra-trama. Probablemente, el codificador detectara esta situacin ideal y podra decidir dedicar un
gran nmero de bits a la codificacin de las imgenes intra, con el objeto de aumentar la calidad de la
secuencia de vdeo. Esta situacin ideal no significa que el procesador del codificador est exento de
realizar los complejos clculos de estimacin de movimiento y prediccin bidireccional. Simplemente
significa que los resultados de los clculos seran perfectos, es decir, todos los vectores de movimiento
seran nulos, las diferencias entre vectores de movimiento tambin seran nulas, la prediccin de las
imgenes sera exacta y, por lo tanto, los errores de prediccin seran cero, con lo que su codificacin
supondra slo un nmero de bits mnimo. Obsrvese, no obstante, que si el plano fijo estacionario
tiene cierto ruido aditivo, la situacin dejar de ser ideal, por cuanto los errores de prediccin de las
imgenes P y B coincidirn con las diferencias entre los ruidos en las imgenes I, P y B. Esto
significar que parte del flujo de informacin deber dedicarse a codificar un ruido que no aporta
ninguna informacin visual. Por esta razn, suele decirse que es muy importante eliminar el ruido
existente en las imgenes antes de proceder a su codificacin, ya que se trata de una seal de
naturaleza totalmente aleatoria, que, por lo tanto, no puede predecirse, y que requiere un nmero de
bits que, en cualquier caso, empeoran la calidad con la que se visualiza la imagen.

Otra secuencia simple es un travelling horizontal sobre una escena estacionaria. En este caso, la
cmara se desplaza a una velocidad constante, por lo que todos los objetos experimentan un
movimiento de la misma magnitud y sentido. Las imgenes intra-trama se codificarn de forma
independiente del resto de imgenes y por lo tanto contendrn una cantidad de informacin parecida a
la que contienen en otro tipo de escenas. Una parte de los bloques de las imgenes P pueden
predecirse de forma exacta, puesto que corresponden a los mismos objetos que ya estaban presentes en
la imagen I anterior, desplazados por el movimiento que ha experimentado la cmara. Adems, todos
estos vectores de movimiento seran idnticos, por lo que su codificacin como diferencias puede
resultar muy eficiente. No obstante, existirn algunos bloques de las imgenes P que no puedan ser
estimados basndonos en las imgenes anteriores, ya que se corresponden con los nuevos objetos que
han quedado descubiertos por el movimiento de la cmara. Un codificador ideal debera identificar
estos bloques, reconocer que no resulta apropiado utilizar la compensacin de movimiento y
codificarlos como bloques intra-trama. La relacin entre el nmero de bloques que se codifican
mediante compensacin de movimiento y los que se codifican como intra-trama depender de la
velocidad con la que se realice el travelling. Los bloques del tipo B podrn codificarse con un nmero
de bits prcticamente nulo, pues el uso de la compensacin bidireccional permitir obtener
predicciones ajustadas de todos los objetos utilizando las referencias pasadas o futuras. Los objetos de
la imagen B que an no hayan aparecido en la referencia futura se codificarn utilizando prediccin
forward, mientras que los que ya hayan desaparecido en la imagen anterior se codificarn utilizando
compensacin de movimiento backward. Los objetos que estn presentes en las dos referencias se
codificarn como el promedio entre las dos predicciones, minimizando de este modo la incidencia del
ruido en las prdidas de ganancia de compresin.

Finalmente, consideramos la codificacin de un cambio de plano entre dos escenas estacionarias.
Supondremos que estamos trabajando con una secuencia GOP con N=9 y M=3 y que el cambio de
plano se produce en la imagen B4. En este caso, la imagen P1 se codificar utilizando la imagen I0
como referencia y utilizando prediccin de movimiento forward. La imagen P2 tambin intentar
codificarse del mismo modo tomando como referencia P1. No obstante, al haberse producido el
cambio de plano, el error de prediccin aumentar considerablemente, por lo que la mayora de
bloques se codificaran como bloques intra-trama (en teora todos los bloques deberan codificarse
como intra-trama, pero es posible que la compensacin de movimiento encuentre zonas parecidas
entre las dos imgenes, que aunque en realidad corresponden a objetos distintos pueden utilizarse para
la prediccin). Las imgenes B4 y B5 se codificaran utilizando compensacin de movimiento que en
su mayor parte ser backward, ya que debido al cambio de plano la referencia ideal a esta imgenes se
encuentra en el futuro (P2).

Debemos insistir que las ideas presentadas en esta seccin pretenden proporcionar un punto de vista
general sobre la filosofa de codificacin del MPEG y que no necesariamente todos los codificadores
deben comportarse del modo descrito. Durante el anlisis de las imgenes es posible que aparezcan
errores en la estimacin de movimiento, tomando como referencia zonas de imagen que se parecen a
las que queremos codificar, pero que no corresponden a los mismos objetos. No obstante, si existe
parecido entre las regiones, podremos obtener alguna ganancia de codificacin. Por otra parte, el
MPEG admitira que un determinado codificador no realizar la compensacin de movimiento
backward y todas las imgenes B fueran codificadas con compensacin forward o como imgenes
intra-trama. El resultado sera una prdida en el factor de compresin y probablemente una prdida en
la calidad de las imgenes. No obstante, el decodificador de MPEG sera compatible con este formato
ya que la trama de datos que proporcionara el codificador coincide con la que se hubiera transmitido
en el caso de considerar que la codificacin backward no resultaba eficiente.

4.9.7 Diagramas generales del proceso de codificacin y decodificacin de imgenes
En las figuras 4.66 y 4.67 se muestran los esquemas genricos del proceso de codificacin y
decodificacin de imgenes en el MPEG. Los esquemas son muy simplificados y deben interpretarse
nicamente como la idea general implcita en todo el proceso de codificacin donde intervienen
mltiples decisiones sobre el procedimiento con el que se codifica cada macrobloque, las escalas de
cuantificacin, los cdigos de longitud variable y la codificacin de las componentes de croma y de
luminancia por separado. Atendiendo al esquema del codificador, el bloque de preprocesado incluye
los posibles filtros de interpolacin, diezmado o eliminacin de ruido que se aplica a la seal de vdeo
a codificar. El bloque de estimacin de movimiento proporciona los vectores de desplazamiento que
deben aplicarse en la prediccin de las imgenes. Suponemos que este bloque es suficientemente
sofisticado como para no actuar en el caso de que se trate de imgenes del tipo I o indicar al resto de
bloques cundo resulta conveniente aplicar la compensacin de movimiento y cundo es preferible
codificar los macrobloques como intra-trama.

La salida del estimador de movimiento se introduce en los cdigos de longitud variable para optimizar
la codificacin de estos vectores. El bloque encargado de realizar la DCT se aplica sobre la seal error
de prediccin. Esta seal ser la diferencia entre la imagen actual y la referencia desplazada. En el
caso en que se realice una codificacin intra-trama del bloque, la seal en la salida del predictor por
compensacin es cero de modo que se calcula directamente la DCT del bloque a codificar. Los
coeficientes transformados se cuantifican, generalmente utilizando las tablas de cuantificacin por
defecto aunque tambin es posible utilizar tablas propias; que en el caso del MPEG-1 deben ser las
mismas para toda la secuencia de vdeo, pero que para el MPEG-2 pueden variarse de imagen a
imagen.

Fig. 4.66 Esquema bsico del proceso de codificacin empleado en el MPEG

Por otra parte, el sistema puede actuar directamente sobre la tasa de bits con que se codifica la
secuencia de vdeo, modificando en tiempo real los factores de escala del cuantificador. Si un
determinado fragmento de la secuencia de vdeo contiene excesiva informacin no predictible, puede
reducirse la tasa de bits utilizando cuantificadores con menos pasos. Evidentemente, esto incide sobre
la calidad de la secuencia.
Preprocesado
Preprocesado
Estimacin de
movimiento
Estimacin de
movimiento
Imgenes de
referencia
Imgenes de
referencia
Predictor por
compensacin
Predictor por
compensacin
Transformada
Coseno 2D
Transformada
Coseno 2D
Cuantificacin
Cuantificacin
Cdigos de
Longitud
Variable
Cdigos de
Longitud
Variable
Cuantificacin
Inversa
Cuantificacin
Inversa
Transformada
Coseno 2D
Inversa
Transformada
Coseno 2D
Inversa
+
+
-
Imagen
entrada
Imagen
codificada
Preprocesado
Preprocesado
Estimacin de
movimiento
Estimacin de
movimiento
Imgenes de
referencia
Imgenes de
referencia
Predictor por
compensacin
Predictor por
compensacin
Transformada
Coseno 2D
Transformada
Coseno 2D
Cuantificacin
Cuantificacin
Cdigos de
Longitud
Variable
Cdigos de
Longitud
Variable
Cuantificacin
Inversa
Cuantificacin
Inversa
Transformada
Coseno 2D
Inversa
Transformada
Coseno 2D
Inversa
+
+
-
Imagen
entrada
Imagen
codificada

El codificador almacena en memoria las imgenes de referencia que recuperar el decodificador,
basndose en los valores de los coeficientes cuantificados. El esquema es parecido al utilizado en los
sistemas de prediccin lineal estudiados en los primeros apartados de este captulo y es necesario para
evitar que los errores de cuantificacin se vayan acumulando e impidan que el receptor recupere una
imagen de calidad aceptable.

El esquema del decodificador, que se representa en la figura 4.67, realiza la conversin de los cdigos
de longitud variable a coeficientes cuantificados y vectores de movimiento y restablece las imgenes
al formato de vdeo convencional. Pueden aplicarse filtros de postproceso para mejorar la calidad de la
imagen (por ejemplo filtros de interpolacin de lneas para mejorar la visualizacin en el display)

Fig. 4.67 Esquema del proceso de decodificacin empleado en el MPEG

4.9.8 Estructura jerrquica de la trama MPEG
La trama MPEG est estructurada de forma jerrquica con el objetivo de aumentar la flexibilidad del
sistema y la intercomunicacin entre el codificador y el decodificador. Mediante esta estructura de
trama pueden resultar compatibles codificadores que realicen procesos lgicos distintos. La estructura
de la trama empieza con una cabecera de la capa superior y contina con las cabeceras e
informaciones de las capas siguientes. Las capas utilizadas, en orden jerrquico descendiente, son las
de secuencia, grupo de imgenes, imagen, slice, macrobloque y bloque. Las relaciones de estas capas
en una secuencia de vdeo y en cada una de las imgenes se representan de forma esquemtica en la
figura 4.68. En los siguientes apartados describimos algunos de los detalles que se incorporan en las
cabeceras de cada capa.

a) Capa de secuencia. La secuencia est formada por uno o ms Grupos de Imgenes
(GOP). En esta cabecera se definen los parmetros bsicos de la secuencia de vdeo
como las dimensiones de la imagen, la frecuencia de imagen, los tamaos de buffer
esperados del decodificador, la relacin de aspecto del pxel, etc. En el MPEG-1 la
cabecera de secuencia puede contener matrices de cuantificacin distintas a las matrices
I mgenes de
referencia
I mgenes de
referencia
Cdigos de
Longitud
Variable
Cdigos de
Longitud
Variable
Cuantificacin
I nversa
Cuantificacin
I nversa
Transformada
Coseno 2D
I nversa
Transformada
Coseno 2D
I nversa
+
Predictor por
compensacin
Predictor por
compensacin
Postprocesado
Postprocesado
I magen
descodificada
I magen
codificada
I mgenes de
referencia
I mgenes de
referencia
Cdigos de
Longitud
Variable
Cdigos de
Longitud
Variable
Cuantificacin
I nversa
Cuantificacin
I nversa
Transformada
Coseno 2D
I nversa
Transformada
Coseno 2D
I nversa
+
Predictor por
compensacin
Predictor por
compensacin
Postprocesado
Postprocesado
I magen
descodificada
I magen
codificada
por defecto. En el MPEG-2, las posibles variantes de las matrices de cuantificacin se
definen en la capa de imagen y por lo tanto pueden variarse de imagen a imagen.
b) Capa de Grupo de Imgenes (GOP). El grupo de imgenes puede definirse como una
secuencia de imgenes que se transmiten en un orden distinto al que sern presentados
en el display y que facilita el acceso aleatorio a la secuencia. Los diferentes paquetes de
GOP que forman una secuencia se transmiten en el mismo orden en que sern
representados en pantalla, el cambio de orden entre la transmisin y la representacin
slo se produce en las imgenes que forman cada GOP. El grupo de imgenes siempre
empieza con una imagen del tipo I. La cabecera aporta informacin sobre si se trata de
un GOP abierto o cerrado. Tambin indica el cdigo de tiempos SMPTE de la primera
imagen I. En el MPEG-1 debe transmitirse el tipo de estructura del grupo (es decir, los
parmetros M y N). En el MPEG-2 est informacin es opcional y puede tomar valores
por defecto.
c) Capa de Imagen (Picture). Es una unidad de codificacin que incluye la luminancia y las
dos componentes de croma de la imagen. La cabecera define el tipo de imagen (I, P, B,
D) as como el rango de valores mximos del vector de movimiento en esta imagen.
Tambin indica el orden de la imagen dentro del GOP.
d) Capa de Slice. Es la unidad bsica de resincronizacin del sistema y por lo tanto
desempea un papel fundamental en el soporte de errores. El decodificador puede
saltarse un slice corrupto e ir directamente a decodificar el siguiente. El nmero de slices
en una imagen es variable y depende de las caractersticas del ruido en el que se aplica el
MPEG. Puede variar entre 1 slice por imagen o 1 slice por macrobloque. En la cabecera
se incluye el cdigo de inicio de slice y el factor de escala del cuantificador.
e) Capa de Macrobloque. Es la unidad bsica sobre la que se realiza la compensacin de
movimiento. Est formado por una regin de 16x16 pxeles en la luminancia y regiones
de 8x8 en las componentes de croma. Proporciona informacin sobre el tipo de
codificacin utilizado en el macrobloque, la escala del cuantificador y el vector de
movimiento.
f) Capa de bloque. Es la unidad de codificacin a la que se aplica la transformada coseno.
Est formada por bloques de 8x8 pxeles en la componente de luminancia y de 4x4
pxeles en la de croma. Contiene la informacin relativa a la componente de continua
(DC), los coeficientes AC y la informacin de finalizacin de la codificacin de bloque
(EOB).

4.9.9 Algunos detalles sobre la codificacin de las imgenes del tipo I
La codificacin de las imgenes del tipo I es muy parecida a la que se utiliza en el JPEG. La
diferencia ms importante es la que se refiere a las tablas de cuantificacin y a los procedimientos que
se utilizan para realizar cambios sobre las escalas de cuantificacin. En principio, las tablas de
cuantificacin pueden proporcionarse en el inicio de la secuencia en el MPEG-1 o en la cabecera de
imagen en el MPEG-2, aunque normalmente se utilizan las tablas de cuantificacin por defecto. Slo
en casos en los que las dimensiones en nmero de pxeles de las imgenes sean muy distintas de las
habituales pueden obtenerse ventajas considerables por el cambio de tablas de cuantificacin. El
tamao de los slices no viene especificado en el estndar y por lo tanto deber fijarlos el codificador.
La estructura de macrobloques implcita en la trama MPEG impone que el orden en que se codifican

Fig 4.68 Estructura jerrquica de la trama MPEG

los bloques intra-trama no coincida con el que se utiliza en el JPEG (por filas de 8x8), sino que se
codifiquen por filas dentro del macrobloque (es decir, dos filas de 8x8).

La transformada coseno se aplica directamente a los valores de los pxeles sin extraer el nivel de gris
neutro. La DCT se calcula con una precisin de 11 bits, por lo que el rango de la componente de
continua va de 0 a 2047 (siempre es positiva, ya que no hemos eliminado la componente de continua)
y el de los AC va de 1024 a 1023. El coeficiente de continua se codifica de forma diferencial
respecto al coeficiente de continua del bloque anterior. La codificacin diferencial se reinicia a cero
cada vez que empieza un nuevo slice. Siempre se codifica con un paso de cuantificacin fijo de 8,
utilizando cdigos de longitud variable parecidos a los del JPEG en los que se emplea un smbolo para
indicar el margen de niveles del coeficiente y otro smbolo para indicar su valor.

Los coeficientes AC se exploran en zigzag y se pasan a travs de cuantificadores uniformes. La tabla
de cuantificacin por defecto para la componente de luminancia se representa en la figura 4.69. El
MPEG permite, como ya hemos comentado, variar la escala del cuantificador para ajustar la tasa de
bits que se produce en la salida del codificador. Si observamos que la tasa de bits es excesivamente
alta, podemos aumentar el paso de cuantificacin, por lo que se reducir la cantidad de bits con que se
codifica la informacin y se perder calidad. La escala del cuantificador se indica con una palabra de 5
bits incorporada en la cabecera del macrobloque y se aplica a los 4 bloques que lo forman. Esta
Secuencia de vdeo
Grupo de Imgenes
Imagen
Slice
Slice
Macrobloque
Bloque
8 pxeles
8 pxeles
Secuencia de vdeo
Grupo de Imgenes
Imagen
Slice
Slice
Macrobloque
Bloque
8 pxeles
8 pxeles
palabra de 5 bits define un nmero entre 1 y 31 que, a partir de la tabla de cuantificacin nos permite
determinar el nivel del coeficiente, mediante la ecuacin:

=
uv
uv
quv
Q qs
S
S
8
round (4.29)

donde S
uv
es el valor del coeficiente transformado, Q
uv
el valor de la tabla de cuantificacin, qs es el
factor de escala y S
quv
es el coeficiente transformado una vez cuantificado. De acuerdo con esta
ecuacin, cuando el factor de escala toma el valor 8, se utiliza la tabla de cuantificacin por defecto.
Si disminuimos el factor de escala, utilizaremos un paso de cuantificacin menor (ms calidad de
imagen y mayor tasa de bits) y viceversa. En el MPEG-2 es posible definir, adems de la escala de
cuantificacin, si se utilizan curvas de cuantificacin lineales o no lineales.

Fig. 4.69 Tabla de cuantificacin por defecto en la componente de luminancia para la codificacin intra-trama

Para los coeficientes AC se utilizan cdigos de longitud variable en los que se indica el nmero de
ceros consecutivos y el margen dinmico del siguiente coeficiente no nulo en una primera parte del
mensaje y el valor del coeficiente en una segunda parte. La idea de fondo es anloga a la que se utiliza
en el JPEG.

4.9.10 Algunos detalles sobre la codificacin de las imgenes de tipo P
La codificacin de las imgenes P es algo ms compleja que las imgenes intra-trama, pues debe
realizarse la estimacin de movimiento y decidir cul es la forma ms eficiente de codificar un
macrobloque en funcin de los resultados obtenidos. En este apartado definiremos los distintos tipos
de macrobloques que puede producirse en la codificacin de las imgenes P.

Una de las primeras peculiaridades de las imgenes P es que puede saltarse la codificacin de algunos
macrobloques (skipped macroblock). Esto ocurre cuando el procesador considera que no es necesario
codificar un macrobloque, puesto que la informacin que contiene puede aproximarse con suficiente
precisin basndonos en la informacin que tenemos en la misma posicin en la imagen de referencia
8 16 19 22 26 27 29 34
16 16 22 24 27 29 34 37
19 22 26 27 29 34 34 38
22 22 26 27 29 34 37 40
22 26 27 29 32 35 40 48
26 27 29 32 35 40 48 58
26 27 29 34 38 46 56 69
27 29 35 38 46 56 69 83
8 16 19 22 26 27 29 34
16 16 22 24 27 29 34 37
19 22 26 27 29 34 34 38
22 22 26 27 29 34 37 40
22 26 27 29 32 35 40 48
26 27 29 32 35 40 48 58
26 27 29 34 38 46 56 69
27 29 35 38 46 56 69 83
anterior. En este caso, los 4 bloques que forman el macrobloque se sustituyen por los mismos pxeles
que tenamos en la imagen anterior, lo que significa que, en el fondo, estamos realizando una
compensacin de movimiento con un vector de movimiento nulo y que el error de prediccin obtenido
es suficientemente prximo a cero como para que no sea preciso codificarlo.

Adems de los macrobloques skipped es posible tener 7 tipos adicionales que se denotan como pred-
mc, pred-c, pred-m, intra-d, pred-mcq, pred-cq y intra-q. Las abreviaturas que se utilizan para
identificar los posibles tipos de macrobloque corresponden a:

pred: Macrobloque codificado utilizando prediccin. La codificacin no es intra-trama.
m: Macrobloque codificado utilizando compensacin de movimiento forward. Se transmite el
vector de movimiento asociado.
c: Como mnimo se transmite la informacin de error asociada a uno de los bloques que
forman el macrobloque.
d: Se utiliza el cuantificador por defecto.
q: Se realiza un cambio en la escala del cuantificador.
skipped: Macrobloques que no son transmitidos.

De acuerdo con estas abreviaturas, un macrobloque del tipo pred-mcq estar codificado utilizando
prediccin por compensacin de movimiento forward, lo que significa que se transmite el vector de
movimiento asociado. Adems, el sufijo c indica que, como mnimo, se transmite la informacin de
error asociada a uno de los bloques y que se realiza un cambio de escala en el cuantificador. Un
macrobloque del tipo pred-c indicara que se utiliza prediccin, pero sin transmitir el vector de
movimiento, y que como mnimo se enva la informacin asociada a uno de los bloques.

Fig. 4.70 Matriz de cuantificacin inter-trama para la componente de luminancia

La misin del codificador es elegir entre las distintas posibilidades de codificar un macrobloque
aquella que proporcione la mejor opcin. Generalmente, las decisiones no son evidentes y deben
probarse varias posibilidades antes de llegar a una decisin. Las matrices de cuantificacin utilizadas
en el caso de realizar codificacin mediante prediccin tienen un paso de cuantificacin uniforme para
todos los coeficientes. Esto es debido a que el contenido frecuencial de las seales de error no muestra
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
16 16
ninguna preferencia para concentrar su energa en unas frecuencias particulares y en principio todos
los coeficientes tienen la misma importancia en la reconstruccin de las imgenes. En la figura 4.70 se
muestra la matriz de cuantificacin por defecto que se utiliza en la codificacin inter-trama.

Insistimos de nuevo en que la complejidad del MPEG es asimtrica. Las decisiones que debe tomar el
codificador sobre cmo se realiza la compresin de un determinado macrobloque son muy complejas
e involucran un gran nmero de parmetros, pero todas estas decisiones se proporcionan al
decodificador a travs del formato de trama de la seal. El decodificador nicamente requiere aplicar
de forma sistemtica los procedimientos inversos a los que ha decido utilizar el decodificador.
Adems, como el MPEG no establece los procedimientos mediante los que deben tomarse estas
decisiones, es posible que existan codificadores que puedan obtener una mayor calidad de imagen
utilizando una tasa de bits inferior a otros codificadores.

4.9.11 Detalles sobre la codificacin de las imgenes del tipo B
Las imgenes del tipo B son las ms complejas de codificar, debido a que requieren un mayor nmero
de decisiones para determinar que tipo de compensacin de movimiento se aplica: forward, backward
o interpolacin bidireccional. En cualquier caso, deben estimarse dos posibles vectores de movimiento
que se codificarn o no en funcin de los resultados y el anlisis de las imgenes realizado por el
codificador. Los vectores de movimiento se codifican de forma diferencial reinicializando el vector
anterior a cero cada vez que se inicia un slice o que un macrobloque se codifica como intra-trama.

Existen hasta 12 posibles tipos de macrobloques que, al igual que en las imgenes P, se denotan
mediante sufijos y prefijos. La notacin empleada es la misma que la de los macrobloques para
imgenes P, con la salvedad de que aparecen tres nuevos sufijos que corresponden con los
macrobloques que utilizan interpolacin bidireccional (sufijo -i), los macrobloques con compensacin
de movimiento forward (sufijo -f) y los que usan compensacin de movimiento backward (sufijo b).
Los posibles tipos de macrobloques son:

pred-i: Se usa compensacin de movimiento con interpolacin bidireccional. El error
resultante en todos los bloques es suficientemente pequeo y no se codifica.
pred-ic: Igual que el caso anterior pero ahora, al menos uno de los bloques tiene un error
significativo, que deber ser codificado.
pred-b: Se usa compensacin de movimiento backward. El error resultante no se codifica.
pred-bc: Igual que el caso anterior, pero ahora se codifica el error de al menos uno de los
bloques.
pred-f: Se usa compensacin de movimiento forward para predecir el macrobloque y no
resulta necesario codificar los errores.
pred-fc: En este caso se emplea la compensacin de movimiento forward y es necesario
codificar al menos uno de los errores.
intra-d: Codificacin intra-trama del macrobloque utilizando el cuantificador por defecto.
pred-icq: Igual que el pre-ic pero indicando un cambio de escala en el cuantificador.
pred-fcq: Idem que el caso anterior, pero para compensacin de movimiento forward.
pred-bcq: Igual que el caso anterior, pero con compensacin de movimiento backward.
intra-q: Codificacin intra-trama proporcionando la informacin de un cambio de escala en
el cuantificador.
skipped: No es necesario codificar este macrobloque y puede aproximarse por el de la imagen
de referencia con un vector de movimiento nulo.

En la figura 4.71 se representa un posible diagrama lgico que puede utilizar el codificador para la
toma de decisiones respecto a la clasificacin del bloque en uno de los tipos anteriores. El algoritmo
de decisin es slo una posible alternativa, puesto que, como ya sabemos, el MPEG no establece los
criterios de decisin ni los procedimientos de estimacin. La primera decisin que se toma es el tipo
de compensacin de movimiento que resulta ms rentable utilizar. Para ello deben estimarse los
vectores de movimiento forward y backward y evaluar el error que se comete cuando se predice el
bloque utilizando compensacin de movimiento forward, backward o bidireccional. Normalmente, la
decisin sobre la compensacin ptima se toma basndose en el valor medio de los errores de
prediccin elevados al cuadrado. Aquella compensacin que produzca un error cuadrtico medio
mnimo es la que tomaremos como ptima. Otra posibilidad consiste en utilizar la suma de los valores
absolutos del error de prediccin en todos los pxeles del macrobloque y optar por la compensacin
que obtenga un mnimo en esta medida.

Fig. 4.71 Algoritmo de decisiones para la clasificacin del macrobloque

La siguiente decisin consiste en determinar si se aplicar una codificacin intra-trama o una
codificacin inter-trama. Los resultados obtenidos en la etapa anterior pueden proporcionar una
valiosa ayuda en esta decisin. Si las magnitudes de los errores cuadrticos o absolutos del error de
prediccin han resultado muy grandes, probablemente no resultar rentable codificar el macrobloque
utilizando prediccin, por lo que puede resultar aconsejable codificarlo con procedimientos intra-
Macrobloque
Compensacin forward (A)
Compensacin backward (A)
Compensacin bidireccional (A)
A
Inter-trama
Intra-trama
No codificado
Codificado
Cambio Escala
No cambio escala
Pred-(f/b/i)cq
Pred-(f/b/i)c
Skipped o Pred-(f/b/i)
Cambio Escala
No cambio escala
Intra-q
Intra-d
Macrobloque
Compensacin forward (A)
Compensacin backward (A)
Compensacin bidireccional (A)
A
Inter-trama
Intra-trama
No codificado
Codificado
Cambio Escala
No cambio escala
Pred-(f/b/i)cq
Pred-(f/b/i)c
Skipped o Pred-(f/b/i)
Cambio Escala
No cambio escala
Intra-q
Intra-d
trama convencionales. En cambio, si los errores son muy pequeos, significa que la prediccin es
correcta y es recomendable utilizar la tcnica de prediccin elegida en el primer apartado.

En el supuesto de que la decisin sea utilizar una codificacin inter-trama, el codificador debe decidir,
seguramente tambin en funcin del error obtenido, si es necesario codificar el error obtenido en el
macrobloque o es suficiente con que en el receptor se reconstruya el macrobloque utilizando la misma
informacin de que ya se dispone en una imagen de referencia. Finalmente, cuando es necesario
enviar alguna informacin relativa a los errores de prediccin o a la codificacin intra-trama del
macrobloque deber decidirse si se sigue utilizando la misma escala del cuantificador que en los
bloques anteriores o resulta aconsejable realizar un cambio de escala. La decisin del cambio de
escala suele venir determinada por la tasa de bits que estamos obteniendo en cada momento.

4.9.12 Control de la tasa de bits
Una de las caractersticas implcitas al MPEG es que la tasa de bits con el que se codifica una
secuencia de bits depende no slo de los parmetros propios del codificador, sino del contenido de las
imgenes. Hemos visto que cuando las imgenes contienen abundante movimiento y objetos pequeos
el nmero de bits necesario para codificarlas con una calidad predeterminada es muy superior al que
se requiere cuando se trabaja con imgenes casi-estacionarias y fcilmente predecibles. Esto significa
que si deseamos utilizar este sistema de codificacin en un canal de datos con velocidad de
transmisin constante, deberemos ir adaptando los parmetros del codificador en funcin del
contenido de las imgenes. Anlogamente, si el codificador debe trabajar en un canal con tasas de
transmisin variables, ser necesario ajustar dinmicamente sus parmetros hasta obtener los flujos de
transmisin deseados.

La forma bsica para controlar el flujo de datos consiste en modificar la escala del cuantificador. Para
ello, el codificador suele disponer de un modelo del buffer del decodificador que va actualizando a
medida que se van codificando nuevos fotogramas (entrando los bits correspondientes a estos
fotogramas en el buffer) y se van decodificando las imgenes (extrayendo los bits de las imgenes
decodificadas). El codificador informa del tamao del buffer de memoria que requiere el
decodificador mediante una informacin situada en la cabecera de la secuencia MPEG y deber
realizar la codificacin de la secuencia garantizando que no se produce rebosamiento del buffer (el
decodificador no podra almacenar los nuevos datos recibidos) ni que queda temporalmente vaco (no
podran decodificarse nuevas imgenes).

Cuando se detecta que por las caractersticas de la secuencia de vdeo el buffer est excesivamente
lleno, es habitual reducir los pasos del cuantificador realizando aproximaciones ms toscas del error
de prediccin o de los macrobloques que se codifican en modo intra-trama. Con ello, se reduce la tasa
de bits de la secuencia al coste de bajar la calidad de la seal de vdeo. La modificacin del paso de
cuantificacin no es la nica estrategia posible para controlar la velocidad del tren de bits. Tambin es
posible realizar el control introduciendo cambios en los algoritmos de decisin y clasificacin de
macrobloques. As, en el supuesto de que el estado del buffer del decodificador est excesivamente
lleno, podramos decidir no contemplar la posibilidad de codificar macrobloques del tipo intra-trama
en las imgenes B o incluso no utilizar bits adicionales para codificar los macrobloques de estas
imgenes y aproximarlos siempre por los valores predichos. En general, el control de la tasa de bits a
este nivel del algoritmo de decisin es mucho menos directa que a travs del paso de cuantificacin y
slo se emplea en casos en los que el desbordamiento del buffer es inminente. En la radiodifusin de
seales de televisin es habitual asignar tasas de codificacin distintas a los diferentes programas en
funcin del contenido de los mismos. As, los noticiarios o programas de entrevistas, en los que existe
poco movimiento de las imgenes, suelen tener asignada una menor tasa de bits que los programas de
deportes. La plataforma que gestiona el servicio se encarga de asignar las tasas de codificacin a cada
programa en funcin de los contenidos, repartiendo el ancho de banda del canal entre los distintos
programas.

4.9.13 Tratamiento de imgenes entrelazadas en el MPEG-2
Las imgenes entrelazadas ofrecen ciertos problemas adicionales en la compresin de vdeo. El
problema bsico es que si el formato entrelazado procede de una cmara de vdeo, cada campo
corresponde a instantes de tiempo distintos, por lo que los objetos que se desplazan en el sentido
horizontal pueden aparecer en distintas posiciones en cada uno de los campos. Esto provoca que
aparezca un efecto de serrado entre las lneas pares e impares de un mismo objeto que reduce la
correlacin existente entre las lneas adyacentes. En televisin analgica convencional este efecto es
tolerado por el sistema visual humano, ya que slo se produce de forma significativa en los objetos
que tienen un movimiento considerable dentro de la imagen. La resolucin espacial del ojo disminuye
cuando aumenta el movimiento de los objetos, por lo que este problema puede pasar inadvertido
cuando se presenta la secuencia de vdeo en tiempo real. No obstante, si pudiramos detener la imagen
analgica, mostrando los dos campos simultneamente, observaramos todos estos problemas
existentes en la imagen.

Debe mencionarse que cuando el material procede de la conversin de una pelcula cinematogrfica a
vdeo entrelazado, no se produce este problema. En este caso, los conversores de pelcula a vdeo
(telecinemas) parten de un nico fotograma para obtener los dos campos, de forma que ambos
corresponden al mismo instante de tiempo.

En la figura 4.72 se muestra visualmente el problema del entrelazado en una imagen. La imagen ha
sido obtenida con un movimiento horizontal de la cmara y se representan los dos campos
superpuestos. La figura muestra tambin las imgenes obtenidas para cada uno de los campos por
separado donde podemos observar que la correlacin entre lneas adyacentes es ahora muy alta.

El problema del entrelazado en las tcnicas de compresin de imagen es evidente puesto que la
correlacin entre las lneas sucesivas puede disminuir apreciablemente, resultando en imgenes ms
complejas de codificar tanto en modo intra-trama como inter-trama. Recordemos que en la
codificacin intra-trama, la compresin se basaba en extraer la redundancia espacial existente en la
imagen y que esta redundancia se reduce cuando existen diferencias considerables entre pxeles que
estn prximos.

El MPEG-1 no considera un tratamiento especfico para las imgenes entrelazadas, pues se supone
que el vdeo o material audiovisual del que se parte ha sido tratado previamente para poder realizar
una codificacin progresiva. Tngase en cuenta que los tamaos de imagen ms habituales en MPEG-
1 son de 352x288 pxeles, lo que significa que basta con muestrear uno solo de los campos (288
lneas) para obtener una imagen o frame completo. En cambio, el MPEG-2 debe ser capaz de tratar
con resoluciones de imagen de calidad broadcasting, por lo que deberemos ser capaces de tratar con
material previamente entrelazado. Por ello, en el MPEG-2 se definen algunos modos adicionales que
permiten tratar este tipo de material con el objeto de lograr mejores factores de compresin que los
que se obtendran considerando los dos campos como una nica imagen. Es importante insistir que los
modos entrelazados del MPEG-2 se han definido especficamente para poder tratar con este tipo de
formatos y que slo tienen sentido cuando se procesan imgenes adquiridas con este tipo de
exploracin. Si se dispone de un formato de partida no entrelazado (p.ej. el cine), debern aplicarse las
tcnicas convencionales, por cuanto, en general, pueden conseguir un factor de compresin ms
elevado.

Fig. 4.72 Ejemplo de imgenes entrelazadas en un movimiento de cmara horizontal

El tratamiento de imgenes entrelazadas en el MPEG-2 afecta tanto a la definicin de los
macrobloques y la definicin de los bloques que intervienen en la transformada coseno, como a la
exploracin en zig-zag de los coeficientes transformados y a los procedimientos de estimacin de
movimiento. Examinaremos todos estos aspectos detenidamente.

En la codificacin de una imagen, la seleccin de los modos entrelazados o de los modos progresivos
convencionales puede realizarse en cada macrobloque de forma individual. Con ello podemos obtener
los beneficios de un mayor factor de compresin mediante el uso de tcnicas progresivas en aquellas
zonas de la imagen que permanecen estacionarias, mientras que en regiones con elevado movimiento
horizontal podemos utilizar los modos entrelazados.

Un macrobloque convencional de 16x16 pxeles se descompone en 4 bloques de 8x8 pxeles tomando
los pxeles adyacentes tal y como se muestra en la figura 4.73. Un macrobloque entrelazado tambin
Imagen
entrelazada
Movimiento
horizontal de
la cmara
Lneas pares
Campo A
Lneas impares
Campo B
Imagen
entrelazada
Movimiento
horizontal de
la cmara
Lneas pares
Campo A
Lneas impares
Campo B
se descomponen en 4 bloques de 8x8 pxeles, pero ahora los bloques se toman utilizando lneas
alternadas. Es decir, en un macrobloque entrelazado, los bloques estn formados por lneas que
corresponden siempre al mismo campo mientras que en un macrobloque convencional las lneas se
van alternando entre los dos campos. La figura 4.74 muestra claramente las diferencias partiendo de la
imagen entrelazada que habamos utilizado en la figura 4.72. En este ejemplo se ha utilizado un
macrobloque que representa toda la imagen con objeto de visualizar con ms claridad como
deformadas las imgenes cuando los bloques se dividen por campos, con una menor resolucin
espacial en el sentido vertical.

Fig. 4.73 Divisin en bloques de un macrobloque para imgenes progresivas y entrelazadas

Cuando a un bloque del tipo entrelazado le aplicamos la transformada coseno debemos tener en cuenta
las diferentes resoluciones espaciales en cada uno de los sentidos. La subimagen ha sido
submuestreada en el eje vertical por lo que deberemos esperar un mayor contenido frecuencial en esta
direccin. Esta circunstancia resulta evidente si tenemos en cuenta, que por el hecho de aumentar el
espacio entre las muestras, los niveles de los pxeles cambiarn de forma ms rpida y no estarn tan
correlados en la direccin vertical. Estas consideraciones deben ser tenidas en cuenta al ordenar los
coeficientes transformados. La ordenacin en zigzag convencional presupone que las componentes
frecuenciales son iguales en los dos ejes. Con este nuevo muestreo la situacin ha cambiado y las
frecuencias verticales son ms importantes que las horizontales. Por ello es conveniente redefinir la
ordenacin de los coeficientes de forma que los primeros coeficientes sigan siendo los ms
significativos. La nueva ordenacin se representa en la figura 4.75 y, como puede comprobarse, los
coeficientes verticales y los horizontales van alternndose, aunque primando los primeros en las
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
1 2 3 4 5 6 7 8 9 10111213141516
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1 2 3 4 5 6 7 8 9 10111213141516
1
3
5
7
9
11
13
8
2
4
6
8
10
12
14
16
Divisin en bloques
para un macrobloque
progresivo
Divisin en bloques
para un macrobloque
entrelazado
MACROBLOQUE
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
1 2 3 4 5 6 7 8 9 10111213141516
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1 2 3 4 5 6 7 8 9 10111213141516
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1 2 3 4 5 6 7 8 9 10111213141516
1
3
5
7
9
11
13
8
2
4
6
8
10
12
14
16
1 2 3 4 5 6 7 8 9 10111213141516
1
3
5
7
9
11
13
8
2
4
6
8
10
12
14
16
Divisin en bloques
para un macrobloque
progresivo
Divisin en bloques
para un macrobloque
entrelazado
MACROBLOQUE
primeras posiciones de la exploracin. Esta curiosa forma de explorar los coeficientes suele conocerse
en el entorno MPEG con el nombre de Yeltsin Walk.

Fig. 4.74 Descomposicin en bloques en el modo progresivo y el entrelazado

Fig. 4.75 Orden de exploracin de los coeficientes transformados en bloques entrelazados

Por lo que respecta a la compensacin de movimiento, tambin puede realizarse mediante campos
separados o basndonos en la imagen global. La forma ms evidente de tratar con campos separados
consiste en descomponer las imgenes de referencia en dos campos A y B y utilizar el campo A para
predecir la parte del macrobloque del campo A y viceversa. En este caso, las predicciones son
Descomposicin de un macrobloque
progresivo en 4 bloques
entrelazado en 4 bloques
progresivo en 4 bloques
entrelazado en 4 bloques
independientes para cada uno de los campos que se tratan siempre por separado. No obstante, el
MPEG-2 tambin admite otros tipos de prediccin o compensacin de movimiento, entre los que
destacan la prediccin de movimiento basada en frames (convencional) y la denominada
compensacin de movimiento 16x8, donde para cada macrobloque se determinan dos vectores de
movimiento independientes que se determinan a partir de los dos campos de las imgenes de
referencia. Existe una prediccin alternativa denominada dual frame, en la que los vectores de
movimiento se estiman tomando como referencia el promedio de los dos campos. Una vez
determinado el vector de movimiento se realiza del vector de movimiento del campo A y del campo B
suponiendo un modelo de movimiento lineal de la imagen. Esta estrategia ofrece excelentes
resultados, pero slo puede usarse cuando la secuencia MPEG slo se compone de imgenes P e I.

Todas las observaciones relativas al tratamiento de imgenes entrelazadas que hemos descrito se
refieren tan slo a la componente de luminancia. Las componentes de color siguen un tratamiento
parecido pero su organizacin concreta depende del tipo de formato de la seal de partida. As, en un
formato como el 4:2:2 en que las componentes de croma slo estn submuestradas en la direccin
horizontal, podemos definir las componentes de croma del macrobloque en funcin del campo par o
impar de la misma forma en que se define para las componentes. En el formato 4:2:0, las seales
diferencia de color estn tambin submuestreadas en el sentido vertical, por lo que, en cada campo,
cada dos lneas de luminancia debern compartir una misma informacin de croma

4.9.14 Restriccin de parmetros, niveles y perfiles
Los algoritmos MPEG proporcionan una gran flexibilidad en lo que se refiere a tamaos de imagen
que pueden tratarse, frecuencias de muestreo de imagen, complejidad de los algoritmos, tasas de bits y
anchos de banda del flujo de seal, etc. Todo ello indica que no tiene sentido que una aplicacin
sencilla deba soportar los costes de procesado y tratamiento de seal que slo se requieren para tratar
las imgenes ms complejas. Por ello, se definen un conjunto de grupos de compatibilidad distintos
que deben cumplir los distintos codificadores y decodificadores en funcin de la aplicacin a la que
estn orientados.

En el MPEG-1 nicamente se define un posible nivel de compatibilidad, que se conoce con el nombre
genrico de restriccin de parmetros del MPEG-1. Todos los codificadores y decodificadores para
aplicaciones multimedia dentro del flujo de datos de 1 a 3 Mbps deben tener este nivel de
compatibilidad (el orden de magnitud para el que fue optimizado el MPEG-1). El estndar genrico
admite sistemas mucho ms complejos, pero prcticamente todos los productos comerciales se
restringen a las caractersticas proporcionadas por este nivel. Las restricciones de parmetros del
MPEG-1 son:

a) El nmero de pxeles horizontales de la imagen debe poder llegar hasta 720.
b) El nmero de pxeles verticales debe poder llegar hasta que 576.
c) El nmero de macrobloques por segundo debe ser menor o igual que 9900 (396x25,
330x30).
d) El nmero de macrobloques por imagen debe poder llegar hasta 396.
e) La frecuencia de imagen debe poder llegar hasta 30 imgenes por segundo.
f) La tasa de bits debe poder llegar hasta 1,86 Mbps.
g) El tamao del buffer del decodificador debe poder almacenar un mnimo de 376.832 bits.

Las dos primeras restricciones son un tanto confusas, pues parecen indicar que, en este nivel de
compatibilidad, el MPEG-1 puede admitir resoluciones de imagen de calidad de radiodifusin. El
objetivo de estas restricciones es que puedan admitirse codificadores con relaciones de aspecto muy
rectangulares (panormicas o alargadas). No es necesario que se cumplan las dos necesariamente. Las
restricciones ms importantes son la c) y la d), que establecen el nmero de macrobloques por
segundo y el nmero de macrobloques por imagen que necesariamente deben proporcionarse. Segn
estos requisitos, cualquier codificador o decodificar que pretenda pasar este nivel de compatibilidad
deber ser capaz de codificar o decodificar imgenes de resolucin SIF.

El mayor mbito de aplicaciones a las que se dirige el MPEG-2 hace necesario que se definan varios
grados de compatibilidad distintos. Los distintos grados compatibilidad se estructuran en dos
parmetros que se denominan niveles y perfiles. El nivel hace referencia, fundamentalmente, al
tamao de las imgenes, mientras que el perfil establece las restricciones sobre los algoritmos de
compresin. Estn definidos un total de 4 niveles y 5 perfiles. Los posibles grados de compatibilidad
se obtienen combinando un nivel y un perfil, aunque no todas las combinaciones son posibles. En el
grfico de la figura 4.76 se muestran las distintas opciones definidas en este momento.

Fig. 4.76 Niveles y perfiles definidos en MPEG-2

Los distintos grados de compatibilidad se obtienen combinando un nivel y un perfil. As, con el perfil
principal y el nivel principal se obtiene el MP&ML (Main Profile, Main Level) que en este caso
concreto corresponde al estndar para la radiodifusin de televisin digital elegido por el DVB.

Los diferentes niveles tienen las siguientes caractersticas:

a) Low. Se utiliza para imgenes de aproximadamente un cuarto de cuadrante del ITU-601,
es decir, imgenes del tipo SIF como las utilizadas en el MPEG-1. La tasa mxima de
bits es de 4 Mbps.
NIVELES
High
High-1440
Main
Low
Simple Main
SNR
scalable
Spatial
scalable
High
PERFILES
SP&ML
MP&LL
MP&ML
MP&H14L
MP&HL
SNRP&LL
SNRP&ML
SSP&H14L
HP&ML
HP&H14L
HP&HL
NIVELES
High
High-1440
Main
Low
Simple Main
SNR
scalable
Spatial
scalable
High
PERFILES
SP&ML
MP&LL
MP&ML
MP&H14L
MP&HL
SNRP&LL
SNRP&ML
SSP&H14L
HP&ML
HP&H14L
HP&HL
b) Main. Se utiliza para imgenes del tipo ITU 601, es decir, 720x576 para 25 imgenes por
segundo y 720x480 para 30 Hz. La tasa de codificacin debe mantenerse por debajo de
los 15 Mbps.
c) High-1440. Este nivel est pensado para soportar imgenes de TV de alta definicin
(HDTV). Los tamaos de imagen son de 1440x1080 en 30 imgenes por segundo y de
1440x1152 en formatos de 25 imgenes por segundo. La tasa de bits mxima es de 60
Mbps que pueden aumentar hasta 80 Mbps en el perfil High.
d) High. Est orientado a formatos de televisin de alta definicin panormicos. Los
tamaos de las imgenes son de 1920x1080x30 fps y de 1920x1152x25fps. El nmero
mximo de bits est limitado a 80 Mbps que pueden aumentar hasta los 100 Mbps si se
usa el perfil High.

Los perfiles estn definidos de acuerdo con las siguientes caractersticas:

a) Simple. No requieren el uso de imgenes del tipo B. Esto permite simplificar tanto el
codificador como el decodificador al coste de una mayor tasa de bits. El decodificador
puede funcionar con una memoria de slo 1 Mbit.
b) Main. Es el mejor compromiso entre tasa de compresin y coste. Utiliza los tres tipos de
imgenes (I, P y B). Este es el nivel ms utilizado actualmente y al que hemos
restringido el material proporcionado en este captulo.
c) SNR scalable. Se trata de una transmisin jerrquica que en principio est pensada para
usos futuros. La secuencia se transmite en dos flujos de datos. Uno de ellos (base layer)
proporciona imgenes de calidad aceptable al receptor mientras que la segunda
(enhanced layer) proporciona una resolucin adicional sobre los coeficientes de la DCT,
de forma que cuando ambas secuencias de bits son decodificadas simultneamente se
obtienen unos resultados de reconstruccin excelentes. Este tipo de escalabilidad est
pensado para que decodificadores con distintas complejidades y costes puedan acceder a
la misma secuencia.
d) Spatial scalable. La idea de fondo es similar a la de la escalabilidad en SNR, aunque
ahora una de las secuencias aporta informacin sobre la secuencia de vdeo con una
resolucin espacial convencional, mientras que la otra aporta un incremento de la
resolucin.
e) High. Est orientado a la radiodifusin de emisiones de televisin digital de alta
definicin tanto en el formato 4:2:0 como en el 4:2:2. Admite tanto la escalabilidad
espacial como la de SNR junto con otros tipos de escalabilidad en la velocidad de
transmisin de las secuencias. En principio, este perfil est pensado para hacer
compatibles las difusiones de televisin de alta definicin en distintos tipos de
decodificadores, tanto de definicin convencional como de alta definicin. La
escalabilidad en velocidad de transmisin puede utilizarse para proporcionar un nivel
bsico de recepcin en las zonas donde las seales se reciban con dificultad y con una
calidad mejorada en reas con mejores condiciones de recepcin. Esta ltima
caracterstica puede ser de gran inters en la transmisin de televisin digital terrestre.

Los distintos perfiles tienen un nivel de compatibilidad ascendente, es decir, un decodificador de un
determinado perfil debe ser capaz de decodificar el perfil que le corresponde y todos los perfiles de
menor complejidad. La combinacin que se utiliza en la mayora de aplicaciones actuales es el
MP@ML (Main Profile, Main Level), que permite la codificacin de imgenes entrelazadas en el
formato 4:2:0, utilizando tasas de bits que en funcin de los contenidos y la calidad de las imgenes
pueden estar situadas entre los 4 Mbps y los 9 Mbps. El MP@ML ha sido elegido por el DVB como
sistema bsico para la radiodifusin de seales de televisin digital. Tambin es, con algunas
diferencias de parmetros mnimas, el grado de compatibilidad que se emplea en el almacenamiento
de vdeo digital utilizado por el DVD-Vdeo.

4.10 Multiplexacin de secuencias MPEG
En los apartados anteriores hemos analizado los principios generales del proceso de compresin de la
secuencia de vdeo digital en una trama de datos digital. Hemos visto que la trama de vdeo bsica
tiene una estructura jerrquica en la que se van definiendo progresivamente los parmetros de la
secuencia de vdeo, del grupo de imgenes, de cada una de las imgenes, los macrobloques y los tipos
usados en la codificacin y finalmente se proporcionan los coeficientes transformados. Esta trama de
datos se conoce como la trama elemental (Elementary Stream - ES) y aporta toda la informacin
relativa a un programa de vdeo. La estructura bsica de una ES en el MPEG se representa de forma
muy simplificada en la figura 4.77.

Fig. 4.77 Diagrama simplificado de la Elementary Stream

La ES slo es el primer nivel de sealizacin entre el codificador y el decodificador. Contiene toda la
informacin relativa a cmo se ha realizado la codificacin del vdeo, pero carece de informacin
detallada de cmo sincronizar el vdeo con el audio y con los datos adicionales. Adems, la ES es una
trama de bits continua, que slo aporta informacin sobre las imgenes de un determinado programa y
que, por lo tanto, debe intercalarse con datos de audio (ES Audio, Elementary Stream Audio), datos de
usuario (ES Data, Elementary Stream Data) y, en el caso de radiodifusin digital, tambin deber
multiplexarse con otros programas. Toda la problemtica de intercalar y sincronizar audio, vdeo y
datos correspondientes a distintos programas en una nica trama de datos se considera en el estndar
MPEG-Systems y se conoce como el problema de la multiplexacin de tramas en MPEG. Las tramas
Ancho
Imagen
Altura
Imagen
Relacin
Aspecto
Tasa de
Bits
Tasa de
Frames
Header
Secuencia
Secuencia
Header
Secuencia
rSecuencia
Header
Secuencia
.......
Header
GOP
Frame
Header
Frame 1
Frame
Header
Frame
Header
Frame 2 .......
Frame
Header
Slice
Header
Macrobloques 1 N
Slice
Header
Macrobloques 1 N .......
Direccin Tipo
Escala
Cuantific.
Vectores
Movimiento
Bloques
Codificados
Bloque 1 Bloque 2 Bloque 3
Ancho
Imagen
Altura
Imagen
Relacin
Aspecto
Tasa de
Bits
Tasa de
Frames
Header
Secuencia
Secuencia
Header
Secuencia
rSecuencia
Header
Secuencia
.......
Header
GOP
Frame
Header
Frame 1
Frame
Header
Frame
Header
Frame 2 .......
Frame
Header
Slice
Header
Macrobloques 1 N
Slice
Header
Macrobloques 1 N .......
Direccin Tipo
Escala
Cuantific.
Vectores
Movimiento
Bloques
Codificados
Bloque 1 Bloque 2 Bloque 3
de datos que finalmente se obtienen estn organizadas en diferentes niveles que permiten que el
procesador del receptor pueda identificar los datos de audio y de vdeo asociados a los distintos
programas y decodificarlos. En este apartado veremos los conceptos generales de la multiplexacin de
secuencias MPEG. Como siempre, la presentacin slo pretende proporcionar una idea general de la
filosofa utilizada, dejando los detalles para estudios ms avanzados que pueden encontrarse en los
textos proporcionados en la bibliografa o en el propio estndar MPEG.

Existen dos posibles alternativas para construir la secuencia MPEG multiplexada, conocidas como la
trama de programa (Program Stream) y la trama de transporte (Transport Stream). Las dos
posibilidades permiten multiplexar video, audio y datos sincronizando los decodificadores de las
distintas fuentes. Las diferencias entre ambas alternativas se deben a que la trama de programa est
orientada a aplicaciones de almacenamiento de vdeo en las que se producen pocos errores de lectura,
mientras que la trama de transporte se orienta a sistemas de comunicaciones con lo que las
condiciones de recepcin de la trama pueden llegar a variar considerablemente, produciendo rfagas
de errores significativas. La trama de programa est compuesta por paquetes de gran longitud de datos
mientras que en la de transporte los paquetes son de longitud pequea para poder realizar un control
de errores ms eficaz. En el MPEG-1 slo est definida la trama de programa, ya que todas las
aplicaciones son para el almacenamiento de vdeo en CD-ROM o en disco duro. El MPEG-2 dispone
de las dos opciones, la trama de programa se utiliza en aplicaciones como el DVD-Vdeo, mientras
que la trama de transporte se usa en la radiodifusin de seales de televisin. Debemos sealar que en
ninguno de los dos casos se incluyen cdigos de control o correccin de errores. La inclusin de estos
cdigos se realiza en otras capas del sistema de comunicaciones y no estn reguladas por el MPEG.
En televisin digital, la inclusin de redundancia para la proteccin de errores est especificada por el
propio sistema DVB del que hablaremos ms adelante.

4.10.1 Estructura del paquete bsico (Packetized Elementary Stream)

Fig. 4.78 Estructura simplificada de la Packetized Elementary Stream

Antes de llegar a la trama de programa o de transporte la ES, se agrupa en paquetes elementales que
convierten el flujo continuo de informacin de la ES en bloques discretos, que permiten un mejor
control de transmisin o almacenamiento. La agrupacin en paquetes de la ES se denomina PES
(Packetized Elementary Stream) y se define para cada uno de los posibles tipos de seal, es decir,
vdeo, audio y datos. La estructura simplificada de una PES se representa en la figura 4.78 y se
compone de una cabecera que contiene un cdigo de inicio de paquete y un cdigo que identifica si la
informacin del paquete corresponde a seal de vdeo, audio o datos. Los identificadores PTS y DTS
son opcionales y por lo general no se encuentran en todos los paquetes. No obstante, son
Codigo
Inicio
Identif
trama
PTS DTS Datos
Parmetros opcionales
Slo deben enviarse en algunos paquetes
Codigo
Inicio
Identif
trama
PTS DTS Datos
Parmetros opcionales
Slo deben enviarse en algunos paquetes
extremadamente importantes puesto que se utilizan como unidades de sincronizacin entre la
informacin de vdeo y de audio. Sin ellos, sera imposible obtener un buen sincronismo entre el
sonido y movimiento de los labios de la fuente de vdeo.

El PTS es una referencia temporal del orden de presentacin de los fotogramas (Presentation Time
Stamp) mientras que el DTS es una referencia del orden de decodificacin. Cuando no se transmiten
imgenes del tipo B o cuando se trata de PES de audio o datos, ambos ndices coinciden. La
informacin que contienen es un nmero entero de 33 bits que indica el estado de un contador de
pulsos de reloj del codificador. El reloj del codificador es de 27 MHz y se divide por un factor de 300
para atacar un contador binario que reinicia la cuenta a cero cuando se desborda. Los ndices enviados
en el PTS y el DTS son los valores de este contador.

Los valores del PTS y del DTS no requieren enviarse en cada paquete por cuanto existe bastante
redundancia en la recepcin de las imgenes debido que el receptor sabe que la diferencia de tiempos
entre todas ellas es constante (el periodo de imagen). Cuando los PES deben incorporarse en una
trama de programa, los PTS y DTS deben de enviarse con un periodo no superior a los 0,7 segundos.
En cambio, cuando se trata de una trama de transporte, la tasa de transmisin no puede ser inferior a
los 0,1 s.

El esquema de la figura 4.78 es slo una simplificacin de la estructura de un paquete PES. En la
figura 4.79 se muestra el contenido algo ms detallado con los diferentes campos opcionales. La
figura corresponde al contenido de los paquetes PES para el MPEG-2, que vara ligeramente respecto
al MPEG-1. El cdigo de inicio es una palabra fija de 24 bits que toma el valor 00 00 01 en
hexadecimal. La siguiente palabra de 8 bits es un identificador de la trama. Los 4 primeros bits se
utilizan para indicar si se trata de una trama de vdeo, audio o datos. Los 4 bits menos significativos
asignan un nmero entero para identificar cada una de las secuencias.

Fig. 4.79 Detalle del contenido de una trama PES para MPEG-2
Codigo
Inicio
Identif
trama
Long.
paquete
Cabec.
opcional
Bits
relleno
Datos
Indicador
Scramb.
Prioridad
Indicador
Alinea dat
Copyright
Original o
copia
7 flags
Long
Cab. PES
Campos
Opcionales
PTS/DTS. ESCR ES rate
DSM
modo
Copy
info
PES
CRC
PES
extension
5 flags
Campos
Opcionales
PES
Privat data
Pack
header
Program
Seq. count
P-STD
buffer
PES
extension
Codigo
Inicio
Identif
trama
Long.
paquete
Cabec.
opcional
Bits
relleno
Datos
Indicador
Scramb.
Prioridad
Indicador
Alinea dat
Copyright
Original o
copia
7 flags
Long
Cab. PES
Campos
Opcionales
PTS/DTS. ESCR ES rate
DSM
modo
Copy
info
PES
CRC
PES
extension
5 flags
Campos
Opcionales
PES
Privat data
Pack
header
Program
Seq. count
P-STD
buffer
PES
extension
El tamao total del paquete es variable y depende de la aplicacin a la que se destina. La longitud del
paquete se indica en la cabecera y puede llegar hasta un mximo de 64 kBytes (16 bits que indican la
longitud en bytes del paquete). A continuacin se enva una cabecera opcional que contiene los
cdigos PTS y DTS, a los que ya hemos hecho referencia. Esta cabecera tambin contiene otro tipo de
datos, como el indicativo del acceso condicional, la prioridad de la trama, el copyright, contadores de
secuencia del paquete, etc. El estndar tambin prev la posibilidad de aadir hasta un total de 16
bytes de relleno (todos los bytes toman el valor hexadecimal FF). Estos bytes pueden usarse para que
la longitud total del paquete sea un mltiplo exacto de los sectores fsicos del soporte de
almacenamiento.

4.10.2 La trama de programa (Program Stream)
Esencialmente, la trama de programa se compone de una multiplexacin de varias PES que se
estructuran en unos nuevos paquetes (packs) de nivel superior. La figura 4.80 muestra el contenido
bsico de un pack de la trama de programa. La cabecera del pack contiene una palabra identificativa
del inicio de cabecera, la tasa de multiplexacin y una referencia del reloj del sistema. Discutiremos el
procedimiento con el que se recupera la referencia del reloj del sistema cuando consideremos la trama
de transporte, ya que en ambos casos la idea es la misma. La cabecera del sistema (system header)
proporciona informacin general sobre el nmero y tipo de secuencias PES que componen el paquete.
La finalizacin del paquete se indica con un cdigo especfico.

Fig. 4.80 Diagrama bsico de la estructura de la trama de programa

4.10.3 La trama de transporte
La multiplexacin de varias seales y programas para la radiodifusin de programas de televisin
digital exige que los paquetes en los que se estructura la informacin sean de corta duracin. Con ello
se facilita la tarea de insertar cdigos de proteccin de errores estrictamente necesarios debido a que
las tasas de error tpicas con las que se trabaja son del orden de 10
-4
o superiores. Los paquetes
Pack
Header
Sistem
Header
PES
packet
PES
packet
PES
packet
......
PES
packet
End
Code
Pack
Header
Sistem
Header
Pack 1
Pack 2
VIDEO AUDIO
AUDIO
Cdigo Inicio
Tasa Multiplex
Ref. Reloj sistema
Informacin Sistema
Identificacin tipo PES
Nmero de PES, etc
Cada PES puede contener informacin de
vdeo, audio o datos. El orden y el
programa al que pertenecen no est
preestablecido.
Pack
Header
Sistem
Header
PES
packet
PES
packet
PES
packet
......
PES
packet
End
Code
Pack
Header
Sistem
Header
Pack 1
Pack 2
VIDEO AUDIO
AUDIO
Cdigo Inicio
Tasa Multiplex
Ref. Reloj sistema
Informacin Sistema
Identificacin tipo PES
Nmero de PES, etc
Cada PES puede contener informacin de
vdeo, audio o datos. El orden y el
programa al que pertenecen no est
preestablecido.
utilizados en la trama de transporte son de una longitud fija de 188 bytes y contienen una cabecera y
un fragmento de datos de una trama PES. Es importante subrayar que aunque los paquetes de
transporte son ms cortos que las tramas PES (por ejemplo de 2048 bytes), se utilizan para transportar
toda la informacin de la PES de audio, vdeo y datos de varios programas.

Para aumentar la eficiencia de la transferencia de informacin pueden utilizarse dos tipos de cabecera.
La que se usa normalmente es de una longitud muy corta (32 bits), aunque puede extenderse
ocasionalmente en determinados paquetes para proporcionar informacin adicional. En el caso de
utilizar la cabecera extendida, se reduce la carga de datos PES del paquete, manteniendo siempre su
longitud total constante. La estructura bsica de los paquetes de la trama de transporte se ilustra en las
figuras 4.81 (estructura de cabecera ms datos) y 4.82 (informacin de cabecera).

Fig. 4.81 Estructura de los paquetes de transporte

Fig. 4.82 Detalle de la informacin de cabecera de los paquetes de transporte
Paquete Paquete Paquete Paquete
Paquetes de transporte
Cabecera datos
Cabecera
Extendida
datos
188 bytes
4 bytes
Paquete Paquete Paquete Paquete
Paquetes de transporte
Cabecera datos
Cabecera
Extendida
datos
188 bytes
4 bytes
Sinc
Byte
8
Error
Flag
1
Start
Flag
1
Priority
1
PID
13
SCR
2
Adapt
Control
2
Cont
4
Adapt
Field
2
Adapt. Field Length
Disc. Flag
Random Access
Elem. Str. Priority
Stuffing
PCR (48)
Transport private data
Otros
Sinc
Byte
8
Error
Flag
1
Start
Flag
1
Priority
1
PID
13
SCR
2
Adapt
Control
2
Cont
4
Adapt
Field
2
Adapt. Field Length
Disc. Flag
Random Access
Elem. Str. Priority
Stuffing
PCR (48)
Transport private data
Otros
El byte de inicio de paquete contiene el cdigo hexadecimal 47. El flag de error se activa cuando se ha
producido un error en las etapas previas. El flag de inicio se utiliza para indicar que este paquete
contiene el inicio de una trama PES. La prioridad de la trama de transporte nicamente admite los
valores alta y baja (1 bit). En la trama de transporte estn multiplexados los PES de varios programas
y para cada uno de ellos, los PES asociados al vdeo, audio y datos. El PID (Packet IDdentification
code) es un cdigo de 13 bits que se utiliza para identificar cada una de las secuencias PES que
componen la trama de transporte. Un demultiplexor deber examinar este cdigo en las cabeceras de
entrada y proporcionar al decodificador todos los paquetes que correspondan a la trama PES que se
pretende decodificar. Para ayudar al decodificador se incluye un cdigo de contador secuencial (cont)
de 4 bits que se incrementa para cada nuevo paquete con un mismo PID.

Esta filosofa de marcar el contenido de los paquetes permite que los multiplexadores trabajen de
forma estadstica, asignando un mayor o menor flujo de datos a cada canal en funcin de los
contenidos. Hemos visto que por la propia naturaleza de compresin del MPEG es posible que para
mantener la calidad estable sea necesario aumentar la tasa de bits en algunas secuencias con
movimiento elevado. Esto significa que es difcil mantener la tasa de bits en las tramas ES o las PES.
Un multiplexor estadstico puede examinar las necesidades de los distintos programas y asignar una
mayor frecuencia de paquetes a las PES que as lo requieran. Para mantener la trama de transporte con
un flujo de datos constante se suelen utilizar paquetes de relleno, que no contienen informacin til.
Los paquetes de relleno se identifican con el cdigo PID 8191 y son directamente descartados por el
demultiplexor cuando los identifica.

Cuando se utiliza la cabecera extendida, se proporcionan distintos tipos de informacin adicional
sobre la trama de transporte y las secuencias PES que la forman. Entre las distintas opciones
destacaremos el cdigo PCR (Program Clock Reference) y el Stuffing (Relleno). El relleno se utiliza
en los paquetes que se corresponden con el final de una trama PES. Hemos comentado que la trama
PES se transmite en varios paquetes del nivel de transporte por lo que, normalmente, el ltimo
fragmento de la PES no coincidir exactamente con el tamao de datos del paquete de transporte. Para
solventar este problema se utilizan los bits de relleno que sean necesarios hasta el paquete coincida
con el final de la trama PES. El siguiente paquete correspondiente a este mismo cdigo PID indicar
el inicio de un nuevo PES en uno de los bits de cabecera.

Por otra parte, al compartir varios programas en una misma trama, los codificadores no estarn
sincronizados, por lo que es importante proporcionar algn mecanismo de control que permita que el
receptor se sincronice con el procesador que esta codificando los datos correspondientes al programa
que tiene sintonizado. La sincrona entre ambos se establece mediante un cdigo binario de 48 bits
denominado PCR y que se corresponde al valor de un contador que est directamente conectado al
reloj de 27 MHz del codificador. El valor del contador se incrementa en cada ciclo de reloj y se
reinicializa a cero cada vez que llega al final de la cuenta. Este valor se va transmitiendo
peridicamente en los paquetes de transporte y es utilizado por el decodificador para sincronizarse con
los datos recibidos. El mecanismo de sincronizacin que se utiliza es parecido al de un PLL, pero
implementado de forma digital. El receptor dispone de un oscilador interno de 27 MHz que se
controla a travs de un VCO. El reloj interno activa un contador cuyo valor se compara con el valor
recibido en el paquete. La diferencia entre el contador interno y el valor recibido se utiliza para
controlar el VCO y poner en fase ambos subsistemas. Evidentemente, la precisin en la sincrona
entre ambos sistemas est limitada por el jitter y la estabilidad con la que se reciban los cdigos PCR.
4.10.4 Informacin especfica de programas (Program Specific I nformation -PSI)
Como varios programas comparten la misma trama de transporte, debe de proporcionarse algn
mecanismo que permita que el receptor pueda saber qu PES de vdeo, audio y datos estn asociadas a
cada uno de los programas. El cdigo de identificacin PID permite discriminar las distintas tramas
pero no identifica la asociacin entre ellas. Para solventar este problema se han incorporado las tramas
de informacin PSI (Program Specific Information) que se transmiten en los paquetes de transporte
con un cdigo PID igual a cero.

Cuando el receptor se conecta no conoce la distribucin de los programas en la trama de transporte y
debe esperar a recibir tramas con el cdigo de identificacin de PSI (PID = 0) con las que ser posible
construir una tabla de asignacin de programas (Program Asignation Table, PAT). La PAT se
transmite de forma peridica y contiene los cdigos PID en los que se encuentra el mapa de
informaciones para cada programa (Program Map Table, PMT). La estructura general es un tanto
compleja y se comprende mejor con el ejemplo de la figura 4.83.

La trama con el PID igual a cero informa que los canales asociados al programa 1 pueden encontrarse
en los paquetes que tengan un PID igual a 25, los asociados al programa 2 en los paquetes que tengan
un PID igual a 32 y as sucesivamente para todos los programas de la trama de transporte. Si el
usuario quiere decodificar el programa 2 deber esperar a recibir paquetes de transporte con el cdigo
de identificacin 32. En estos paquetes se proporciona la PMT que indica en que tramas pueden
encontrarse la PES de vdeo, audio y datos. En nuestro ejemplo, el programa nmero 2 tiene una PES
de vdeo, que se identifica con el PID 49; 4 PES de audio con los PID's 51, 55, 56 y 57 y una de datos
(PID=72). Las PES de audio pueden corresponder a transmisiones estereofnicas en dos idiomas
distintos.

Fig. 4.83 Tablas de informacin sobre referencias de programa

Adems de las tablas PAT y PMT descritas se envan, usando procedimientos parecidos, otros tipos de
informaciones auxiliares como la CAT (conditional access table) que define los parmetros y
PAT, (PID = 0)
Programa 0 16
Programa 1 25
Programa 2 32
Programa 3 12
....... ..
PES 1 Video 49
PES 2 Audio 51
PES 3 Audio 55
PES 4 Audio 56
PES 5 Audio 57
PES 6 Datos 72
PMT2, (PID = 32)
PES 1 Video 28
PES 2 Audio 42
PES 3 Audio 43
PES 4 Datos 47
PMT1, (PID = 25)
NIT
(PID=16)
PAT, (PID = 0)
Programa 0 16
Programa 1 25
Programa 2 32
Programa 3 12
....... ..
PES 1 Video 49
PES 2 Audio 51
PES 3 Audio 55
PES 4 Audio 56
PES 5 Audio 57
PES 6 Datos 72
PMT2, (PID = 32)
PES 1 Video 28
PES 2 Audio 42
PES 3 Audio 43
PES 4 Datos 47
PMT1, (PID = 25)
NIT
(PID=16)
condiciones para el acceso condicional. El identificador que se utiliza para transmitir esta informacin
es el PID 0x0001 y debe estar presente siempre que al menos uno de los programas de la trama de
transporte disponga de acceso condicional.

El estndar MPEG permite que se incorporen informaciones de programa y gestin cuyo contenido
puede establecerse en funcin de la aplicacin a la que se destina la trama de datos. As, el estndar de
transmisin de televisin digital DVB introduce algunas informaciones adicionales para gestionar la
configuracin automtica del receptor y para proporcionar informacin adicional a los usuarios sobre
los contenidos de la programacin, facilitando la navegacin a travs de los distintos programas que
componen la trama MPEG. Los contenidos de estas informaciones complementarias no son regulados
por el estndar MPEG sino por la aplicacin que los define. En el caso de la transmisin de seales de
televisin en formato digital se conocen con el nombre de tablas DVB-SI (service information) y son
definidas por el propio estndar DVB. Las tablas complementarias se transmiten usando
procedimientos anlogos a los descritos para las PSI. Los servicios utilizados por el DVB se
componen de cuatro tablas bsicas ms tres tablas opcionales. Los contenidos de las tablas bsicas se
describen a continuacin:

a) Tabla de informacin de red (NIT - Network Information Table). Se proporciona toda la
informacin relativa a la red. El PID en el que se transmite esta informacin es, por
definicin, el nmero 0. Los datos proporcionados se utilizan en sistemas por va satlite para
informar sobre detalles de la transmisin, como por ejemplo la posicin orbital del satlite, el
tipo de polarizacin empleado, la frecuencia, el tipo de modulacin, etc. Esta informacin
puede ser utilizada por el IRD o el Set-Top-Box para controlar la posicin de los satlites y
conmutar entre distintas tramas de transporte del mismo servicio. En el caso de transmisiones
terrenas puede informar de los distintos canales de RF que componen una misma red. En este
caso, el proveedor del servicio puede utilizar varios canales de transmisin (varias tramas de
transporte) para la difusin de todos los canales. Con esta informacin, el receptor puede
disponer de informacin de antemano de los canales RF en los que se encuentra cada
programa.
b) Tabla de descripcin de servicio (SDT Service Description Table). En esta tabla se listan
los nombres de los distintos servicios usados en la trama de transporte.
c) Tabla de informacin de sucesos (EIT Event Information Table). Se proporciona
informacin sobre los programas y acontecimientos que se transmiten en la trama de
transporte asociada u otras tramas de la misma red.
d) Tabla de hora y fecha (TDT Time Date Table). Se usa para actualizar el reloj del set-top
box.

4.10.5 Multiplexado de paquetes elementales en la trama de transporte
Uno de los subsistemas ms sofisticados que intervienen en el proceso de transmisin de seales de
televisin digital es el multiplexor que se encarga de asignar los paquetes elementales (PES) de cada
una de las fuentes de audio, vdeo o datos a la trama de transporte. El problema radica en que la trama
de transporte debe tener un flujo de datos constante mientras que los factores de compresin utilizados
en cada programa pueden variar en funcin del contenido. En la figura 4.84 se muestra un diagrama
de bloques en el que se incluyen los distintos aspectos que pueden incidir en la multiplexacin de los
paquetes elementales para formar la trama de transporte. Los paquetes elementales asociados a una
determinada fuente de datos se insertan en un buffer de memoria de donde deben ser peridicamente
extradas para enviarse a travs de la trama de transporte. Obsrvese que si, debido a su contenido, una
fuente de vdeo requiere un flujo de datos elevado deber ser leda con mayor frecuencia que el resto
de fuentes. En el proceso de multiplexacin tambin debe tenerse en cuenta que deben enviarse
cdigos adicionales como el PCR o las informaciones especficas PSI.

El multiplexor debe garantizar que tanto los buffers de los codificadores como el buffer integrado en
el receptor se mantienen alejados del estado de desbordamiento. Para ello, es necesario que los PES se
distribuyan en la trama de transporte de la forma ms dispersa posible, espaciando al mximo la
transmisin entre paquetes sucesivos. Con ello, se evita la aparicin de grandes rfagas de paquetes
asignadas a un mismo programa que podran saturar el buffer del receptor. Cuando las distintas
fuentes tienen tasas de bits distintas, debe tenerse en cuenta el estado de ocupacin de los buffers del
transmisor, que pueden usarse como un indicador de la probabilidad de transmitir los PES asociados a
cada una de las fuentes. As, cuando el estado de ocupacin de un buffer est prximo al
desbordamiento, es necesario que se enven los paquetes al canal con una mayor frecuencia que
cuando est prcticamente vaco. Mediante esta tcnica puede permitirse que las fuentes modifiquen
en tiempo real sus tasas de transmisin en funcin del contenido. Si un codificador de fuente detecta
que los errores de prediccin aumentan puede incrementar su tasa de bits. Con ello, el buffer asociado
se llenar ms rpidamente y el multiplexor deber asignar paquetes elementales con mayor
frecuencia a la trama de transporte.

Fig. 4.84 Diagrama genrico del proceso de multiplexacin de paquetes en la trama de transporte

Evidentemente, es necesario que la suma de todas las tasas de transmisin de las fuentes ms las
informaciones propias de sistema sea inferior a la carga admitida por la trama de transporte. En el
supuesto que los contenidos de los programas no exijan toda la carga disponible en la trama de
transporte, el multiplexor puede aumentar las tasas de transmisin de cdigos PCR o de informaciones
PES
Video1
PES K
PES K+1
PES
Video2
PES M
PES M+1
PES M+2
PES
Audio M
PES N
MULTIPLEXOR
Trama de
transporte
PCR + PSI
+
Relleno
PES
Video1
PES K
PES K+1
PES
Video2
PES M
PES M+1
PES M+2
PES
Audio M
PES N
MULTIPLEXOR
Trama de
transporte
PCR + PSI
+
Relleno
PSI. Tambin pueden enviarse paquetes de relleno adicionales en los que no se incorpora ninguna
informacin significativa para los decodificadores.

Otro elemento de especial importancia en la distribucin de programas es el transmultiplexor. En la
prctica, un creador de programas puede proporcionar una o varias tramas de transporte en las que se
incluyen todos los programas que distribuye. No obstante, un proveedor de servicios puede desear
seleccionar slo algunos programas de distintos creadores para formar nuevas tramas de transporte
con los programas seleccionados. La gestin de recombinar los contenidos de varias tramas de
transporte en tramas nuevas es la que se encarga de realizar el transmultiplexor. Su principio de
funcionamiento, una vez se han restaurado los PES deseados en los respectivos buffers de memoria, es
parecido al del multiplexor.

4.11 Principios del DVB
El DVB (Digital Video Broadcasting) es un organismo encargado de regular y proponer los
procedimientos para la transmisin de seales de televisin digitales compatibles. Est constituido por
ms de 220 instituciones y empresas de todo el mundo y los estndares propuestos han sido
ampliamente aceptados en Europa y casi todos los continentes, con la excepcin de Estados Unidos y
Japn donde coexisten con otros sistemas propietarios. Todos los procedimientos de codificacin de
las fuentes de vdeo y audio estn basados en los estndares definidos por MPEG. No obstante, hemos
visto que los estndares MPEG slo cubren los aspectos y metodologas utilizados en la compresin
de las seales de audio y vdeo y los procedimientos de multiplexacin y sincronizacin de estas
seales en tramas de programa o de transporte. Una vez definida la trama de transporte es necesario
definir los sistemas de modulacin de seal que se utilizarn para los distintos tipos de radiodifusin
(satlite, cable y terrena), los tipos de cdigos de proteccin frente a errores y los mecanismos de
acceso condicional a los servicios y programas.

El DVB ha elaborado distintos estndares en funcin de las caractersticas del sistema de
radiodifusin. Los estndares ms ampliamente utilizados en la actualidad son el DVB-S y el DVB-C
que contemplan las transmisiones de seales de televisin digital mediante redes de distribucin por
satlite y cable respectivamente. La transmisin de televisin digital a travs de redes de distribucin
terrestres utilizando los canales VHF convencionales se contempla en el estndar DVB-T, que
actualmente est en pruebas en distintos pases y cuya implantacin parece que ser inmediata.
Adems de estos estndares tambin estn especificados sistemas para la distribucin de seales de
televisin digital en redes multipunto, sistemas SMATV (Satellite Master Antenna Televisin).
Tambin existen estndares que definen las caractersticas de la sealizacin en el canal de retorno en
sistemas de televisin interactiva, la estructura de transmisin de datos para la encriptacin y
desencriptacin de programas de acceso condicional, la transmisin de subttulos, y la radiodifusin
de datos (nuevos canales de teletexto) mediante sistemas digitales.

En este apartado revisaremos brevemente las caractersticas fundamentales de los estndares para la
radiodifusin de seales de televisin por va satlite, cable y terrena. Las diferencias fundamentales
entre estos tres sistemas radican en el tipo de modulacin digital utilizado y en los cdigos de
proteccin frente a errores incorporados a la trama de transporte. Estas modulaciones y cdigos
protectores estn adecuados a las caractersticas del sistema de comunicacin por lo que son tanto ms
robustos cuanto ms sensible es el sistema al ruido.

4.11.1 Estndar DVB-S
El estndar para la transmisin de televisin digital por satlite es, sin duda, el ms ampliamente
utilizado y, probablemente, su xito, ha sido el detonante de la progresiva implantacin del resto de
sistemas DVB. Actualmente est siendo utilizado por proveedores de servicios en todos los
continentes. En Europa es el nico sistema de televisin digital por satlite implantado.

Podemos considerar que el sistema DVB-S parte de la trama de transporte proporcionada por el
MPEG-2, introduciendo distintas capas de proteccin a la seal para adecuarla a las caractersticas del
canal por el que debe transmitirse. Las etapas sucesivas en las que se introducen nuevas caractersticas
a la trama de transporte se resumen a continuacin:

a) Inversin de los bits de sincronismo en uno de cada ocho paquetes de la trama de transporte.
Cada paquete de la trama de transporte es de 188 bytes, lo que significa que se la inversin de
signo en los bits de sincronismo se repite cada 1504 bytes.
b) Insercin de un cdigo aleatorio a la trama resultante. La adicin de ste cdigo pretende
garantizar que las caractersticas estadsticas de los datos sean prcticamente aleatorias. La
aleatorizacin se obtiene realizando una suma OR exclusiva entre la secuencia de datos y una
secuencia obtenida mediante un generador por registros de desplazamiento. La secuencia
aleatoria se reinicializa cada 8 paquetes de la trama de transporte.
c) Adicin de un cdigo de deteccin y correccin de errores de Reed-Solomon. Este cdigo se
denomina cdigo externo y es comn en todos los estndares del DVB. Introduce 8 bytes de
redundancia para cada paquete de 188 bytes.
d) Aplicacin de un entrelazado convolucional (Fourney) cuyo objetivo es dispersar las rfagas
de errores de canal. De este modo, si se produce una rfaga de errores, debida a un
desvanecimiento del canal, los errores afectarn a paquetes distintos y, probablemente,
podrn eliminarse usando las propiedades correctoras de los cdigos interno y externo.
e) Insercin de un segundo cdigo protector de errores. Este cdigo recibe el nombre de cdigo
interno y es de naturaleza convolucional. El grado de redundancia que introduce ste cdigo
no est fijado de antemano y puede configurarlo el proveedor del servicio para adaptarse a
las caractersticas del sistema que desee utilizar (potencia de transmisin, tamao de las
antenas transmisoras y receptoras, tasa de datos disponible, etc.).
f) Modulacin de la portadora mediante QPSK (Quadrature Phase Shift Keying).

En el receptor deben realizarse las operaciones inversas para tener acceso a la trama de transporte que
soporta la informacin de los programas de televisin en formato MPEG-2. El estndar DVB-S
proporciona suficiente flexibilidad como para que el operador del servicio pueda decidir el contenido
de los programas de televisin que proporciona. Por tanto, es posible que se transmitan seales con
definicin mejorada, de alta definicin o de definicin convencional (ML@MP). En funcin de las
caractersticas del enlace puede seleccionarse el cdigo de proteccin de errores interno. En
transmisiones con un ancho de banda de 36 MHz es habitual utilizar cdigos internos 3/4 (3 bytes de
datos, 1 de redundancia), con lo que se consiguen tasas de datos de unos 39 Mbps.
4.11.2 DVB-C
El estndar de transmisin de televisin digital por cable est basado en el DVB-S y comparte muchos
aspectos comunes. Las diferencias fundamentales entre ambos estndares es que en la transmisin por
cable se sustituye la modulacin QPSK por una modulacin 64-QAM y que no se utilizan los cdigos
de correccin internos. La supresin de estos cdigos de proteccin se debe a que la relacin seal a
ruido que se obtiene en un sistema por cable es muy superior a la de un sistema por satlite de modo
que, es suficiente con los cdigos externos para garantizar una correcta recepcin, exenta de errores,
de los datos.

Para canales de 8MHz de ancho de banda (equivalentes a los canales cable analgicos) puede
obtenerse una capacidad de unos 38.5 Mbps (usando modulaciones del tipo 64 QAM). El estndar
tambin contempla el uso de modulaciones digitales con tasas de datos superiores 128 QAM y 256
QAM as como modulaciones con menores tasas (16 QAM, 32 QAM).

4.11.3 DVB-T
El estndar DVB-T comparte el mismo proceso de aleatorizacin, proteccin externa e interna de
datos y cdigos convolucionales de entrelazado que el DVB-S. La diferencia fundamental es que, en
ste caso, se utiliza una modulacin COFDM (Coded Orthogonal Frequency Divisin Multiplexing)
con un total de 1705 (modo 2K) o 8817 portadoras (modo 8K). Esta modulacin permite, mediante el
uso de mltiples portadoras que dispersan los datos de la trama a transmitir, operar en escenarios con
un elevado ndice de seal multicamino. La proteccin frente a este tipo de interferencias se consigue
insertando intervalos de guarda entre los datos que, eventualmente, reducen la capacidad del canal.
Esta reduccin de la capacidad es tanto menor cuanto mayor es el nmero de portadoras utilizadas. No
obstante, el aumento del nmero de portadoras incrementa la complejidad del receptor.

El modo 2K est pensado para transmisiones simples que cubran reas geogrficas reducidas
(potencias reducidas) mientras que el modo 8K puede usarse para reas geogrficas extensas usando
una nica frecuencia portadora por canal, comn en toda la red. La fuerte proteccin del COFDM
permite que el sistema pueda operar manteniendo la misma frecuencia portadora en toda una regin
geogrfica extensa (cubierta por varios radioenlaces). El receptor interpreta la seal procedente del
radioenlace ms dbil como una seal multicamino y puede rechazarla. Si los radioenlaces estn muy
alejados, las diferencias de tiempo de recepcin pueden ser considerables y es necesario aumentar los
intervalos de guarda entre los datos digitales, perdiendo cierta eficiencia en la transmisin.

5 Cmaras 381

5 Cmaras
5.1 Introduccin
La cmara constituye uno de los elementos ms importantes en cualquier sistema de comunicacin
visual. Su funcin bsica es convertir la escena tridimensional en una seal temporal, analgica o
digital, que pueda ser tratada, almacenada en soporte ptico o magntico, o modulada para
transmitirse a un receptor remoto. En este captulo consideraremos varios aspectos relacionados con la
cmara y los elementos que la constituyen. Aunque la presentacin est orientada fundamentalmente a
cmaras de vdeo, tambin consideraremos con cierto detalle los principios de funcionamiento de la
cmara fotogrfica y se proporcionaran algunos ejemplos de cmaras orientadas a aplicaciones
industriales de reconocimiento de imgenes.

La primera parte del captulo se centra en el estudio del sistema de formacin de imgenes o grupo
ptico. El objetivo es introducir los conceptos de enfoque, variacin de la distancia focal, ngulo de
visin, profundidad de campo de la imagen, etc., y aprender cmo interaccionan todos ellos en la
captacin de imgenes. Para ello, se utiliza un modelo de lente muy simplificado, cuya limitacin es
que no permite realizar clculos avanzados sobre aberraciones de imagen o posiciones relativas entre
varias lentes, pero que resulta eficiente para comprender la incidencia de los distintos componentes
del grupo ptico en la imagen final. La presentacin de estos conceptos se centra en el contexto de una
cmara fotogrfica del tipo reflex y se particulariza a cmaras de vdeo en aquellos puntos donde
aparecen diferencias entre ambos equipos.

En la siguiente seccin se definen las unidades fotomtricas elementales como la candela, el lumen y
el lux. Estas unidades se utilizan con frecuencia en catlogos de cmaras para describir la sensibilidad
de los elementos sensores de imagen o las caractersticas de los focos o fuentes de luz. Este anlisis
tambin permite redefinir el concepto de luminancia de un objeto en funcin de unidades fsicas y
representan una alternativa a los parmetros elctricos que hemos usado en los captulos anteriores.

La conversin de la proyeccin plana de la escena a una seal elctrica requiere el uso de
transductores de luz a carga elctrica, que se conocen como sensores de imagen. El sensor de imagen
ms utilizado en las cmaras de vdeo modernas, tanto en aplicaciones profesionales como
domsticas, es la clula CCD (Charge Coupled Device). Se trata de un dispositivo de estado slido de
reducido tamao, elevada resolucin de imagen y bajo consumo que ha desplazado completamente el
uso de otros tipos de captadores como los tubos de imagen. Dedicaremos cierta atencin a comentar
los principios de funcionamiento de estos sensores y veremos las distintas alternativas tecnolgicas
que suelen usarse en funcin de la aplicacin y sus necesidades. La descripcin de sensores de imagen
incluye slo los dispositivos CCD, puesto que el impacto en el mercado de otras tecnologas para la
captura de seal de vdeo es cada vez ms reducido y tiende a desaparecer. En fotografa analgica y
cine se utiliza una pelcula sensible cuyos principios fsicos escapan de los propsitos de este texto.

Una vez definidos los principios de los sistemas de captura de imagen se describen las distintas
funciones que suelen encontrarse en cmaras de vdeo o fotografa, como el zoom digital, el enfoque
automtico, el ajuste del balance de blanco o los subsistemas de estabilizacin de imagen. La
exposicin se centra principalmente en las distintas alternativas tecnolgicas que se utilizan para
realizar cada una de estas funciones.

En la ltima seccin de este captulo se incluye un resumen de los distintos tipos de cmaras que
pueden encontrarse en el mercado, clasificadas en funcin de su mbito de aplicacin y sus
caractersticas. Tambin se proporciona un breve compendio de los distintos formatos de seal de
vdeo no estndar que se utilizan en aplicaciones de TV de alta definicin, video-vigilancia, visin por
ordenador, etc.

5.2 Diagrama de bloques de una cmara
Los elementos que integran una cmara de vdeo o de fotografa pueden ser muy diversos y dependen
de la aplicacin y del mercado al que se destina la cmara. En esta seccin nos concentraremos
exclusivamente en los bloques bsicos que, con mayor o menor complejidad y calidad, son comunes a
prcticamente todas las cmaras.

Fig,5.1 Diagrama de bloques de una cmara

En la figura 5,1 se representa un posible diagrama de bloques para una cmara de vdeo domstica. El
grupo ptico, el sensor de imagen y el subsistema de lectura y acondicionamiento de seal estn
Grupo
ptico
Sensor de
imagen
Lectura y
acondicionamiento
de seales
Visor
Generador
efectos
Registro
magntico
Entrada
Salida
Micrfono
S-Vdeo, digital, V Comp
Grupo
ptico
Sensor de
imagen
Lectura y
acondicionamiento
de seales
Visor Visor
Generador
efectos
Registro
magntico
Entrada
Salida
Micrfono
S-Vdeo, digital, V Comp
5 Cmaras 383
presentes en todos los tipos de cmaras de vdeo, independientemente de la aplicacin a la que se
destinen. El resto de bloques pueden estar disponibles o no en funcin de la aplicacin. As, las
cmaras de vdeo-vigilancia no suelen incorporar ningn visor, puesto que la imagen se visualiza
directamente desde el centro de control. Examinemos con cierto detalle las funciones de cada uno de
los bloques:

a) Grupo ptico. Su funcin es proporcionar una proyeccin plana de la escena sobre la
superficie del sensor de imagen. Para ello, incluye varias lentes que permiten variar la
regin del espacio a la que enfoca la cmara. En el caso de cmaras con zoom, el grupo
ptico puede modificar la posicin relativa entre las lentes para controlar el ngulo de la
escena que se proyecta al sensor. El grupo ptico tambin incluye elementos que regulan
la cantidad de luz que incide sobre el sensor (iris o diafragma).

b) Sensor de imagen. Es el dispositivo encargado de convertir la luz incidente en una seal
elctrica. En las cmaras de vdeo, la imagen debe ser adquirida a intervalos peridicos
(frecuencia de imagen) y debera facilitarse la lectura de la imagen descompuesta en las
lneas que constituyen la informacin de vdeo. Esto no siempre es as, por lo que puede
ser necesario un acondicionamiento posterior de las seales al estndar de vdeo con el
que trabaja la cmara. En algunos casos, el propio sensor de imagen tiene la capacidad
de ajustar la cantidad de luz incidente con la que se estima la seal elctrica (obturador
electrnico). En cmaras de vdeo domsticas suele utilizarse un nico sensor de imagen
para capturar las tres componentes de color, mientras que en cmaras profesionales es
habitual utilizar un sensor distinto para cada componente. En general, los sensores de
imagen de estado slido suelen tener asociado un complejo circuito de control que
proporciona las seales necesarias para la lectura de la informacin.

c) Lectura y acondicionamiento de seal. Las funciones que se realizan dentro de este
bloque de tratamiento de seal dependen de la aplicacin a la que se destina la cmara.
En el caso de cmaras domsticas, se realiza el control de la lectura del sensor en las
lneas que componen la imagen, de forma sincronizada con los impulsos de borrado
horizontal y se proporcionan las seales de sincronizacin de cuadro al sensor de
imagen. Las seales proporcionadas por el sensor de imagen se filtran y se acondicionan
en ganancia, convirtindolas, por una parte, al estndar de vdeo en el que se realiza el
registro de la secuencia de vdeo sobre la cinta magntica y, por otra, al formato de seal
requerido por el visor de imagen. Este mdulo de tratamiento tambin se encarga del
control del grupo ptico y del sistema de adquisicin, como en el caso de las funciones
de enfoque automtico, ajuste del iris y la velocidad de obturacin en funcin del modo
de exposicin y del tipo de imgenes que se estn registrando o, incluso, funciones ms
avanzadas como la estabilizacin del movimiento de la cmara. Adicionalmente se suele
realizar la conversin de las seales a formatos de vdeo convencionales (vdeo
compuesto, S-Vdeo, RF) que se proporcionan como salida de la cmara y que permiten
su conexin a receptores de televisin o sistemas de registro sobre cinta magntica
convencionales. Evidentemente, el tipo de formatos de seal de vdeo que se utilizan en
el subsistema de acondicionamiento de seal depende de las aplicaciones a las que se
destine la cmara. En el mbito de cmaras de estudio profesionales, nicamente se
proporcionan las distintas componentes de color, que posteriormente sern tratados por
unidades de control de cmara externas. En cmaras de video-vigilancia o de circuito
cerrado de televisin (CCTV) se suele suministrar una nica seal de vdeo compuesto
en el formato PAL o NTSC.

d) Visor. Proporciona al usuario o al operador de cmara una rplica de la imagen que se
est recibiendo en el sensor. Es til para realizar el control de enfoque y del ngulo de
visin de la escena. El visor suele estar formado por un pequeo tubo de rayos catdicos
o dispositivo de cristal lquido y una lente que ajusta la imagen para que pueda
visualizarse desde una distancia corta. En las cmaras domsticas ms modernas suele
incorporarse un visor de cristal lquido auxiliar, situado en el exterior del cuerpo de la
cmara y desplegable, que se utiliza tanto para ajustar el grupo ptico como para visionar
las imgenes previamente registradas en la cinta. Los visores pueden ser en blanco y
negro o en color. Estos ltimos slo se encuentran en las cmaras domsticas de alta
gama. En cmaras profesionales se siguen utilizando visores en blanco y negro debido a
que la resolucin del sistema visual es ms alta en luminancia que en imgenes de color,
con lo que el control de foco de la escena resulta ms fcil si se realiza sobre un visor en
blanco y negro.

e) Registro magntico. Slo est presente en las unidades de cmara que incorporan un
sistema de registro de vdeo en cinta. Prcticamente todos los modelos orientados al
mercado domstico integran la unidad de cmara con un sistema de registro y
reproduccin de vdeo porttil. En el mbito profesional se utilizan este tipo de cmaras
para la realizacin de reportajes en directo. Existen versiones para todos los formatos de
vdeo profesionales. En algunos casos, el subsistema de registro de vdeo es un mdulo
separado que se aade al cabezal de cmara.

f) Generador de efectos. nicamente se incorpora en videocmaras domsticas y el
objetivo es que el usuario final disponga de cierta capacidad para editar y proporcionar
efectos de mezcla en sus vdeos sin necesidad de disponer de un sistema de edicin
independiente. Los efectos ms habituales son el registro de seales en blanco y negro,
en color sepia, fundidos entre escenas, etc. En algunos modelos, aunque cada vez es
menos frecuente, se incluyen pequeas unidades de titulacin.

g) Micrfono integrado. Se usa para el registro de seal de audio en directo. nicamente lo
incorporan las cmaras domsticas y las profesionales para reportajes exteriores. En el
registro y produccin de vdeo en estudio se utilizan micrfonos y canales de audio
independientes y slo se mezclan con la seal de vdeo en la fase de produccin. En las
cmaras ms modernas se integran dos micrfonos con diagramas de radiacin
ligeramente inclinados hacia la derecha y la izquierda del eje de la cmara. Con ello se
logra obtener un registro estereofnico de la componente de audio. En la mayora de
formatos de vdeo domstico que se comercializan actualmente (Hi-8, miniDV, Digital
8, etc.) el registro de la seal de audio es digital.

h) Entradas y salidas. Proporcionan la seal de vdeo y/o audio capturada por la cmara. El
nmero y tipo de entradas y salidas depende tambin de las aplicaciones de la cmara.
As, en cmaras para CCTV nicamente se proporciona la seal de vdeo compuesto,
5 Cmaras 385
mientras que en cmaras domsticas suelen proporcionarse distintos formatos de salida:
PAL, S-Vdeo, digital, etc. En algunas cmaras, como las webcam, el formato de vdeo
de salida est especialmente diseado para su adaptacin a un puerto del ordenador
(USB, RS-232). Las entradas suelen corresponder a seales de audio externo, capturadas
con micrfonos auxiliares. No suelen proporcionarse entradas de seal de vdeo y muy
pocos modelos de cmaras domsticas disponen de ellas.

Las cmaras de fotografa digital (Digital Still Cameras) tienen un principio de funcionamiento muy
parecido a las cmaras de vdeo, con la salvedad de que nicamente registran el contenido de un
fotograma y no la secuencia de vdeo completa. De hecho, la mayora de modelos tambin
proporcionan una seal de vdeo en tiempo real en la salida, que permite reproducir las fotografas
almacenadas en la memoria u observar la seal del visor en un receptor de televisin convencional. En
consecuencia, tanto el grupo ptico como los sensores de imagen son del mismo tipo y caractersticas
que los utilizados en las cmaras de vdeo; en todo caso, estos ltimos, tienden a utilizar resoluciones
de imagen ms altas para competir con los sistemas de fotografa analgica. La unidad de
acondicionamiento de seal tambin es parecida, ya que tambin debe realizarse la lectura del sensor
de imagen y producir una seal de vdeo compuesto. En este caso, la conversin a formato de vdeo
para registro en cinta se sustituye por un subsistema de digitalizacin de imgenes que se almacenan
en una memoria RAM interna para su posterior volcado a un sistema de registro informtico en
disquete, integrado dentro de la propia cmara o directamente a un puerto serie conectado con el
ordenador. Para mejorar la eficiencia del sistema y poder registrar mltiples imgenes con una
memoria interna reducida, se incluyen procesadores especficos que realizan la compresin de
imgenes estacionarias (normalmente JPEG o JPEG2000).

En cmaras de fotografa convencional se utiliza pelcula fotogrfica (positiva o negativa) como
sensor de imagen. Este tipo de sensor tiene una resolucin considerablemente superior a la de los
sensores electrnicos, proporcionando una gran definicin y calidad de imagen. El margen de colores
que pueden reproducirse con la tcnica fotogrfica es, no obstante, menor que el que proporciona una
cmara de vdeo. La simplicidad de la cmara fotogrfica analgica reduce notablemente los circuitos
electrnicos, ya que slo se utilizan en los modelos automticos para el clculo automtico de la
exposicin y del enfoque de las imgenes. En la figura 5.2 se reproduce un esquema simplificado de
una cmara del tipo reflex. La pelcula fotogrfica se sita en la parte posterior de la cmara y est
protegida de la luz por el obturador, que no es ms que una cortinilla que controla el tiempo de
exposicin de la pelcula. El grupo ptico tiene la misma funcin que en las cmaras de vdeo, aunque
en este caso suelen ser de un mayor tamao, debido a que la superficie sobre la que se proyecta la
imagen es ms grande que en vdeo y exige el uso de lentes con una distancia focal superior.
Analizaremos con detalle la relacin que existe entre el tamao del sensor y las distancias focales de
las lentes.

La cmara reflex tiene la particularidad de que la imagen que se observa por el visor coincide
exactamente con la imagen que finalmente incidir sobre la pelcula. En cmaras de fotografa
convencionales el visor tiene un grupo ptico simplificado e independiente, que no est situado en la
misma posicin, de modo que pueden producirse errores de paralelismo que conducen a que la
imagen fotografiada no coincida exactamente con la que se vea por el visor. La ventaja de una cmara
reflex es que estos errores se eliminan completamente, y adems, el fotgrafo puede predecir
exactamente cul ser la profundidad de campo de la fotografa, ya que la est observando con el
mismo sistema de lentes e iluminacin que incidir sobre la pelcula. Aunque la implementacin
mecnica de una cmara reflex es bastante costosa, su principio de funcionamiento es simple. La
imagen, tal y como la produce el grupo ptico, se refleja mediante el uso de un espejo para dirigirla
hacia el visor. El pentaprisma situado en el recinto del visor realiza una inversin de la imagen para
que pueda observarse sin el giro horizontal y vertical que producen las lentes del grupo ptico. Al
realizar la fotografa, el espejo que refleja la imagen hacia el visor se levanta, dejando que la imagen
se forme sobre el fondo de la cmara, donde est situada la pelcula. Durante este intervalo de tiempo
el visor queda en negro. El control del tiempo de exposicin se realiza mediante un obturador de
precisin, ya que no es posible retirar el espejo a grandes velocidades. A pesar de este sofisticado
movimiento mecnico, se trata de cmaras muy robustas, que son usadas por casi todos los fotgrafos
profesionales para la elaboracin de reportajes de campo. Su principal inconveniente respecto a otro
tipo de cmaras profesionales es que utilizan pelcula fotogrfica de miniatura (35 mm, baja
resolucin si se compara con otros tipos de pelcula de mayor tamao) y que siempre existe un
pequeo retardo entre el momento de disparar y el de tomar la fotografa, que puede ser importante en
la toma de instantneas con objetos que se mueven a alta velocidad.

Fig 5.2 Elementos de una cmara fotogrfica

5.3 Principios de ptica geomtrica y formacin de imgenes
El grupo ptico desempea un papel fundamental en el proceso de adquisicin de la imagen, ya que
determina la parte de la escena que ser capturada y los elementos que permanecern correctamente
enfocados. Tambin se encarga de regular la cantidad de luz que incide sobre el sensor, de modo que
es posible operar en un amplio margen de condiciones de iluminacin sin necesidad de modificar la
sensibilidad del sensor. En este apartado se proporcionan las herramientas bsicas para comprender la
funcin de los distintos elementos que forman el grupo ptico: lentes, diafragma y obturador, as
como su incidencia sobre la imagen final. El objetivo es comprender las relaciones existentes entre
velocidad de obturacin, apertura del diafragma, distancia focal y profundidad de campo. Para
simplificar el anlisis supondremos que todas las lentes del grupo ptico son ideales y que pueden
Lentes
zoom
diafragma
Lente
principal
Lente
de enfoque
Objetivo
Cuerpo
Visor
Pelcula
Obturador
Pentaprisma
Espejo
Lentes
zoom
diafragma
Lente
principal
Lente
de enfoque
Objetivo
Cuerpo
Visor
Pelcula
Obturador
Pentaprisma
Espejo
5 Cmaras 387
modelarse por una nica lente equivalente. Esta simplificacin no nos permite evaluar las aberraciones
de las lentes, pero no supone ninguna restriccin importante sobre los conceptos que pretendemos
manejar.

5.3.1 Lentes, grupo ptico y la lente ideal
Una lente es una pieza de vidrio u otro material transparente que se utiliza para la formacin de
imgenes de objetos reales mediante el desvo de los rayos de luz que proceden del objeto. Suelen
tener forma circular y sus superficies frontal y posterior estn pulidas con curvaturas cncavas o
convexas que casi siempre tienen forma esfrica. En la figura 5.3 se representa el esquema de una
lente.

Fig.5.3 Esquema de una lente

Las superficies frontal y posterior introducen un cambio en la direccin de propagacin de los rayos
de luz, debido al cambio de medio (aire-vidrio-aire), conocido como refraccin. Al tratarse de
curvaturas esfricas, los rayos que entran perpendiculares al plano de la lente convergen en un nico
punto denominado foco. La distancia entre el foco y el plano de la lente es la distancia focal y
depende de la curvatura de las superficies frontal y posterior. El plano paralelo al plano de la lente,
que pasa por el foco, se denomina plano focal. Adems, cuando los rayos de luz proceden de una
direccin distinta a la ortogonal tambin convergen en un mismo punto que se sita sobre el plano
focal. En la figura 5.4 se representan el foco, la distancia focal y el plano focal de una lente.

Debe observarse que el pulido de las superficies de las lentes debe ser muy preciso, puesto que
cualquier imperfeccin modificar la direccin en la que se refractan los rayos y significar que no
todos ellos convergen en un nico punto. Este problema se conoce como aberracin y puede
introducir distintos tipos de distorsin en la imagen, como la falta de enfoque, aparicin de
distorsiones geomtricas o cromticas, etc. En nuestro caso supondremos que las lentes son ideales y
que no producen este tipo de problemas.

Las lentes pueden ser convergentes o divergentes, dependiendo de la forma cncava o convexa de sus
superficies y de sus radios de curvatura. Las lentes convergentes se comportan tal y como hemos
Frontal Perfil
Superficie
esfrica
Frontal Perfil
Superficie
esfrica
definido anteriormente, es decir, los rayos que atraviesan la lente convergen en un punto denominado
foco que est situado por detrs de la lente. En las lentes divergentes, los rayos se separan al atravesar
la lente. No obstante, tal y como se ilustra en la figura 5.5, los rayos resultantes parecen proceder de
un punto situado por delante de la lente que se denomina foco virtual. Las lentes convergentes se
utilizan en la captura o proyeccin de imgenes. Las aplicaciones tpicas son las cmaras de vdeo, de
fotografa o cine, los proyectores de vdeo o pelcula, lupas de bolsillo, etc. Las imgenes obtenidas
con lentes convergentes se denominan imgenes reales, en contraposicin con las que se obtienen
mediante lentes divergentes que se denominan imgenes virtuales. En este ltimo caso los rayos
parecen proceder de un punto inexistente o virtual. Son ejemplos de imgenes virtuales las que se
observan a travs de un espejo o de un microscopio.

Fig. 5.4 Foco, plano de la lente y plano focal en lentes convergentes

Fig. 5.5 Lentes convergentes y divergentes. Imagen real y virtual.

El carcter convergente o divergente de una lente depende de los radios de curvatura de las superficies
frontal y posterior. Cuando ambas superficies son convexas la lente es convergente, mientras que si
Plano focal Foco
Plano lente
Plano focal Foco
Plano lente
Imagen real
Lente convergente
Imagen virtual.
Lente divergente
Foco
Foco
Imagen real
Lente convergente
Imagen virtual.
Lente divergente
Foco
Foco
5 Cmaras 389
son cncavas, la lente resulta ser divergente. En los casos en que una de las superficies es cncava y la
otra convexa, la lente puede resultar convergente o divergente en funcin de los radios de curvatura de
cada superficie.

La calidad de una lente se mide mediante su poder de resolucin, que indica la capacidad de la lente
para formar correctamente las imgenes de dos puntos o lneas muy prximos. Esta medida puede
realizarse por diferentes mtodos. Uno de los procedimientos ms utilizados es utilizar un patrn de
lneas blancas y negras que van alternndose en el sentido horizontal o vertical. El poder de resolucin
de la lente se considera como el nmero de pares de lnea por milmetro que pueden discernirse en la
imagen. Este valor nos proporciona una primera idea aproximada de la calidad de la lente. En general,
para obtener grupos pticos con un poder de resolucin aceptable para fotografa o vdeo es necesario
utilizar varias lentes.

Existen diversas aplicaciones que utilizan una nica lente para la formacin de imgenes. Entre estas
destacan las lentes de contacto, las gafas, los visores de las cmaras de vdeo, los semforos, las lupas
de bolsillo, los proyectores de transparencias, etc. Sin embargo, las imgenes que se obtienen con una
nica lente no resultan de suficiente calidad en campos como la fotografa o la microscopa, que
requieren imgenes de gran precisin. El problema se debe a que, a pesar de que el proceso de
fabricacin de la lente se cuide en extremo, resulta inevitable la aparicin de cierto grado de
aberracin.

Las aberraciones en una lente pueden ser de distintos tipos en funcin de la naturaleza del problema
que las origina. La aberracin esfrica aparece cuando los rayos de luz no convergen en el foco de la
lente y se debe a las imprecisiones en la fabricacin y pulido de las superficies esfricas de la lente.
Las aberraciones cromticas aparecen cuando los planos en los que se forman las imgenes dependen
de la longitud de onda de la luz. En este caso, las distintas componentes de color no convergen en el
mismo punto, de modo que los colores de la imagen aparecen falseados. La aberracin de curvatura
de campo se produce cuando los rayos procedentes de distintas direcciones no convergen sobre el
plano focal, sino sobre una superficie con una ligera forma esfrica. El resultado es que si enfocamos
la parte central de la imagen, los extremos aparecern desenfocados. La aberracin de coma aparece
en los extremos de la imagen y se debe a que los rayos no convergen en un nico punto para los
objetos que estn alejados del eje de la lente. El astigmatismo se produce cuando el plano de
convergencia de las imgenes para un patrn de lneas horizontales no coincide con el plano donde
converge un patrn de lneas verticales. Por ello, aparece prdida de definicin en los contornos
verticales u horizontales de la imagen. La distorsin geomtrica consiste en que las lneas rectas
aparecen curvadas a medida que nos alejamos del centro de la lente. Puede ser de cojn o de barril en
funcin de la curvatura.

Las aberraciones pueden reducirse si se sustituye la lente por un conjunto de lentes con la forma y la
separacin apropiadas. La reduccin de la aberracin se consigue provocando que las lentes
individuales tengan aberraciones contrapuestas que se cancelen entre s. En el grupo ptico de una
cmara de fotografa pueden encontrarse entre 15 y 20 lentes individuales, cuyos parmetros
geomtricos y posiciones relativas han sido calculados con precisin y que resultan equivalentes a una
nica lente con un nivel de aberracin reducido. Pueden combinarse lentes convergentes y divergentes
(vase la Fig. 5,6) aunque el equivalente resulta ser siempre una lente convergente. Algunas lentes
pueden modificar su posicin relativa respecto a otras lentes para permitir modificar la distancia focal
(objetivos con zoom) o enfocar correctamente la imagen sobre el sensor. El coste de un grupo ptico
est directamente relacionado con la ausencia de aberraciones del conjunto de lentes. As, los precios
de objetivos que tienen una gran apertura (mucha entrada de luz) son muy superiores a los de los
objetivos con poca apertura. La razn es que para obtener aperturas grandes se requieren tambin
lentes de gran tamao, en las que deben eliminarse todas las aberraciones que puedan aparecer en la
periferia de la lente.

Fig. 5.6 Un grupo ptico est formado por varias lentes para reducir la aberracin.

Una buena cmara para fotografa en miniatura de 35 mm puede utilizar grupos pticos con un poder
de resolucin de unas 80-100 lneas por milmetro. Esto significa que con una pelcula de suficiente
resolucin pueden obtenerse hasta un total de 2400 lneas en el sentido vertical (la altura de la pelcula
es de 24mm), lo que representa una resolucin unas 4 5 veces superior a la de los sistemas de
televisin de definicin convencional.

Fig. 5.7 Formacin de imgenes en una lente ideal.

La lente ideal puede utilizarse como primera aproximacin para estudiar las propiedades y
caractersticas de un grupo ptico. La lente ideal queda caracterizada por su distancia focal (F) y se
representa como una lnea vertical con dos flechas en sus extremos. En la figura 5.7 se representa una
Grupo ptico Grupo ptico
Eje de la lente
lente
Objeto A
Imagen A
Eje de la lente
lente
Objeto A
Imagen A
5 Cmaras 391
lente ideal y se indica cmo se obtiene la imagen del punto A. Todos los rayos que proceden de este
punto son desviados por la lente hacia el punto imagen. La imagen siempre se forma sobre un plano
paralelo al plano de la lente que se denomina plano de imagen y que est situado por detrs del plano
focal. Si deseamos enfocar el objeto A, deberemos situar el sensor de imagen sobre el plano de
imagen. Para realizar el enfoque en cmaras fotogrficas o de vdeo, en las que el sensor est en una
posicin fija, es necesario modificar la posicin de la lente, adelantndola o atrasndola hasta que el
objeto quede correctamente enfocado. Es importante tener en cuenta que las imgenes de todos los
objetos situados a una misma distancia de la lente (sobre el plano de objeto) se forman en el mismo
plano de imagen. Esto significa que los objetos situados a la misma distancia resultarn enfocados
simultneamente. En el siguiente apartado veremos como puede determinarse la distancia a la que se
sita el plano de imagen.

5.3.2 Formacin de imgenes con lentes ideales
Para determinar el punto donde se forma la imagen de un objeto pueden usarse las tres reglas
siguientes:

1) El rayo procedente del objeto que pasa por el centro de la lente no es desviado.
2) El rayo procedente del objeto que entra perpendicular al plano de la lente se desva hacia el
foco.
3) La imagen del objeto se obtiene en el punto de interseccin de los dos rayos anteriores.

En la figura 5.8 se representan grficamente las reglas anteriores cuya aplicacin es de carcter
general, exceptuando aquellos objetos que se encuentran sobre el eje de la lente. En este caso
concreto, las dos primeras reglas representan el mismo rayo, por lo que no puede calcularse el punto
de interseccin. No obstante, resulta trivial calcular la distancia a la que se formar la imagen si
consideramos que todos los objetos situados a la misma distancia convergen en el mismo plano de
imagen.

Fig. 5.8 Reglas para el clculo del punto en el que se forma la imagen

Las reglas anteriores proporcionan un mtodo simple e intuitivo para determinar el punto donde se
forma la imagen. Por ello, en muchas representaciones, slo se utilizarn estos dos rayos para indicar
el punto donde aparece la imagen. Sin embargo, no debe olvidarse que del objeto A salen rayos en
Eje de la lente
lente
Objeto A
Imagen A
Eje de la lente
lente
Objeto A
Imagen A
todas las direcciones y que todos ellos, cuando pasan a travs de la lente, son desviados hacia el punto
imagen. La consideracin de todos estos rayos ser fundamental cuando analicemos la funcin del
diafragma y su incidencia en la profundidad de campo.

A partir de estas consideraciones resulta bastante sencillo determinar analticamente las relaciones
entre las distancias y alturas del objeto y su imagen. En la figura 5.9 se representan los diferentes
parmetros que deseamos relacionar donde H y L representan la altura y la distancia respectivamente
del objeto real, F la distancia focal y h y l la altura y distancia del punto donde se forma la imagen.

Fig. 5.9 Relaciones trigonomtricas en la lente ideal

La ecuacin de la recta que pasa por el centro de la lente puede expresarse:

x
L
H
y = (5.1)

La recta que pasa por el foco viene dada por:

x
F
H
H y = (5.2)

Igualando ambas expresiones para x = l obtenemos:

F l L
1 1 1
= + (5.3)

que relaciona la distancia a la que se encuentra el objeto de la lente con la distancia en la que se forma
la imagen. Anlogamente, si sustituimos para y = h obtenemos:

F h H
1 1 1
= + (5.4)
a
a
H
h
L
l
F
a
a
H
h
L
l
F
5 Cmaras 393

Las ecuaciones 5.3 y 5.4 proporcionan las relaciones bsicas entre un objeto y su imagen en funcin
de la distancia focal de la lente. De ellas podemos extraer varias conclusiones que nos ayudan a
comprender el fenmeno de formacin de imgenes:

a) Las imgenes de los objetos muy lejanos se forman sobre el plano focal. En efecto, a medida
que L aumenta, el factor 1/L en la ecuacin 5.3 se reduce, con lo que el plano de imagen
(situado a una distancia l) coincide con el plano focal. Existen algunas cmaras de fotografa
muy econmicas que no tienen la capacidad de ajustar el enfoque de la imagen y que sitan
la pelcula sobre el plano focal. De este modo, siempre enfocan las imgenes que se
encuentran en el infinito. Estas cmaras suelen dar resultados aceptables cuando se realizan
fotografas de paisajes o de objetos alejados. Veremos que suelen utilizar diafragmas muy
cerrados y grandes angulares, con lo que consiguen una profundidad de campo considerable
que permite que los objetos situados a una distancia media permanezcan ms o menos
enfocados.

b) A medida que un objeto se acerca a la lente, el plano de imagen se aleja del plano focal.
Resulta evidente que al aumentar el trmino 1/L debe reducirse 1/l para mantener la
contribucin de ambos constante e igual a 1/F. Como una consecuencia directa de esta
relacin, debe observarse que cuando el objeto se sita a una distancia de la lente igual a la
distancia focal, no se obtiene ninguna imagen, ya que el rayo que pasa por el centro de la
lente y el que se desva hacia el foco son paralelos y no se intersecan en ningn punto. En la
prctica, la distancia mnima para la que puede enfocar una lente depende de la mxima
separacin que podamos obtener entre la lente ideal equivalente y la posicin del sensor de
imagen. Esta distancia depende de las caractersticas del grupo ptico.

c) Si aumenta la distancia focal tambin aumenta el tamao de la imagen. Si aislamos h en la
ecuacin 5.4 obtenemos:

1 /
=
F H
H
h (5.5)

de donde se deduce inmediatamente que un aumento de F supone que el denominador
disminuye y por lo tanto que aumenta el tamao h de la imagen del objeto. As pues, los
teleobjetivos se correspondern con distancias focales grandes mientras los grandes angulares
u ojos de pez con distancias focales pequeas.

d) Si aumenta la distancia focal tambin aumenta la distancia del plano de imagen. La
distancia a la que se obtiene el plano de imagen puede despejarse de la ecuacin 5.3,
obteniendo:

1 /
=
F L
L
l (5.6)

Por tanto, si F aumenta el denominador disminuye y aumenta la distancia del plano focal.
Debe notarse que la relacin slo es vlida cuando L/F es mayor que la unidad, ya que en el
caso contrario no se forma ninguna imagen. Esta relacin nos indica que las lentes de gran
distancia focal requieren una separacin considerable entre el plano de la lente y el sensor.
Por ello, todos los teleobjetivos suelen ser largos, ya que se trata de mantener la lente
equivalente alejada del sensor.

5.3.4 ngulo de visin
Se entiende como campo o ngulo de visin de una fotografa o secuencia de vdeo el ngulo que
abarcan los objetos que aparecen en la imagen cuando son observados desde el punto donde se ha
realizado la toma. Un ngulo de visin reducido se corresponde con imgenes tomadas desde un
teleobjetivo. Con un gran angular o un ojo de pez pueden obtenerse campos de visin muy amplios. El
campo de visin depende de la distancia focal del objetivo y del tamao del sensor. Para calcularlo de
forma simple es conveniente suponer que estamos capturando imgenes que se encuentran en el
infinito. En este caso, el sensor de imagen debe situarse en el plano focal, a una distancia F de la lente.
En la figura 5.10 se muestra un diagrama en el que se relaciona la distancia focal, con el ngulo de
visin y el tamao del sensor. Los objetos de la escena que sern capturados se encuentran en el
ngulo definido por los rayos que pasan por el centro de la lente y que inciden en los extremos del
sensor. La relacin entre el ngulo de visin (), la distancia focal (F) y el tamao del sensor (D)
puede obtenerse usando relaciones trigonomtricas:

= =
F
D
F
D
2
arctan 2 ) 2 / tan(
2 /
(5.7)

Fig. 5.10 Clculo del ngulo de visin

Evidentemente, como el sensor no es cuadrado, puede definirse un ngulo de visin en el sentido
horizontal y otro en el sentido vertical. La dependencia del ngulo de visin con el tamao del sensor
es la razn por la que los objetivos usados en las cmaras de vdeo son mucho ms pequeos que los
objetivos utilizados en fotografa convencional. En efecto, en la ecuacin 5.7 resulta evidente que si
deseamos mantener el ngulo de visin constante la relacin entre el tamao del sensor y la distancia
focal tambin debe mantenerse constante. Por lo tanto, un aumento del tamao del sensor supone un
aumento proporcional de la distancia focal del objetivo.
D, tamao sensor
F, distancia focal
D, tamao sensor
F, distancia focal

5 Cmaras 395
Consideremos como ejemplo el clculo de los ngulos de visin que se obtienen con un objetivo de
50mm de distancia focal en cmaras de fotografa en miniatura de 35 mm. En este tipo de fotografa
se utiliza una pelcula que tiene 35 mm de altura, pero de la que slo se aprovechan 24 mm, pues el
resto se utilizan para las guas de arrastre de la pelcula. La anchura efectiva del fotograma es, tal y
como se indica en la figura 5.11, de 36 mm. Debe observarse que en este tipo de fotografa la relacin
de aspecto es de 3:2, es decir, algo ms alargada que en televisin convencional (4:3) y ligeramente
inferior a la que se utiliza en los formatos panormicos (16:9). Los ngulos de visin vertical y
horizontal (suponemos que la toma se realiza en la forma apaisada) que se obtienen para un objetivo
de 50 mm son:

59 , 39 ; 99 , 26 = =
H V
(5.8)

Fig. 5.11 Tamao del sensor utilizado en fotografa en miniatura de 35 mm

La perspectiva que proporciona con un objetivo de 50 mm en este tipo de fotografa es parecido al que
tiene el sistema visual humano. Las fotografas obtenidas con estos objetivos resultan por tanto muy
naturales. Los objetivos con una distancia focal menor producen una mayor sensacin de perspectiva
en la escena. Las distancias focales de 35 mm suelen utilizarse para paisajes, entre 24 y 28 mm
tenemos los grandes angulares, que ya introducen una distorsin apreciable de la imagen. Los ojos de
pez de 16 o 18 mm permiten capturar escenas con un ngulo de visin horizontal de ms de 90. Por el
contrario, si se utilizan distancias focales superiores a 50 mm, se reduce la sensacin de perspectiva.
La distancia focal de 105 mm, muy utilizada en retratos de personas, produce unos ngulos de visin
de 13,04 (vertical) y 19,45 (horizontal). Un teleobjetivo de 300 mm reduce notablemente la
perspectiva y tiene unos ngulos de visin de 4,58 (vertical) y 6,86 (horizontal).

El sistema de fotografa APS (Advanced Photo System) fue creado conjuntamente por varios
fabricantes (Kodak, Fuji, Canon, Nikon y Minolta) como una alternativa universal al clsico formato
de 35 mm. El objetivo fundamental del lanzamiento de este nuevo sistema era reactivar el mercado de
cmaras fotogrficas y ha tenido cierto xito en la gama de cmaras compactas. El APS introduce
diversas prestaciones adicionales entre las que destaca la presencia de una banda magntica en los
laterales de la parte posterior de la pelcula y en la que puede incorporarse informacin digital diversa
35 mm
36 mm
24 mm
35 mm
36 mm
24 mm
sobre las tomas: fecha, hora, diafragma, velocidad de obturacin, tipo de encuadre y otros datos
digitales. El envase del carrete tambin contiene informacin sobre la sensibilidad de la pelcula y el
nmero de exposiciones realizado, que se intercambian con la cmara. El usuario puede seleccionar el
formato con el que se realiza la toma existiendo los modos normal, angular y panormico en los que
se modifica el tamao o zona de la pelcula en la que se realiza el registro de la imagen. El sistema
APS dispone de una completa gama de productos adicionales para la presentacin de imgenes en una
pantalla de televisin, equipos para realizar escaneado de los negativos, etc. Se utiliza una pelcula
fotogrfica de 24 mm de anchura que, en el modo de encuadre normal, tiene un tamao efectivo de
16,7x30,2 mm. Este tamao de sensor representa una superficie un 40 % menor que la de un
fotograma en el formato de 35 mm. No obstante, los fabricantes aseguran que las copias tienen una
calidad parecida en ambos formatos debido a las mejoras introducidas en las emulsiones sensibles.

Al modificar la relacin de aspecto del sensor, la relacin entre ngulos de visin y la sensacin de
perspectiva no se mantiene. As, un objetivo de 42 mm para el formato APS cubre el mismo ngulo de
visin horizontal que un objetivo de 50 mm en el formato de 35 mm. En efecto, utilizando el ngulo
de visin horizontal que hemos obtenido en la ecuacin 5.8, podemos calcular la nueva distancia focal
mediante:

( )
mm 42
2 / tan 2
=

=
D
F (5.9)

No obstante, si utilizamos esta misma distancia focal para calcular, mediante la ecuacin 5.7, el
ngulo de visin vertical que obtenemos es de 22,48, algo inferior al que se obtiene en el formato de
35 mm. Una alternativa que se utiliza con cierta frecuencia para obtener las distancias focales
equivalentes en formatos que tienen relaciones de aspecto distintas consiste en igualar los ngulos de
visin que se obtienen en la diagonal del sensor. Con ello, tal y como se representa en la figura 5.12,
se modifican los dos campos de visin ajustndose a la relacin de aspecto de modo que las imgenes
tendrn una sensacin de perspectiva parecida.

Fig. 5.12 ngulos de visin equivalentes en imgenes con distinta relacin de aspecto

En cmaras de vdeo el sensor tiene casi siempre una relacin de aspecto de 4:3, o de 16:9 si se trata
de cmaras que trabajan en el formato panormico. El tamao del sensor depende de la tecnologa y
de las prestaciones de la cmara. En cmaras domsticas suelen usarse sensores de 1/4 '' 1/3''. En
cmaras profesionales pueden usarse sensores de mayor tamao para mejorar la resolucin (2/3''),
aunque la tendencia es ir reduciendo el tamao del sensor a medida que el avance tecnolgico permite
mejorar la resolucin de los sensores de estado slido. En la actualidad pueden encontrarse cmaras en
5 Cmaras 397
miniatura que incorporan sensores de 1/6''. La terminologa que expresa el tamao del sensor en
pulgadas procede de las antiguas cmaras que usaban tubos de imagen y no tiene mucho que ver con
las dimensiones fsicas reales del rea de imagen. El nmero de pulgadas indicaba el dimetro de todo
el tubo de imagen, del que slo la parte central se utilizaba para la lectura de la imagen. Las primeras
CCD indicaban el tipo de tubo de imagen con el que eran compatibles. As, una CCD de 2/3'' indicaba
que tena un rea de imagen til que poda sustituir a un tubo de imagen de 2/3'' sin necesidad de
modificar el grupo ptico. Una CCD de 2/3'' tiene una zona de imagen til de 11 mm de diagonal. En
una CCD de 1/4 '' la zona de imagen til tiene una diagonal de aproximadamente 4 mm. Las
dimensiones reales de la zona de imagen suelen depender del fabricante, sobre todo en sensores de
reducido tamao, y del modelo de cmara en el que se incorporan, ya que algunos sistemas de
tratamiento digital reducen la zona de imagen til para poder aplicar algoritmos de estabilizacin del
movimiento de cmara. De todos modos, resulta evidente que la reduccin del tamao del sensor en
cmaras de vdeo es notable y por tanto, los objetivos requieren distancias focales mucho menores.
Consideremos como ejemplo un sensor CCD de 1/4 '' que tiene un rea de imagen de 2,1 mm x 2,8
mm. Este sensor requiere una ptica con una distancia focal de slo 3,9 mm para obtener el mismo
ngulo de visin horizontal que se obtiene con una ptica de 50 mm en fotografa de 35 mm. Esto
indica que los grupos pticos para cmaras de vdeo suelen ser menos aparatosos (menor distancia
focal) que los utilizados en fotografa. La comparacin resultara an ms exagerada si hubiramos
considerado formatos de fotografa de estudio o de cine de 70 mm en los que el tamao del sensor es
todava mayor.

5.3.5 Regulacin de la cantidad de luz: diafragma y obturador
La cantidad de luz que incide sobre el sensor se controla mediante dos dispositivos que pueden actuar
directamente sobre la cantidad de luz (diafragma) o sobre el tiempo de exposicin del sensor
(obturador). El diafragma est situado en el interior del grupo ptico, entre las lentes, y puede abrirse
o cerrarse para dejar pasar ms o menos luz por el objetivo. Su funcin es parecida a la del iris y la
pupila en el sistema visual humano y acta como regulador del margen dinmico en el que puede
trabajar la cmara. En condiciones de elevada iluminacin, el diafragma se cierra dejando pasar
nicamente una fraccin de la luz incidente, mientras que cuando la luz es insuficiente permanece
abierto dejando que toda la luz que pasa por el objetivo incida sobre el sensor. El obturador controla el
tiempo que el sensor es expuesto a la luz en cada fotograma (tiempo de exposicin). Tambin puede
actuar como regulador del margen dinmico aumentando o disminuyendo este tiempo en funcin de
las condiciones de luz. La accin conjunta de ambos elementos de control permite que pueda operarse
en condiciones de luz muy dispares sin necesidad de modificar la sensibilidad del dispositivo de
captura de imagen.

El diafragma (tambin denominado iris en cmaras de vdeo) y el obturador tienen efectos distintos
sobre la imagen. El operador de cmara o fotgrafo deber dar prioridad a uno u a otro en funcin de
las caractersticas de la escena y los efectos de imagen que pretenda conseguir. Examinaremos con
algn detalle estos efectos ms adelante.

El diafragma tiene forma circular y est formado por un sistema de finas lminas metlicas
superpuestas que pueden abrirse o cerrarse en funcin de la apertura deseada. En la figura 5.13 se
muestran tres posibles posiciones de un diafragma. En cmaras de fotografa del tipo reflex suele estar
siempre abierto mientras no se realizan fotografas para permitir que toda la luz que entra por el
objetivo fluya hacia el visor. Cuando se realiza la fotografa, el diafragma se cierra momentneamente
a la apertura seleccionada. En cmaras de fotografa que tienen un visor independiente y en cmaras
de vdeo, el diafragma est permanentemente ajustado a la apertura seleccionada por el usuario o por
el modo de exposicin automtico.

Fig. 5.13 Distintas aperturas del diafragma

En la figura 5.14 se muestra el efecto regulador del diafragma desde el punto de vista de la lente ideal.
La posicin del diafragma en el grupo ptico debe estar perfectamente ajustada para que su centro
coincida con el eje visual de la lente y para que el diafragma equivalente est situado exactamente en
la misma posicin que la lente equivalente. El diagrama de la figura 5.14 indica claramente que el uso
del diafragma limita la energa total de luz incidente sobre el sensor. Esta representacin del efecto del
diafragma en la formacin de imgenes ser de gran trascendencia cuando consideremos sus efectos
sobre la profundidad de campo.

Fig. 5.14 Control de la cantidad de luz incidente en el sensor mediante el uso del diafragma.
Abierto Medio Cerrado Abierto Medio Cerrado
Eje de la lente
lente
Objeto A
Imagen A
Diafragma
abierto
Eje de la lente
lente
Objeto A
Imagen A
Diafragma
cerrado
Eje de la lente
lente
Objeto A
Imagen A
Diafragma
abierto
Eje de la lente
lente
Objeto A
Imagen A
Diafragma
cerrado
5 Cmaras 399
La apertura del diafragma se indica mediante la apertura numrica (N.A) o los nmeros f. Estos se
obtienen como el cociente entre el dimetro del diafragma y la distancia focal. As:

diafragma
D
F
f = nmero (5.10)

De este modo, un nmero f igual a 4 significa que el dimetro del diafragma es 4 veces menor que la
distancia focal. Esta relacin se indica de forma esquemtica en la figura 5.15.

Fig. 5.15 Relacin entre nmeros f, apertura del diafragma y distancia focal

Los nmeros f no pueden variarse de forma continua, sino mediante una secuencia discreta que toma
los valores 1,4; 2; 2,8; 4; 5,6; 8; 11; 16; 22; 32; etc. El nmero ms pequeo indica la apertura
mxima de la lente y es variable en funcin de la calidad del objetivo. Pueden encontrarse objetivos
que empiezan la secuencia en 1,8; 2,8; 4; etc., u otros con menor apertura que siguen la secuencia 3,5;
5,6; 8; etc. La relacin entre un nmero f y el siguiente es de aproximadamente la raz de 2. Esto
significa que el dimetro del diafragma se reduce en un factor de 1,41 entre pasos sucesivos, lo que
equivale a que la superficie de la apertura del diafragma se reduzca en un factor 2 (la apertura es
circular por lo viene dada por (D/2)
2
). Segn esta relacin, la cantidad de luz que pasa a travs del
objetivo para dos pasos sucesivos del diafragma se reduce en la mitad. Esto puede parecer en principio
exagerado, pero est de acuerdo con las caractersticas del sistema visual humano que observar estos
cambios exponenciales como si fueran lineales. Algunas cmaras pueden modificar los pasos del
diafragma en pasos de 1/3 cuando trabajan en modo automtico. En modo manual, muchos fotgrafos
dejan la anilla selectora entre dos pasos para ajustar la cantidad de luz de forma ms precisa.

El coste de un objetivo est muy relacionado con su apertura mxima, sobre todo cuando la distancia
focal es grande. La razn de este aumento de coste se debe a que para conseguir aperturas grandes
debe aumentarse el dimetro de las lentes, resultando ms costoso reducir las aberraciones que pueden
aparecer en la periferia.

El obturador tambin realiza el control del tiempo de exposicin en pasos discretos, que varan en
factores de 2. Como en el caso del diafragma, esto significa que entre dos pasos consecutivos la
cantidad de luz incidente en el sensor se reduce a la mitad. El efecto sobre la imagen es, no obstante,
F
4f
F
4f
lineal y gradual. Las velocidades de obturacin se indican en fracciones de segundos o directamente
en segundos, dependiendo de si el tiempo de exposicin es inferior o superior al segundo. As, una
velocidad de 250 significa que el tiempo de exposicin es de 1/250.

La secuencia de velocidades de obturacin utilizada en cmaras de fotografa es: 8000, 4000, 2000,
1000, 500, 250, 125, 60, 30, 15, 8, 4, 2, 1'', 2'', 4'', 8'', ..., bulb. Las velocidades de 1/8000 o 1/4000
slo se consiguen con las cmaras de fotografa ms avanzadas. El modo bulb se utiliza para tiempos
de exposicin muy prolongados y consiste en mantener abierto el obturador durante todo el tiempo
que se mantenga pulsado el disparador.

Resulta indiscutible que si el tiempo de exposicin es muy prolongado y existen objetos mviles en la
escena este movimiento quedar registrado en el sensor. La pelcula fotogrfica o el sensor CCD se
comportan como un integrador de luz, de modo que registran todos los movimientos que ocurren en la
escena durante el tiempo en que el obturador permanece abierto. Por lo tanto, es importante evaluar el
movimiento de los objetos de la imagen si queremos tener la garanta que la toma ser correcta. Para
tiempos de exposicin de 1/30 o mayores, empieza a apreciarse el propio movimiento de la mano y es
aconsejable utilizar un trpode para mantener la cmara estacionaria. En la fotografa de escenas
deportivas, donde existe un movimiento considerable resulta aconsejable aumentar en lo posible la
velocidad del obturador. La prdida de luz puede compensarse abriendo el diafragma.

Pueden realizarse exposiciones intencionadamente lentas para conseguir efectos artsticos. Entre los
ms conocidos destacan las fotografas de saltos de agua, que si se registran con velocidades lentas
producen un efecto espumoso, mientras que si se capturan con velocidades altas podrn apreciarse con
nitidez las gotas de agua. En la fotografa de pruebas de motociclismo o automovilismo pueden usarse
velocidades deliberadamente lentas y seguir con la cmara el movimiento del objeto mientras se
realiza la fotografa. El efecto es que el sujeto mvil aparece ntido, mientras el fondo registra el
movimiento de la cmara, produciendo una agradable sensacin de movimiento. Otros efectos tpicos
obtenidos con velocidades lentas son las fotografas de fuegos artificiales o las fotografas nocturnas
de calles, donde quedan registradas las luces de los automviles durante la circulacin.

Las velocidades de 1/60 y 1/30 pueden utilizarse para capturar imgenes de un televisor en aquellos
pases que utilizan el sistema NTSC (frecuencia de campo de 60 Hz). Con estas velocidades el haz del
receptor de televisin realizar uno o dos barridos completos de la pantalla, de modo que las imgenes
resultantes quedarn registradas en la pelcula. Es obvio que si la cmara no est sincronizada con el
receptor, los dos barridos pueden corresponder a fotogramas distintos dentro de la secuencia de vdeo,
observndose el posible desplazamiento entre los dos fotogramas. Si utilizamos una velocidad de
obturacin de 1/60 en el sistema de televisin PAL (con 50 Hz de frecuencia de campo), el haz no
tendr tiempo de explorar toda la pantalla, con lo que observaremos una parte de la pantalla del
televisor en negro. Si se usa la velocidad de 1/30, el haz no habr tenido tiempo de realizar dos
barridos completos, por lo que la zona de la pantalla donde se han producido dos exploraciones
aparecer ms brillante que la zona donde el haz slo ha pasado una vez.

No obstante, es posible realizar fotografas de calidad de imgenes estticas en la pantalla de un
ordenador (p.ej. diapositivas de una presentacin). Para ello deberemos seleccionar una velocidad de
exposicin lenta (alrededor de 1" o 1/2''), con lo que conseguiremos que el haz pase varias mientras se
registra la imagen. Si la cmara permanece inmvil durante la exposicin, la imagen quedar ntida.
5 Cmaras 401
Para poder realizar las fotografas con estos tiempos de exposicin tan lentos ser necesario reducir el
brillo de la pantalla, cerrar el diafragma y posiblemente trabajar con pelcula de baja sensibilidad. Por
el contrario, si se reduce el tiempo de exposicin a unos pocos cuadros, suelen aparecer problemas de
diferencias de iluminacin, debido a que una zona de la imagen ha sido explorada una vez menos que
la otra.

El obturador en cmaras reflex es un elemento opaco situado por delante de la pelcula que se retira al
realizar la fotografa. En el momento de pulsar el disparador se levanta el espejo del visor, se cierra el
diafragma a la apertura seleccionada y, finalmente, se abre el obturador durante el tiempo de
exposicin. Cuando este ltimo se ha cerrado, el espejo y el diafragma vuelven a sus condiciones de
reposo. El mecanismo de apertura del obturador debe tener una gran precisin para garantizar que los
tiempos de exposicin son los correctos. Adems, debe tratarse de un sistema fiable y que pueda
usarse prolongadamente sin ningn deterioro. Las altas velocidades de 1/8000 o 1/4000 exigen unos
movimientos extremadamente rpidos que slo pueden obtenerse a travs de artilugios mecnicos de
gran precisin.

La tecnologa ms utilizada para realizar el control del tiempo de exposicin es el obturador de doble
cortinilla. Su principio de funcionamiento se ilustra en la figura 5.16, donde se indica la presencia de
dos cortinillas opacas que circulan desde arriba hacia abajo (existen modelos donde las cortinillas van
desde la izquierda hacia la derecha) a una velocidad constante, pero no excesivamente rpida, para
poder garantizar que el mecanismo tenga una vida prolongada. La primera cortinilla destapa la
pelcula, mientras que la segunda, que se dispara con un retardo igual al tiempo de exposicin, vuelve
a tapar la pelcula. Para tiempos de exposicin moderados o lentos, la primera cortinilla llega a
destapar toda la pelcula antes de que se dispare la segunda. Con ello, todo el fotograma es expuesto a
la luz de forma prcticamente simultnea. No obstante, para velocidades altas, la segunda ventanilla se
dispara mientras la primera an est destapando una parte de la pelcula. El resultado es que entre las
dos cortinas existe una rendija a travs de la cual se expone a la luz el negativo. Esta rendija se
desplaza de arriba hacia abajo a la misma velocidad que las cortinillas y su distancia (D) depende del
tiempo de exposicin. Para tiempos de exposicin muy pequeos, la distancia entre las cortinillas es
extremadamente reducida. En consecuencia, todas las partes de la pelcula quedan expuestas durante
el tiempo deseado con un mecanismo sencillo y de elevada fiabilidad.

Fig. 5.16 Mecanismo de doble cortinilla para el control del tiempo de exposicin

V
Cortina 1
Cortina 2
V D
Zona
expuesta
V
Cortina 1
Cortina 2
V D
Zona
expuesta
El sistema de doble cortinilla supone que cuando trabajamos con tiempos de exposicin de muy
pequeos no todas las partes del negativo son expuestas a la luz simultneamente, sino que ste se va
descubriendo a la misma velocidad que las cortinas. No obstante, este efecto resulta imposible de
apreciar en la prctica. La doble cortinilla permite obtener velocidades de obturacin de hasta 1/1000
o 1/2000. Las velocidades superiores suelen obtenerse con sistemas ms sofisticados de mltiples
cortinillas.

En cmaras de vdeo o fotografa digital, donde se utiliza un sensor de estado slido, el tiempo de
exposicin suele regularse de forma electrnica, sin necesidad de interponer pantallas opacas delante
del sensor. La obturacin electrnica consiste en mantener las condiciones de adquisicin de la CCD
slo durante el periodo de tiempo en que se desea realizar la exposicin. Con esta tecnologa se
simplifican notablemente los aspectos mecnicos de la cmara y pueden obtenerse tiempos de
exposicin extremadamente cortos, del orden de 1/50.000.

Las cmaras de vdeo no permiten, como resulta obvio, utilizar tiempos de exposicin mayores al
periodo de campo. Normalmente, la adquisicin de cada uno de los campos se realiza de forma
secuencial, es decir, realmente cada campo corresponde a una imagen distinta, tomada a doble
velocidad y se van alternando las lneas. Esto restringe que el valor mximo del tiempo de exposicin
coincida con el periodo de campo. En las cmaras del sistema PAL se sustituyen las velocidades de
1/60 por la de 1/50 y, habitualmente, tambin se incluye la velocidad de 1/100. Algunas cmaras de
vdeo digital permiten que puedan utilizarse velocidades de obturacin por debajo de la frecuencia de
campo, utilizando tiempos bastante ms bajos, para poder operar en condiciones de muy baja
iluminacin. En este caso se realiza un tratamiento digital de la seal de vdeo en el que se reduce la
frecuencia de muestreo de las imgenes. La seal PAL que se proporciona en la salida sigue teniendo
25 imgenes por segundo, aunque algunas de ellas son obtenidas como repeticin de las anteriores.

5.3.6 Profundidad de campo
La profundidad de campo es una medida del margen de distancias, alrededor del objeto de inters,
donde puede considerarse que los objetos an permanecen enfocados. Este concepto se representa
esquemticamente en la figura 5.17, donde suponemos que la lente enfoca al objeto situado en el
punto A. Existir un margen de distancias por delante y por detrs de este objeto en las que podemos
considerar que se mantiene un enfoque ms o menos correcto de la imagen.

Fig. 5.17 La profundidad de campo indica el rango de distancias en el que los objetos permanecen enfocados
Sensor
Imagen
Profundidad
de campo
A
Sensor
Imagen
Profundidad
de campo
A
5 Cmaras 403
El concepto de la profundidad de campo resulta difuso y difcil de cuantificar. De hecho, desde un
punto de vista terico, todos los objetos que no estn exactamente sobre el plano del objeto estn
desenfocados y los lmites para indicar el grado de desenfoque dependen, como veremos, de muchos
factores. En la figura 5.18 se muestra un ejemplo de cmo se forma la imagen de un objeto que est
fuera de enfoque. El sensor est situado sobre el plano de imagen del objeto A. El objeto B, que est
situado por delante de A, tendr una imagen que se situar por detrs del plano de imagen. La imagen
que captaremos en el sensor es un crculo cuyo dimetro ser tanto ms pequeo cuanto ms prximos
estn los dos objetos. Este crculo se denomina crculo de ambigedad o de confusin y su dimetro es
una medida del grado de desenfoque de la imagen. La profundidad de campo est directamente
relacionada con el grado de definicin o nitidez de las imgenes. Si una escena se registra con poca
profundidad de campo slo queda ntido el motivo principal, mientras que todos los dems objetos
permanecern borrosos. En principio es deseable que la profundidad de campo sea lo mayor posible
para que aparezcan el mximo de objetos bien definidos. No obstante, es habitual que el fotgrafo
fuerce la toma de imgenes con poca profundidad de campo para centrar la atencin en el sujeto
principal.

Fig. 5.18 Formacin de imgenes de puntos desenfocados y crculo de confusin

El grado de desenfoque depende de varios factores que vamos a analizar con cierto detalle. En primer
lugar debe considerarse el tipo de sensor utilizado. En efecto, en pelculas de gran sensibilidad el
grano del material fotosensible es considerablemente mayor que en pelculas de baja sensibilidad. Es
razonable, por tanto, que aparezcan ntidos los objetos que, an no estando correctamente enfocados,
tengan un crculo de confusin del mismo orden que el grano del negativo (casi tan ntidos como los
que estn enfocados). El tamao del sensor tambin desempea un papel importante, ya que las copias
debern ampliarse ms o menos, con lo que el crculo de confusin tendr mayor o menor
importancia. En sensores de estado slido, es evidente que el crculo de confusin no tendr ningn
efecto sobre la imagen, mientras no supere la distancia entre pxeles consecutivos.

El poder de resolucin del grupo ptico tambin incide sobre la profundidad de campo. En un grupo
ptico de baja calidad, la profundidad de campo es aparentemente superior debido a la propia falta de
nitidez de los objetos que estn correctamente enfocados. Podemos concluir, por tanto, que el crculo
Sensor
I magen
A
enfocado
B
desenfocado
Sensor
I magen
A
enfocado
B
desenfocado
de confusin no tendr mayor importancia si tiene un dimetro inferior al poder de resolucin del
grupo ptico.

La profundidad de campo tambin depende de la distancia a la que se encuentre el objeto al que
enfocamos. Si el objeto est prximo a la lente, cualquier pequea variacin de su posicin provocar
que el plano de imagen vare considerablemente su posicin. En la figura 5.19 se representan los
crculos de ambigedad de un objeto B, que est siempre a la misma distancia del objeto A. En el
primer caso, el objeto A est situado prximo a la lente, mientras que en el segundo est alejado.

Fig. 5.19 Efecto de la distancia de los objetos en la profundidad de campo

Otro de los factores que inciden directamente sobre la profundidad de campo es la distancia focal de la
lente. En la figura 5.20 se representa esquemticamente esta dependencia para dos objetos situados a
una distancia invariable de la lente y donde nicamente se modifica la distancia focal. La profundidad
de campo es mucho mayor en lentes con una distancia focal reducida.

La apertura del diafragma tambin tiene un efecto directo sobre la profundidad de campo.
Comprender la relacin entre ambos factores es sumamente importante en fotografa y vdeo, puesto
que a menudo suelen combinarse los ajustes de tiempo de exposicin y diafragma para conseguir los
efectos de profundidad de campo y movimiento de objetos deseados. La dependencia de la
profundidad de campo con la apertura del diafragma se ilustra en la figura 5.21. En este caso los dos
objetos estn situados a una misma distancia de la lente y se utiliza una misma distancia focal. Cuando
se cierra el diafragma se reduce el volumen de rayos que intervienen en la formacin de punto imagen,
por lo que el crculo de ambigedad se reduce.
Sensor
Imagen
A
enfocado
B
Sensor
Imagen
A
enfocado
B
Sensor
Imagen
A
enfocado
B
Sensor
Imagen
A
enfocado
B
5 Cmaras 405

Fig. 5.20 Dependencia de la profundidad de campo con la distancia focal

Fig.5.21 Relacin entre diafragma y profundidad de campo
Sensor
I magen
A
enfocado
B
Sensor
I magen
A
enfocado
B
Sensor
I magen
A
enfocado
B
Sensor
I magen
A
enfocado
B
Sensor
I magen
A
enfocado
B
Diafragma muy abierto
Sensor
I magen
A
enfocado
B
Diafragma cerrado
Sensor
I magen
A
enfocado
B
Diafragma muy abierto
Sensor
I magen
A
enfocado
B
Diafragma cerrado
A modo de sntesis sobre los efectos del diafragma y el obturador en la calidad final de la imagen,
podemos concluir que la prdida de nitidez puede ser debida, bien a que el objeto no est
correctamente enfocado (fuera de campo), o a que el propio movimiento del objeto produce un
desenfoque por tiempo de integracin. Ambas prdidas de definicin son contrapuestas, ya que si
queremos reducir el desenfoque por integracin debe disminuirse el tiempo de exposicin, lo que, para
mantener la luz total que incide sobre el sensor, exige aumentar la apertura del diafragma, con la
consiguiente prdida en profundidad de campo. As, si damos prioridad a la velocidad del obturador
para garantizar que no aparecen imgenes borrosas originadas por el movimiento de los objetos o de la
cmara, deberemos aceptar una reduccin en la profundidad de campo. Por el contrario, si deseamos
obtener una gran profundidad de campo, deberemos cerrar el diafragma, por lo que es posible que los
objetos que tienen un movimiento elevado aparezcan borrosos.

Una alternativa para mejorar la profundidad de campo y reducir el enfoque por movimiento consiste
en aumentar la sensibilidad del sensor. Con ello se requiere menor cantidad de luz para una exposicin
correcta, con lo que puede trabajarse con aperturas y tiempos de exposicin ms pequeos. No
obstante, la reduccin de la sensibilidad de la pelcula supone un aumento del grano de la pelcula
(prdida de resolucin espacial) y una prdida en colores puros. En sensores CCD puede aumentarse
la ganancia de la seal electrnicamente, pero esto produce un aumento del ruido en la imagen.

Si la sensibilidad del sensor es fija, las condiciones de iluminacin son las que determinan la fraccin
de luz que debemos dejar pasar hacia el sensor. Por lo tanto, en condiciones de iluminacin diurna
resultar ms fcil obtener fotografas ntidas que en condiciones de baja iluminacin.

Las cmaras econmicas que no disponen de la capacidad de enfocar las imgenes suelen utilizar
aperturas de diafragma muy pequeas y pticas de gran angular. Ambos factores tienden a aumentar la
profundidad de campo del fotograma, por lo que, si el sensor est situado sobre el plano focal, todas
las imgenes que estn a una cierta distancia de la cmara quedarn correctamente enfocadas. No
obstante, el problema inherente a este tipo de cmaras es que slo pueden trabajar en condiciones de
fuerte iluminacin.

Es posible cuantificar las relaciones entre todos estos parmetros y su incidencia sobre la profundidad
de campo. Las ecuaciones ms utilizadas para estimar la profundidad de campo vienen dadas en
funcin del parmetro p que se define como:

b
H
W
N
f
p
H

=
) 2 / ( tan 4
2
(5.11)

donde el nmero f representa la apertura del diafragma,
H
el ngulo de visin horizontal, W/H la
relacin de aspecto, b la anchura del sensor y N la resolucin vertical del sensor (nmero de lneas que
pueden representarse).

La profundidad de campo disminuye cuando p tiende a cero y aumenta si p crece. La ecuacin 5.11
relaciona como incide cada uno de los parmetros que hemos mencionado sobre la profundidad de
campo. As, un aumento del nmero f o del ngulo de visin (disminucin de la distancia focal)
produce un incremento de la profundidad de campo. Anlogamente, un aumento de la sensibilidad del
5 Cmaras 407
sensor representa una disminucin de la profundidad de campo. El nico parmetro que parece
contradictorio con los comentarios que hemos realizado es que un aumento del tamao del sensor (b)
parece conducir a una disminucin de la profundidad de campo. Para resolver esta aparente
contradiccin es conveniente expresar el ngulo de visin en funcin del tamao del sensor y de la
distancia focal:

( )
=
H
W
F N
b f
p
F
b
H
2
2
2 / tan (5.12)

donde ahora resulta evidente que un aumento del tamao del sensor conduce a una mejora de la
profundidad de campo.

El parmetro p puede relacionarse con la distancia del objeto ms prximo y ms lejano que
permanecern enfocados. De acuerdo con el esquema de la figura 5.22, las distancias entre la lente y
los lmites de la profundidad de campo vienen dados por:

a p
a
a
a p
a
a
F V

=
+
=
1 1
(5.13)

lo que resulta en una profundidad de campo total:

2 2
2
1 a p
a p
a a a
V F campo

= = (5.14)

que nos relaciona la profundidad de campo con la distancia del objeto y el parmetro p. Es usual que
los objetivos de las cmaras incorporen en el propio anillo de diafragmas y rueda de enfoque una tabla
simplificada que indica la profundidad de campo en metros y en pies.

Fig. 5.22 Clculo de los lmites de la profundidad de campo

Evidentemente, las ecuaciones 5.13 y 5.14 slo tienen sentido para denominadores positivos, puesto
que en caso contrario no se producen imgenes reales sobre el sensor. Por otra parte el parmetro p es
a
a
V
a
F
lente p. campo (a
campo
)
a
a
V
a
F
lente p. campo (a
campo
)
generalmente pequeo y menor que la unidad, lo que conduce a que la profundidad de campo aumente
cuando p crece. En la figura 5.23 se muestra la relacin entre a
campo
y p en la regin de validez de este
ltimo.

Fig. 5.23 Relacin entre profundidad de campo y parmetro p

5.4 Fotometra
La medida de la cantidad de luz en una escena es fundamental para determinar el tiempo de
exposicin y la apertura del diafragma, con el que conviene realizar la toma de imgenes.
Prcticamente todas las cmaras actuales incorporan un fotmetro o exposmetro que realiza los
clculos automticos de la apertura y diafragma con el que se recomienda tomar la escena. Estos
exposmetros permiten seleccionar el tipo de medicin que se desea realizar: global, para toda la
imagen que se observa en el visor, o de una zona o regin pequea de la imagen, o incluso de un nico
punto de la escena. Estos exposmetros tambin pueden trabajar con prioridad de velocidad o de
diafragma. En el primer caso, el fotgrafo especifica la velocidad de obturacin con la que desea
realizar la toma y el sistema calcula automticamente, en funcin de la sensibilidad del sensor, el
diafragma adecuado. En el modo de prioridad de diafragma se determina automticamente la
velocidad de exposicin en funcin de la apertura seleccionada.

Las unidades fotomtricas tambin se utilizan para especificar la sensibilidad de los sensores de
imagen basados en tubos de imagen o clulas CCD, que generalmente se proporcionan en el mnimo
nmero de lux con el que pueden trabajar. En el caso de pelcula fotosensible la sensibilidad se suele
expresar en unidades ASA (American Standard Association), que actualmente ya son de carcter
universal (ISO). Una sensibilidad de 100 ASA permite realizar tomas en condiciones de luz ambiental
0 0.2 0.4 0.6 0.8 1
0
0.5
1
1.5
2
2.5
3
3.5
4
Parmetro p
P
r
o
f
u
n
d
i
d
a
d

d
e

c
a
m
p
o
0 0.2 0.4 0.6 0.8 1
0
0.5
1
1.5
2
2.5
3
3.5
4
Parmetro p
P
r
o
f
u
n
d
i
d
a
d

d
e

c
a
m
p
o
5 Cmaras 409
diurna. Doblar el nmero de ASA de la pelcula significa doblar su sensibilidad, lo que permite
aumentar en un paso o la apertura del diafragma o la velocidad de obturacin. El aumento de la
sensibilidad de la pelcula supone, por lo general, una reduccin de la resolucin espacial (menor
detalle) y una prdida en matices y pureza de color. Casi todas las cmaras modernas incorporan un
lector de sensibilidad de la pelcula y realizan los clculos de exposicin y apertura en funcin de sta.

En este apartado se exponen las unidades bsicas que se utilizan para medir la intensidad o energa de
la luz. El objetivo es comprender las relaciones bsicas entre las unidades ms utilizadas para medir la
intensidad luminosa (candela), el brillo, el flujo luminoso (lumen), y la iluminancia de los objetos
(lux). Estas unidades se utilizan para especificar las caractersticas de iluminacin de focos de luz,
monitores, iluminacin incidente en los objetos de una escena e iluminacin recibida. Su uso y sus
relaciones resultan a menudo confusos.

5.4.1 Intensidad luminosa: la candela
La intensidad luminosa proporcionada por una fuente puntual en cada direccin del espacio se mide
en candelas. La definicin formal de esta unidad establece que una candela (en la direccin ) se
corresponde con una fuente de luz monocromtica de 540x10
12
Hz que tiene una intensidad radiante
en esa direccin de 1/683 Vatios (Watts) por estereorradin. Esta definicin es bastante confusa y
vamos a intentar esclarecer su significado examinando con detalle cada uno de los parmetros que
intervienen y su interpretacin en casos prcticos.

Histricamente, la definicin de candela se basaba en la luz que emita una llama. Posteriormente se
redefini en funcin del brillo emitido por 1 cm
2
de platino fundido solidificndose. Actualmente se
define como la potencia radiada en Vatios por una fuente de luz monocromtica a la frecuencia de
540x10
12
Hz. Esta frecuencia se corresponde con la longitud de onda de 555 nm, en la que el sistema
visual humano medio presenta una mayor sensibilidad en condiciones de luz diurna. El uso de la
frecuencia en vez de la longitud de onda pretende que la definicin de la unidad sea independiente del
medio de transmisin (la frecuencia no vara con el medio de transmisin pero la longitud de onda s).

El uso de 1/683 Watts para definir una unidad de candela se debe a la intencin de la nueva definicin
de candela coincidiera, aproximadamente, con la antigua (intensidad emitida por 1 cm
2
de platino
fundido).

La intensidad luminosa se mide en funcin de la potencia transmitida por ngulo slido. Con ello se
pretende que la medida caracterice la fuente de luz independientemente de la distancia a la que es
observada. La unidad de ngulo slido es el estereorradin, que se define como el ngulo subtendido
por un cono que parte de la fuente de luz e intersecta a la esfera de radio unidad en una superficie de 1
m
2
. En la figura 5.24 se representa esquemticamente esta unidad. El ngulo slido subtendido por
cualquier otra porcin de superficie situada sobre la circunferencia unidad puede determinarse
directamente mediante proporcionalidad. As, una superficie de 0,25 m
2
sobre la esfera unidad
equivale a un ngulo subtendido de 0,25 estereorradianes. Segn esta definicin, es evidente que la
esfera de radio unidad completa, que tiene un rea de 4, subtiende un ngulo slido de 4
estereorradianes. Los ngulos subtendidos por superficies que no se encuentran sobre la esfera unidad
pueden determinarse proyectando la superficie de inters sobre la fuente de luz y calculando el rea
resultante cuando esta proyeccin intersecta sobre la esfera unidad. Los detalles asociados a este tipo
de clculos se ilustran en la figura 5.25, donde se considera la proyeccin de un diferencial de
superficie situado a una distancia R del foco de luz y que forma un ngulo con el vector unitario en
la direccin radial. El diferencial de ngulo slido subtendido por esta superficie viene dado por:

2 2
cos
4
cos
4
R
dS
R
dS
d

=

= (5.15)

Fig. 5.24 Definicin de estereorradin

Fig. 5.25 Clculo del ngulo subtendido por un diferencial de superficie situado a una distancia R

La candela es una unidad que se utiliza para definir las caractersticas de distribucin direccional de la
luz emitida por una fuente puntual. Los fabricantes de lmparas, focos o reflectores suelen
proporcionar un diagrama direccional que indica cmo se distribuye la energa luminosa en el espacio.
R = 1 m
S = 1 m
2
Angulo Slido
1 estereoradian
R = 1 m
S = 1 m
2
Angulo Slido
1 estereoradian
Superfcie dS
R = 1 m
R
dS
dS cos
Superfcie dS
R = 1 m
R
dS
dS cos
5 Cmaras 411
En la figura 5.26 se representa uno de estos diagramas, cuya interpretacin resulta bastante simple. En
este ejemplo, la intensidad luminosa en la direccin de 60 es de aproximadamente 300 cd. Esto
significa que si nos situamos a una cierta distancia R de la fuente de luz en esta direccin y medimos
la potencia que se recibe en una superficie dS, el resultado que obtendremos es:

( ) ( ) ( ) ( ) W
683
cos 300
sr
cos
W/sr
683
1
300 cd 300
2 2
R
dS
R
dS
d dP
= = (5.16)

La correcta interpretacin de estos clculos proporciona mucha informacin sobre el significado de la
candela como unidad de medida de la intensidad lumnica. Debe tenerse en cuenta que en esta
ecuacin el ngulo representa el ngulo existente entre la perpendicular a la superficie en la que se
realiza la medida y la direccin radial. Si suponemos que la superficie est orientada hacia la fuente la
ecuacin puede simplificarse a:

( )
( )
) W (
683
2
R
dS C
dP

= (5.17)

donde hemos supuesto que C() representa el diagrama de intensidad luminosa expresado en
candelas. El factor 683 que aparece en el denominador realiza la conversin a Vatios de la potencia
lumnica. De acuerdo con esta ecuacin, la potencia recibida en la superficie de medida disminuye a
medida que nos alejamos de la fuente. Esto es debido a que el ngulo slido subtendido por la
superficie tambin disminuye. Si aumentramos la superficie a medida que nos alejamos de la fuente,
de manera que el ngulo slido se mantuviera constante, la potencia recibida en la superficie tambin
se mantendra constante. Esto indica que la radiacin luminosa se dispersa a medida que nos alejamos
del punto emisor de luz. C() caracteriza por tanto la intensidad luminosa que radia la fuente sin tener
en cuenta los efectos de la distancia ni las caractersticas de la superficie sobre la que incide la luz.

Fig. 5.26 Representacin del diagrama de intensidad luminosa en candelas de una fuente de luz

Anlogamente, podemos determinar C() a partir de las medidas que obtengamos en el sensor de
potencia lumnica simplemente despejando esta funcin en la ecuacin (5.17). Si el sensor tiene una
fuente
ngulo candelas
200
300
30
45
60
fuente
ngulo candelas
200
300
30
45
60
superficie total equivalente S
sensor
y mide una potencia P expresada en Vatios, la intensidad luminosa
C() que obtendremos cuando realizamos la medida desde una distancia R, con el sensor
correctamente orientado hacia la fuente es:

sensor
S
R P
C
2
683
) (

= (5.18)

Hemos visto que la candela est definida para radiaciones monocromticas en la regin de mxima
sensibilidad del sistema visual. No obstante, la mayora de fuentes luminosas son espectralmente
complejas, por lo que es necesario tener en cuenta todas las componentes espectrales radiadas para
que la medida sea indicativa de la iluminacin real que produce la fuente. La forma de tener en cuenta
las diferentes componentes espectrales en que se descompone una fuente de luz real es ponderar su
energa mediante la respuesta de sensibilidad relativa del ojo humano medio. Esta curva est
especificada y tabulada por el CIE (International Commission of Ilumination) y tiene una forma
parecida a la de la figura 5.27. Segn esta curva, una fuente que radie a una frecuencia monocromtica
de 510 nm (verde) tiene un rendimiento visual del 50% respecto a la frecuencia de 555 nm. Esto
significa que deber radiar el doble de potencia en Vatios para producir las mismas candelas. Todas
las medidas fotomtricas tienen en cuenta la respuesta psicofsica del sistema visual humano, por lo
que no proporcionan una medida absoluta de la energa lumnica, sino de su percepcin. Segn lo
expuesto, podramos modificar la ecuacin (5.18) para tener en cuenta las fuentes no monocromticas
sino que radian un espectro de potencia P(). La ecuacin resultante sera:

=
visible
sensor
d F P
S
R
C ) ( ) (
683
) (
2
(5.19)

donde F() representa la curva de sensibilidad relativa del sistema visual humano representada en la
figura 5.27.

Fig. 5.27 Respuesta de sensibilidad relativa del sistema visual humano
Sensibilidad
relativa
100 %
50 %
0 %
400 nm 720 nm
555 nm
amarillo
610 nm
naranja
510 nm
verde
Sensibilidad
relativa
100 %
50 %
0 %
400 nm 720 nm
555 nm
amarillo
610 nm
naranja
510 nm
verde

5 Cmaras 413
La luz es una radiacin electromagntica y, como tal, su potencia y energa puede ser medida con
unidades de radiacin convencionales. Esta forma de medir la intensidad, potencia y energa de las
fuentes luminosas se conoce con el nombre de medidas radiomtricas y, en contraposicin con las
medidas fotomtricas que estamos presentando, no tienen en cuenta la respuesta del sistema visual.

La definicin de la intensidad luminosa como candela supone que la fuente de luz es puntual o de
reducido tamao. El flujo de energa se define en funcin del ngulo slido y, como hemos visto, es
independiente de la distancia desde la que se realiza la medida. Si la fuente es puntual, la sensacin de
brillo (cuantificada como luminancia) que produce al observarla desde una cierta distancia puede ser
muy fuerte, aunque su intensidad luminosa sea slo de una candela. En cambio, si el tamao de la
fuente es algo mayor, aunque su energa total sea la misma, producir una sensacin de brillo ms
moderada. El brillo o luminancia de una fuente se mide en candelas por metro cuadrado (cd/m
2
), de
este modo, se tiene en cuenta la superficie real de la fuente de luz. Debe observarse que, en general,
cualquier objeto visible puede interpretarse como una fuente de luz, independientemente de que
realmente acten como fuentes de luz o que reflejen la luz procedente de otro foco. De acuerdo con
ello, el brillo o luminancia de un objeto depende de la iluminacin a la que est expuesto y de sus
caractersticas para absorber y reflejar la luz.

5.4.2 El flujo luminoso: lumen
Hemos visto que la candela, al ser independiente de la distancia, puede interpretarse como una
propiedad de la fuente de luz. Por tanto, se requiere una unidad distinta para reflejar la luz que fluye
en el espacio y que finalmente incide sobre los objetos o los sensores. Esta unidad es el lumen (lm) y
de hecho ya la hemos estado utilizando cuando definamos la relacin entre la candela y la potencia
recibida por un sensor de luz situado a una cierta distancia de la fuente.

El flujo luminoso de una fuente cuya intensidad son C() candelas, en un ngulo slido d, viene
dado por:

= d C dF ) ( (5.20)

la unidad de medida es el lumen que resulta equivalente a una candela por estereorradin (cd sr).

Consideremos como ejemplo las dos fuentes de luz representadas en la figura 5.28. La primera fuente
radia una intensidad de una candela hacia todo el espacio situado frente a ella (la mitad de una esfera,
es decir, 2 estereorradianes). La segunda fuente tambin radia una intensidad de una candela, pero
distribuida nicamente sobre un ngulo slido frontal de 1 estereorradin. Si determinamos el flujo
total de la fuente radiado al espacio mediante la ecuacin (5.20), obtendremos que la primera fuente
emite un total de 2 lm mientras que la segunda emite nicamente 1 lm.

Una medida muy utilizada en catlogos de fuentes de luz son los lumen por Vatio (lm/W). Para una
fuente que radia en distintas longitudes de onda, esta medida proporciona una idea de la eficiencia
luminosa del dispositivo teniendo en cuenta la respuesta del sistema visual humano. As, las lmparas
de tungsteno, que se caracterizan por su luz clida (mucha componente roja), tienen una eficiencia
reducida (mucho consumo para la luminosidad que producen), debido a que la sensibilidad del sistema
visual humano a esta componente espectral es baja. En cambio, los fluorescentes radian mucha
energa en las componentes del amarillo, verde y rojo, por lo que tienen una elevada eficiencia en
lumen por Vatio.

Fig. 5.28 Relacin entre candela y lumen para fuentes directivas

5.4.3 La iluminancia: lux
La iluminancia se utiliza para determinar la densidad de energa lumnica que incide sobre un objeto y
se obtiene como el nmero de lumens por unidad de rea. La unidad de medida es el lux que es
equivalente a lm/m
2
. Puede calcularse directamente a partir del diagrama de la fuente y depende de la
posicin relativa entre la fuente y el objeto y su distancia. Cuando un objeto es iluminado por varias
fuentes, la iluminacin total se obtiene mediante la superposicin de todas la iluminaciones
individuales (suponemos que las fuentes de luz son incoherentes). Existen paquetes de software que
permiten determinar la iluminacin que reciben los objetos dentro de un recinto a partir de la
distribucin y las caractersticas de las fuentes de luz.

Consideremos como ejemplo el clculo de la iluminancia que reciben dos objetos A y B de una fuente
de luz como la representada en la figura 5.29. En este ejemplo, es evidente que el objeto B, al estar
situado fuera del diagrama de radiacin de la fuente, no recibir ninguna iluminacin. Para determinar
la iluminancia que recibe el objeto A deberemos tener en cuenta su distancia a la fuente y el rea del
objeto. El ngulo equivalente subtendido por el objeto es:

2 2
4
4
R
A
R
A
eq
=
= (5.21)

Para determinarlo hemos tenido en cuenta la proporcin entre el rea del objeto A y el rea de una
esfera situada a la misma distancia, de la que sabemos que tiene un ngulo subtendido equivalente de
4 estereorradianes. Una vez determinado el ngulo equivalente resulta trivial realizar el clculo del
flujo luminoso que incide sobre el objeto:
1 cd
1 cd
Fuente 1 Fuente 2
Radia uniformemente 1 cd
en un ngulo slido de 2
estereorradianes
LUMENS = 2
en un ngulo slido de 1,3
estereorradianes
LUMENS = 1,3
1 cd
1 cd
Fuente 1 Fuente 2
en un ngulo slido de 2
estereorradianes
LUMENS = 2
en un ngulo slido de 1,3
estereorradianes
LUMENS = 1,3
5 Cmaras 415
) lm ( ) (
2
R
A
C F
eq
= = (5.22)

donde no ha sido necesario realizar la integracin debido a que C() es constante en la regin de
inters. Finalmente, podemos determinar la iluminancia teniendo en cuenta el rea del objeto.

(lux)
1
2
R A
F
I = = (5.23)

Fig.5.29 Clculo de la iluminancia que reciben los objetos A y B

Es importante distinguir entre la iluminancia y la luminancia de un objeto. La primera est relacionada
con la cantidad de luz que incide sobre el objeto, mientras que la segunda es una medida de la
sensacin de brillo, por lo que depender tanto de la luz incidente como de las propiedades de
absorcin y reflexin de la luz del objeto. Para medir la iluminancia se utilizan sensores electrnicos
que evalan la cantidad de luz incidente sobre el objeto. Deben situarse por tanto en una posicin
prxima y orientarse paralelos al objeto. La luminancia se mide usando el mismo equipo, pero con la
superficie sensora encarada hacia el objeto. Entre ambas medidas hay un factor de escala y un cambio
de unidades.

Para medir la luminancia y la iluminancia de forma aproximada, puede utilizarse el exposmetro de
una cmara reflex automtica. Los lux pueden medirse colocando una hoja de papel o pantalla blanca
en el punto en que deseamos medir la iluminancia, para que refleje toda la luz. Dejando la cmara en
modo automtico podemos utilizar la siguiente ecuacin:

( )
pelcula osicin
ASA T f =
exp
2
/ 50 Lux (5.24)

0 cd
1 cd
Objeto A
A m
2
Objeto B
B m
2
Fuente de luz
0 cd
1 cd
Objeto A
A m
2
Objeto B
B m
2
Fuente de luz
donde tanto el nmero focal como el tiempo de exposicin se obtienen de los valores que ha ajustado
automticamente la cmara. La medida suele tener un error considerable debido a que los pasos de
nmeros f y tiempos de exposicin son logartmicos, pero proporciona una primera aproximacin a la
medida de la iluminancia. La medida de la luminancia en cd/m
2
puede obtenerse con una frmula
parecida:

( )
pelcula osicin
ASA T f =
exp
2
/ 4 , 12 Luminancia (5.25)

En este caso, no es necesario utilizar la superficie blanca, ya que lo que deseamos estimar es la
sensacin de brillo que producen los objetos. Si se dispone de una cmara que pueda realizar
mediciones puntuales de los ajustes del exposmetro, resulta muy fcil estimar a distancia la
luminancia de los distintos objetos de la escena.

5.5 Sensores de imagen de estado slido
Actualmente, casi todos los tipos de cmaras de vdeo o de fotografa digital utilizan sensores de
imagen de estado slido, tambin conocidos como dispositivos de acoplamiento de carga (CCD
Charge Coupled Device). Estos dispositivos empezaron a desarrollarse a principios de la dcada de
los 70 y aunque en sus inicios slo permitan obtener resoluciones bajas, actualmente se han
convertido en los sensores de imagen ms populares y casi han desplazado completamente otros tipos
de tecnologas. El principio de funcionamiento de los sensores CCD se basa en la estructura de los
condensadores MOSFET que se representa en la figura 5.30. El electrodo de polisilicio tiene
propiedades metlicas, pero, a diferencia de los condensadores MOSFET convencionales, es
transparente permitiendo el paso de la luz y la por tanto de generacin elctrica a partir de los fotones
incidentes sobre el semiconductor. El electrodo metlico est aislado del semiconductor tipo P
mediante una pelcula de dixido de silicio. Si se aplica una tensin positiva al electrodo, gran parte
de los electrones generados a partir de la descomposicin de un fotn en un par electrn-hueco se
concentrarn, por atraccin elctrica, bajo el electrodo positivo. Si no existiera esta tensin positiva
los electrones y los huecos se recombinaran dando lugar a una carga neta nula. En consecuencia, la
carga almacenada debajo del contacto de polisilicio es proporcional a la cantidad de luz incidente
sobre la superficie del electrodo.

La estructura bsica de una clula CCD consiste en una cadena de condensadores MOSFET, con un
substrato tipo N comn a todos ellos y situados suficientemente prximos como para que pueda
realizarse una interaccin entre las cargas a partir del control electrnico de las tensiones aplicadas a
los terminales. Es importante observar que la carga almacenada es un valor analgico que de alguna
manera deberemos extraer de la estructura CCD para obtener su valor. Las clulas CCD se usan en
multitud de aplicaciones, ya sea como dispositivos de almacenamiento de datos analgicos, memorias
digitales de alta capacidad, unidades de retardo analgicas o elementos sensores de imagen.
nicamente en este ltimo caso, los electrodos metlicos deben ser transparentes para permitir el paso
de la luz.

El control electrnico de un sensor de imagen del tipo CCD se realiza en dos fases: adquisicin de
imagen y lectura de datos. Las tensiones aplicadas a los electrodos durante la fase de adquisicin de
imagen se representa en la figura 5.31 para una clula CCD de tres fases (las ms populares). Ntese
5 Cmaras 417
que en esta configuracin se aplica tensin positiva a uno de cada tres terminales, de modo que las
cargas acumuladas quedan registradas bajo los contactos de estos electrodos. El tiempo durante el que
se aplican las condiciones de adquisicin de la imagen es equivalente al tiempo de exposicin del
sensor, ya que la carga total almacenada ser proporcional al valor medio de la luz incidente durante
este periodo de tiempo.

Fig. 5.30 Diagrama bsico de un condensador MOSFET usado en clulas CCD

Fig. 5.31 Estructura CCD durante la fase de adquisicin de imagen

Una vez registrada la luz incidente bajo la estructura CCD debe procederse a su lectura. El proceso de
lectura se realiza modificando las tensiones aplicadas sobre los terminales P1, P2 y P3, de forma que
externamente se provoca una transferencia de las cargas entre los condensadores adyacentes. Para que
Luz
Contacto metlico.
Polisilicio
Pelcula de
Dixido de
silicio
Semiconductor
Tipo N
-
-
-
-
+V
Luz
Contacto metlico.
Polisilicio
Pelcula de
Dixido de
silicio
Semiconductor
Tipo N
-
-
-
-
+V
+V +V +V +V 0 V 0 V 0 V 0 V 0 V 0 V 0 V
Tipo N
P1 P2 P3 P1 P2 P3 P1 P2 P3 P1 P2
- - - -
- - -
- - -
-
- - - - -
- - - -
- -
+V +V +V +V 0 V 0 V 0 V 0 V 0 V 0 V 0 V
Tipo N
P1 P2 P3 P1 P2 P3 P1 P2 P3 P1 P2
- - - -
- - -
- - -
-
- - - - -
- - - -
- -
la lectura sea factible es necesario incorporar en uno de los extremos de la CCD un elemento que
pueda sensar la cantidad de carga desplazada. La forma en que se realiza esta lectura de la carga se
representa tambin en la figura 5.32, donde se incluye un acabamiento con un dopado tipo P del
substrato de silicio. Esta terminacin resulta equivalente a un transistor MOSFET donde, ahora, la
tensin del penltimo electrodo acta como seal de puerta, permitiendo la lectura de la carga y su
posterior amplificacin.

Fig. 5.32 Desplazamiento de las cargas para la lectura de la CCD

El desplazamiento de la carga se obtiene aplicando seales de reloj externas a los electrodos de la
estructura. En la fase de adquisicin la carga se encuentra bajo los contactos P1, que estn a una
tensin positiva. Para desplazar la carga al contacto P2 se aplica una tensin positiva a este electrodo,
manteniendo constante la tensin del electrodo P1. Bajo estas condiciones, la carga almacenada bajo
el contacto P1 se reparte ahora entre los contactos P1 y P2. Si ahora bajamos la tensin del contacto
P1, toda la carga se situar bajo el terminal P2. De modo anlogo, es posible desplazar la carga de P2
a P3 y de P3 a P1, desplazndose todas las cargas hacia la derecha hasta que son ledas en la clula de
terminacin de la estructura.

Normalmente, las seales de reloj para la lectura de la CCD se proporcionan desde un circuito
integrado externo. Las cmaras actuales suelen integrar las funciones de relojes, drivers, control y
acondicionamiento de seales en circuitos integrados externos al sensor CCD. La generacin de las
seales de reloj para la lectura no es trivial y requiere un circuito integrado especializado para
proporcionar las formas de onda y niveles de tensin correctos. La mayora de cmaras operan con
bateras externas por lo que requieren diversos reguladores de tensin para generar internamente las
+V +V +V +V 0 V 0 V 0 V 0 V 0 V 0 V 0 V
Tipo N
- - - -
- - -
- - -
-
-- -- -
-- - -
- -
P
+V +V +V + V +V 0 V +V 0 V +V 0 V +V
Tipo N
- - - -
- - -
- - -
-
- - - - -
- - - -
- -
P
0 V 0 V 0 V 0 V +V 0 V +V 0 V +V 0 V +V
Tipo N
P
- - - -
- - -
- - -
-
-- -- -
-- - -
- -
+V +V +V +V 0 V 0 V 0 V 0 V 0 V 0 V 0 V
Tipo N
- - - -
- - -
- - -
-
-- -- -
-- - -
- -
P
+V +V +V + V +V 0 V +V 0 V +V 0 V +V
Tipo N
- - - -
- - -
- - -
-
- - - - -
- - - -
- -
P
0 V 0 V 0 V 0 V +V 0 V +V 0 V +V 0 V +V
Tipo N
P
- - - -
- - -
- - -
-
-- -- -
-- - -
- -
5 Cmaras 419
tensiones que requiere el desplazamiento de las cargas. En la figura 5.33 se representa un diagrama
bsico de las formas de onda que deben aplicarse a los terminales P1, P2 y P3 para el desplazamiento
de las cargas. El caso que hemos considerado corresponde a las CCD de tres fases (por las tres seales
de reloj independientes que son necesarias), Evidentemente, el desplazamiento de las cargas puede
realizarse hacia la derecha o hacia la izquierda sin ms que modificar la relacin entre las seales de
control. Existen configuraciones de CCD que pueden funcionar con dos fases de reloj, aunque su uso
se restringe a aplicaciones muy especficas.

Fig 5.33 Diagrama de las seales de lectura en una CCD de tres fases

Las aplicaciones de los dispositivos CCD para memorias analgicas o clulas de retardo tienen una
estructura anloga a la utilizada para los sensores de imagen. En este caso, no se permite que la luz
incida en el interior de la estructura y las cargas se introducen externamente mediante una
configuracin de transistor MOSFET similar a la que se utiliza para la lectura. Las memorias suelen
tener una configuracin FIFO (primer dato en entrar primero en salir), ya que los elementos de
entrada y salida de cargas se sitan en extremos opuestos. En las clulas de retardo el tiempo de
retardo puede controlarse a partir de la frecuencia de las seales de desplazamiento de cargas. Si se
aplican frecuencias altas, las cargas fluyen rpidamente entre el extremo de entrada y el de salida de la
CCD, dando lugar a un retardo pequeo entre entrada y salida.

La configuracin de CCD que hemos considerado hasta este momento se conoce como CCD de lnea
debido a que los sensores estn situados uno al lado del otro formando una lnea recta. Este tipo de
estructuras se utilizan en scanners, fotocopiadoras, faxes y las denominadas cmaras lineales, que se
utilizan en algunos sistemas de visin industrial por computador. Para obtener una imagen con este
tipo de dispositivos es necesario que exista un desplazamiento relativo entre el objeto y el sensor
CCD. La imagen se va explorando lnea a lnea y se reconstruye a partir del movimiento relativo
existente entre el sensor y el objeto. En la figura 5.34 se representa esquemticamente una CCD de
lnea donde cada cuadro representa un sensor de imagen y la terminacin representa el elemento de
lectura de la carga. Normalmente, se omite la representacin de las seales de reloj para la lectura.
P1
P2
P3
t
t
t
P1
P2
P3
t
t
t

Fig.5.34 Representacin de una CCD de lnea.

Uno de los problemas inherentes al procedimiento de lectura de la CCD es que si la estructura se
mantiene expuesta a la luz mientras se van desplazando las cargas, se va aadiendo una carga
remanente a medida que stas se desplazan hacia el terminal de lectura. El efecto es particularmente
notorio cuando existe un punto de luz de gran intensidad. En este caso, todas los elementos situados a
la izquierda de este punto de luz (suponemos que las cargas se desplazan hacia la derecha) adquirirn
una carga adicional cuando pasen por debajo del contacto expuesto a una gran intensidad lumnica. El
efecto se conoce con el nombre de smear y visualmente se observa como que el punto ms brillante
deja una estela de luz en todos los elementos de imagen situados a su izquierda y en su misma lnea.

En las cmaras de vdeo actuales los sensores CCD tienen una estructura matricial, de modo que
puede capturarse toda la imagen de forma simultnea sin necesidad de desplazar el sensor o el objeto.
En los apartados siguientes se analizan los tipos de CCD matriciales ms habituales. Tambin se
detallan los principios de algunas variantes tecnolgicas de los sensores CCD que estn emplendose
para la captura de imgenes.

5.5.1 Sensores CCD matriciales
Un sensor matricial est formado por una agrupacin de elementos CCD lineales dispuestos en forma
de una matriz, tal y como se ilustra en la figura 5.35. El grupo ptico se encarga de formar la imagen
sobre la superficie del sensor de modo que todos los elementos de la imagen son adquiridos
simultneamente. Una vez capturada la imagen, se efecta la lectura de la informacin desplazando
las cargas de cada CCD de lnea hacia la salida. Normalmente, la lectura debe realizarse de forma
coordinada con la seal de vdeo de salida, es decir, la lectura de una lnea debe realizarse en el
tiempo de lnea de la seal de vdeo y la adquisicin de una nueva imagen debe sincronizarse con el
periodo de borrado de campo. Esta restriccin impone una fuerte limitacin en cmaras de vdeo que
deben proporcionar una seal en tiempo real, ya que el sensor nicamente puede exponerse a la luz
cuando la imagen ha sido completamente leda, con lo que no podr iniciarse la adquisicin de un
nuevo campo hasta que se haya finalizado completamente la lectura del campo actual. Esta filosofa
de lectura exige que el tiempo de exposicin de la CCD sea inferior al tiempo total de borrado de
campo, de esta forma las imgenes pueden fluir a la misma velocidad que la seal de vdeo. Por lo
tanto, para cmaras de tipo PAL, el tiempo de exposicin mximo coincide con el periodo de borrado
Sensores de luz
Sensor de carga
reloj
Sensores de luz
Sensor de carga
reloj
5 Cmaras 421
de campo, es decir, (25/312,5)*40ms = 3,2 ms. Adems, debe incorporarse un obturador mecnico
que impida que la luz incidente modifique parte de la informacin de la imagen mientras se est
realizando la lectura. El uso del obturador mecnico impide que aparezca el efecto de smear en la
imagen que estara presente si los contactos no estuvieran protegidos de la luz.

Este tipo de sensores se utiliza a menudo en aplicaciones de captura de imagen en las que no se
requiere proporcionar una seal de vdeo en tiempo real, sino un nico fotograma. Las aplicaciones
ms comunes son la obtencin de imgenes de astronoma, donde pueden requerirse tiempos de
exposicin elevados, o aplicaciones industriales de visin por ordenador, en las que el reconocimiento
de los objetos de inters puede realizarse a partir de un nico fotograma.

Fig. 5.35 Sensor CCD matricial

5.5.2 Sensores CCD de transferencia de cuadro (Frame Transfer CCD)
Las CCD de transferencia de cuadro son probablemente las ms utilizadas en cmaras de vdeo.
Conceptualmente son parecidas a las CCD matriciales, con la diferencia de que slo la mitad de la
estructura CCD est expuesta a la luz, mientras que la otra mitad est protegida. La idea bsica de su
funcionamiento consiste en adquirir la imagen utilizando la superficie expuesta a la luz y, una vez
adquirida, desplazar las cargas rpidamente y en paralelo hacia la zona protegida. Con ello, es posible
realizar los procesos de adquisicin y lectura de los datos simultnea e independientemente. El tiempo
mximo de exposicin puede llegar a ser igual al periodo de campo, ya que una vez transferida toda la
carga a la zona protegida puede iniciarse la captura de una nueva imagen, sin necesidad de esperar a
que los datos hayan sido proporcionados a los sistemas exteriores. Adems, no es necesario utilizar un
obturador mecnico, ya que la imagen adquirida est protegida de la luz cuando se realiza la
conversin a seal de vdeo. Por otra parte, el smear depende del tiempo requerido para transferir la
carga desde la regin activa a la regin de almacenamiento. Cuanto menor sea este tiempo menores
son sus efectos sobre la imagen. En la figura 5.36 se representa la estructura de una CCD de
transferencia de cuadro.

Es importante advertir que estamos asumiendo que las imgenes se estn capturando a una velocidad
igual a la frecuencia de campo, en vez de la frecuencia de imagen o cuadro. Esto significa que los dos
campos de la seal de vdeo corresponden a instantes de muestreo distintos, lo que resulta ser habitual
en muchos modelos de cmara. Este problema, y su incidencia en la resolucin real de la imagen, fue
considerado con cierto detalle en el primer captulo. No obstante, en algunos modelos de cmara es
posible trabajar a la frecuencia de imagen real (25 imgenes por segundo). En este caso, los dos
campos pueden obtenerse a partir de las muestras de la CCD, realizando promedios entre lneas
consecutivas. As, en el campo par se promedian las lneas 1y 2, 3 y 4, 5 y 6, etc, mientras que en el
campo impar se promedian las lneas 2 y 3, 4 y 5, 6 y 7, ect.

Fig. 5.36 Estructura de una CCD de transferencia de cuadro

5.5.3 Sensores CCD de transferencia de cuadro divididos (Split Frame Transfer CCD)
Esta arquitectura es similar a la de transferencia de cuadro convencional, con la salvedad de que la
parte de almacenamiento esta divida en dos secciones (superior e inferior). La parte central de la CCD
es la que queda expuesta a la luz. Una vez capturada la imagen, su transferencia a las regiones de
almacenamiento se realiza simultneamente, la mitad superior hacia la mitad superior y la inferior
hacia la inferior. Esta estrategia reduce el smear del sensor, ya que el tiempo de desplazamiento se
Zona transparente
Expuesta a la luz
Zona opaca
Protegida de la luz
lectura
Zona transparente
Expuesta a la luz
Zona opaca
Protegida de la luz
lectura
5 Cmaras 423
reduce a la mitad. No obstante, deben incorporarse dos registros de desplazamiento y dos sensores de
carga en la CCD. El esquema simplificado de esta configuracin se representa en la figura 5.37.

Fig. 5.37 Estructura de una CCD de transferencia de cuadro dividido

5.5.4 Sensores CCD de transferencia interlnea (I nterline Transfer)
La matriz de sensores est formada, tal y como se ilustra en la figura 5.38, por estructuras CCD
lineales en las que se intercalan las filas expuestas a la luz y las protegidas. Esta configuracin permite
que el desplazamiento de la carga a la zona protegida pueda realizarse en un nico paso,
desapareciendo completamente el efecto de smear. Una vez protegida la informacin de la fuente de
luz, puede procederse a su lectura de forma sincronizada con la seal de vdeo. El tiempo de
exposicin puede controlarse directamente a partir de las seales de control de adquisicin de imagen,
por lo que no es necesario ningn obturador mecnico.

El problema principal de esta configuracin, al compararla con las CCD de transferencia de cuadro, es
que al intercalar lneas visibles con protegidas puede obtenerse una menor densidad de elementos
sensibles y, por tanto, una menor resolucin de imagen. Si se desea aumentar la resolucin puede
reducirse el rea de cada elemento sensor, pero en este caso, tambin se disminuir la sensibilidad de
la CCD.

Las CCD de transferencia de cuadro y las de transferencia de lnea son las ms utilizadas en cmaras
profesionales y domsticas. El uso de una u otra tecnologa depende del fabricante y de las
caractersticas con que se desee dotar la cmara: alta sensibilidad o smear reducido.
Zona transparente
Expuesta a la luz
Zona opaca
Protegida de la luz
lectura
Zona opaca
Protegida de la luz
lectura
Zona transparente
Expuesta a la luz
Zona opaca
Protegida de la luz
lectura lectura
Zona opaca
Protegida de la luz
lectura

Fig. 5.38 Configuracin de una CCD de transferencia interlnea

En general, todas las estructuras CCD descritas presentan una excelente fiabilidad y robustez, lo que
las hace ideales para aplicaciones de vdeo y de captura de imgenes en cualquier condicin. No
presentan distorsin geomtrica y su respuesta es muy lineal con la luz incidente.

Aparte de su aplicacin en sistemas de vdeo se utilizan para la adquisicin de imgenes en
astronoma y microscopa de fluorescencia. Estas aplicaciones requieren tiempos de exposicin muy
elevados (desde varios segundos hasta horas) que pueden obtenerse manteniendo las condiciones de
adquisicin de imagen durante tiempos prolongados. Los dispositivos CCD utilizados para estas
aplicaciones requieren que el sustrato semiconductor sea enfriado mediante sistemas externos para
reducir la generacin espontnea de pares electrn-hueco debida a la temperatura. Esta generacin
espontnea se denomina corriente de oscuridad y representa la carga que se almacenar en los
electrodos en ausencia de luz y, por lo tanto, debida nicamente a la generacin trmica de carga
elctrica. Resulta obvio que si deseamos capturar imgenes con muy poca iluminacin, ser necesario
que la generacin trmica de carga est por debajo de la generacin de carga a partir de la
iluminacin. As, la temperatura del sustrato deber reducirse ms o menos en funcin de las
condiciones de iluminacin. Debido a las imperfecciones en la fabricacin del dispositivo, la corriente
de oscuridad depende del elemento de imagen, pudiendo obtener puntos de la estructura CCD donde
sta es relativamente elevada. La carga adquirida en condiciones de oscuridad total produce una
imagen parecida a un campo de estrellas (donde los elementos de imagen con mayor corriente de
oscuridad producen los puntos luminosos). Esta imagen es estacionaria y es caracterstica de cada
CCD, por lo que puede sustraerse de la imagen final para reducir la incidencia de la corriente de
oscuridad sobre la imagen adquirida.
Clulas expuestas
Clulas protegidas
Lectura
Clulas expuestas
Clulas protegidas
Lectura
5 Cmaras 425
Los defectos en la estructura y fabricacin del CCD pueden producir algunos pxeles muertos (dead
pixels), que se caracterizan por ser contactos metlicos bajo los que no se almacena carga. La
presencia de estos elementos defectuosos puede afectar a todos los elementos de la misma columna si
se produce una prdida de carga en estos terminales durante el proceso de lectura.

Los esquemas de CCD que hemos presentado son muy simplificados, pues no se han tenido en cuenta
clulas y configuraciones de condensadores MOSFET que se utilizan para la eliminar parte de la carga
indeseada o para iniciar la captura de una nueva imagen. Uno de estos circuitos son los sistemas de
proteccin frente al blooming. Este fenmeno se produce cuando se sobreexpone la CCD o existe
algn punto luminoso de gran intensidad. En estos casos, la carga generada bajo el contacto metlico
prximo al punto luminoso es muy elevada y puede desbordar hacia las clulas adyacentes. Para evitar
este problema suelen ponerse clulas que descargan a masa los excedentes de carga.

En toda esta exposicin hemos supuesto que el sustrato de silicio es del tipo N, por lo que los
portadores mayoritarios son los electrones. En la prctica, la mayora de CCD se fabrican con un
sustrato de silicio del tipo P. Esto significa que los portadores mayoritarios son en realidad los huecos
y que las tensiones que realmente deben aplicarse a los contactos metlicos son negativas.

5.5.5 Dispositivos de inyeccin de carga (Charge I njection Devices, CID)
Los principios fsicos para la captura de imagen de estos dispositivos son los mismos que en los CCD.
La diferencia entre ambos estriba en la forma en la que se realiza la lectura de la carga. En este caso,
los elementos de imagen pueden direccionarse de forma individual, especificando la fila y la columna
de la matriz de sensores que se desea leer, proporcionando un acceso aleatorio a los pxeles de la
imagen.

Cada uno de los elementos de imagen contiene dos condensadores MOS acoplados, uno dedicado a la
captura de imagen y otro dedicado al almacenamiento de la informacin (protegido de la luz)
mediante una configuracin como la representada en la figura 5.39. La transferencia de carga entre el
elemento expuesto a la luz y el elemento de almacenamiento se realiza seleccionando primero la fila y
luego la columna en la que se desea realizar la lectura. Ntese que gracias a la configuracin matricial
de los sensores, slo la carga asociada al elemento seleccionado ser transferida. Por otra parte, la
lectura de la informacin se realiza de modo no destructivo, mediante sensores de carga conectados a
los buses de direccionamiento. Esto permite que la carga pueda volver a restablecerse al elemento
sensor una vez leda.

Las aplicaciones de este tipo de sensores se concentran en utilidades donde el tiempo de exposicin es
un factor muy crtico y es conveniente controlarlo adaptativamente. Obsrvese que es posible utilizar
tiempos de exposicin diferentes para distintas partes de la imagen e incluso continuar exponiendo un
elemento de imagen despus de su lectura. Otra ventaja inherente a esta estructura es que no existe
ninguna transferencia de carga entre sensores adyacentes, por lo que no es posible la aparicin de
efectos de blooming o de smear. Asimismo, la presencia de elementos defectuosos no tiene ninguna
incidencia en los pxeles adyacentes.

El inconveniente principal de estas clulas es que, debido a su procedimiento de lectura, su nivel de
ruido es bastante superior al de los CCD convencionales. La carga obtenida bajo el elemento sensor es
traspasada al bus de lectura mediante un divisor de capacidades. La propia resistencia del bus
introduce un nivel de ruido significativamente mayor que en las CCD y reduce el mbito de aplicacin
de estos elementos.

Fig. 5.39 Estructura de los sensores de inyeccin de carga

5.5.6 Sensores de pxel activo (Active Pixel Sensors)
Los sensores de pxel activo tambin pueden seleccionar los elementos de imagen de modo individual
y no requieren que se realice una transferencia de las cargas entre los sensores. Se fabrican utilizando
tecnologa CMOS y utilizan un amplificador activo para cada elemento de imagen, eliminando los
problemas de la capacidad y resistencia de los buses en los dispositivos CID.

Con la tecnologa actual, los transistores que amplifican la carga de los sensores cubren
aproximadamente un 75 % del rea de imagen, lo que reduce el nmero de elementos activos del
sensor. Debido a esta restriccin, prcticamente slo se utilizan en estructuras lineales. Aunque la
tecnologa debe mejorarse apreciablemente para poder competir con las densidades actuales de los
dispositivos CCD, se usan con cierta frecuencia en juguetes o equipos de gama baja. Su principal
ventaja es que al estar basados en tecnologa CMOS pueden producirse en lneas convencionales, con
Direccionar columnas
D
i
r
e
c
c
i
o
n
a
r

f
i
l
a
s
amplificadores
Direccionar columnas
D
i
r
e
c
c
i
o
n
a
r

f
i
l
a
s
amplificadores
5 Cmaras 427
un coste reducido y con la posibilidad de integrar otras funciones lgicas o de conversin analgico
digital en el mismo circuito integrado. El avance de esta tecnologa permitira introducir funciones
avanzadas en los sensores de imagen sin necesidad de utilizar circuitos exteriores.

5.5.7 Captura de imgenes en color con un nico sensor
En las cmaras profesionales o semiprofesionales suele utilizarse un sensor CCD para cada
componente de color. La luz procedente del grupo ptico se descompone en tres componentes R, G y
B mediante el uso de un prisma dicroico cuyos principios de funcionamiento ya han sido analizados
en el primer captulo. No obstante, en cmaras de gama baja, suele utilizarse un nico sensor CCD
para realizar la captura de la imagen en color. Con ello se reduce el coste de los sensores y, sobre
todo, el coste del prisma de separacin de las componentes de color.

Para realizar la captura de la imagen mediante un nico sensor es necesario interponer filtros de color
delante de los elementos de imagen del sensor de modo que slo se permita el paso de las
componentes de luz que interesen. La idea bsica es distribuir sobre la CCD filtros de color de modo
que las cargas de los elementos correspondan en unos casos al rojo, en otros al verde y en otros al
azul. Si conocemos que tipo de filtro se ha utilizado en cada elemento de imagen podremos reconstruir
las tres componentes de color. El coste de esta alternativa es, evidentemente, una prdida significativa
de resolucin.

Podra pensarse en una alternativa que interpusiera un filtro de color delante de toda la CCD, que
fueran cambiando con el tiempo y que permitiera la captura de las tres componentes de color
multiplexadas en el tiempo. No obstante, esta alternativa supondra tener que incorporar sistemas
mecnicos complejos para el cambio de filtro. Adems reducira el tiempo mximo de exposicin en
un factor 3 y significara (esto es lo ms importante) que las tres componentes de color asociadas a
una imagen no se corresponden con el mismo instante de tiempo, dando lugar a distorsiones de color
significativas en los objetos mviles de la escena.

En la prctica, durante el proceso de fabricacin de las CCD que deben utilizarse en cmaras de un
nico sensor se aplica un revestimiento de filtros de colores que afectan a cada uno de los elementos
de imagen. No obstante, los filtros que se utilizan no corresponden a los tres colores bsicos, ya que
obtendramos un bajo rendimiento lumnico ( y por tanto, mucha sensibilidad al ruido) en algunas
componentes (rojo y azul). Los filtros que se suelen utilizar son el verde (G), amarillo (Ye), magenta
(Mg) y ciano (Cy) y su disposicin geomtrica en la matriz de sensores es como la que se indica en la
figura 5.40. En esta figura tambin se indica como se realiza la lectura de la imagen en dos campos.
En el campo A se combinan los elementos de imagen obtenidos en las lneas A1, A2, etc. de la CCD
mientras que en el campo B se combinan los elementos de imagen B1, B2, etc.

A partir de las seales obtenidas con estos filtros se determinan las componentes de luminancia y
diferencia de color utilizando nicamente sumas y restas de pxeles. Los pares de elementos
correspondientes a la misma columna son siempre sumados. As, la informacin que podemos tratar
correspondiente a los pares de lnea A1 es (Cy+G) y (Ye+Mg). En los pares de lnea del tipo A2
disponemos de la informacin (Cy+Mg) y (Ye+G). Esto significa que tanto las componentes de
luminancia como de color slo sern obtenidas de modo aproximado. La luminancia se determina para
todos los pares de lneas (A1, A2) mientras que las seales diferencia de color slo se determinan en
pares alternados (en A1 se estima R-Y y en A2 la componente B-Y).

La luminancia en el par de lneas A1 se obtiene a partir de la suma de (G+Cy) y (Mg+Ye), de acuerdo
con la siguiente expresin:

{ } ( ) R G B Ye Mg Cy G Y 2 3 2
2
1
2
1
) ( ) ( + + = + + + (5.26)

La componente de croma se aproxima restando las combinaciones entre dos elementos de imagen
sucesivos:

{ } ) 2 ( ) ( ) ( G R Cy G Ye Mg Y R = + + (5.27)

En la lnea A2 la luminancia se obtiene sumando las dos componentes:

{ } ( ) R G B Ye G Cy Mg Y 2 3 2
2
1
2
1
) ( ) ( + + = + + + (5.28)

y la seal (B-Y) se obtiene mediante la diferencia de las dos componentes

{ } ) 2 ( ) ( ) ( ) ( G B Cy Mg Ye G Y B = + + (5.29)

Los resultados que se obtienen para el campo B son parecidos. Tal y como se desprende de estos
resultados, los valores de las componentes Y, (R-Y) y (B-Y) que realmente se utilizan en este tipo de
cmaras son slo valores aproximados a los colores reales.

Fig. 5.40 Configuracin de filtros de color en sistemas con un nico sensor CCD
Cy Ye Cy Ye
G Mg G Mg
Cy Ye Cy Ye
Mg G Mg G
A1
A2
B1
Cy Ye Cy Ye
G Mg G Mg
Cy Ye Cy Ye
Mg G Mg G
A1
A2
B1
5 Cmaras 429
5.6 Sistemas automticos y control de la seal de vdeo
En esta seccin veremos los principios de funcionamiento de algunos subsistemas que usualmente se
incluyen en cmaras de vdeo o de fotografa. Aunque veremos algunos controles que se utilizan slo
en cmaras profesionales, nos concentraremos principalmente en las cmaras domsticas, puesto que
al estar orientadas a usuarios no expertos son las que incorporan un mayor nmero de sistemas de
control automtico.

5.6.1 Zoom ptico y zoom digital
El zoom o ngulo de visin de la cmara se controla directamente por el usuario que puede
modificarlo accionando un botn o deslizador. En cmaras profesionales este control acta
directamente sobre el motor de zoom del grupo ptico, variando la distancia focal. El factor de zoom o
nmero de aumentos del grupo ptico se define como la relacin entre la distancia focal ms grande y
la ms pequea que pueden obtenerse. Son habituales factores de zoom de 20x en cmaras domsticas
y de 10x en profesionales. Algunas cmaras incorporan tambin el llamado zoom digital, que consiste
en utilizar slo la parte central de la CCD para obtener la imagen final, interpolando el resto de
muestras. El tipo de filtro interpolador que se utiliza puede ser tan simple como la repeticin de la
muestra anterior o la interpolacin lineal entre elementos de imagen adyacentes. En general, si se
utiliza un factor de zoom digital excesivamente grande, se observa una prdida de calidad de imagen
considerable que aparece como una imagen con un grado elevado de pixelado. Existen cmaras
domsticas que con la accin conjunta del zoom ptico y el zoom digital pueden llegarse a factores de
aumento superiores a 200. La toma de imgenes con este factor de aumento exige, evidentemente, el
uso de trpodes muy estables.

Fig. 5.41 Estabilizacin de imagen mediante sistemas electrnicos

5.6.2 Mecanismos de estabilizacin de imagen
Se utilizan bsicamente en cmaras domsticas y en algunas cmaras de campo y tienen como
objetivo reducir el movimiento involuntario de la cmara por parte del operador que produce
imgenes poco estables. Existen dos alternativas para obtener la estabilizacin de la imagen. La
Sensor CCD
Area de imagen
Sensor CCD
Area de imagen
primera consiste en fijar la superficie donde se forma la imagen actuando directamente sobre el grupo
ptico mediante sistemas mecnicos. Se trata de un sistema complejo y caro, pero con el que se
obtienen excelentes resultados. La segunda alternativa es puramente electrnica y se basa en actuar
sobre la imagen inestable obtenida en el sensor CCD. En este tipo de sistemas, la superficie de imagen
del sensor CCD es mayor que la superficie de imagen til, tal y como se ilustra en la figura 5.41. Un
sistema electrnico se encarga de determinar el ndice de la fila y la columna de la imagen capturada
por la CCD que debe presentarse como primera fila y primera columna de la imagen til. Los
algoritmos de actualizacin de estos valores son especficos de cada fabricante y se basan en clculos
simples de correlacin entre imgenes y predicciones de movimiento.

5.6.3 Sistemas de autoenfoque
Los sistemas de autoenfoque actan sobre el motor de enfoque del grupo ptico con el objetivo de
mantener el sujeto principal de la accin permanentemente enfocado, sin necesidad de que el operador
acte manualmente sobre el mando de enfoque. Pueden ser activos o pasivos en funcin de si utilizan
una seal auxiliar para determinar la distancia a la que se encuentran los objetos o realizan el control
de enfoque directamente a partir de las imgenes recibidas. Los sistemas activos ms populares son
los basados en ultrasonidos e infrarrojos.

En la figura 5.42 se ilustra el principio de funcionamiento de un sistema basado en ultrasonidos. La
cmara transmite pulsos de corta duracin y se mide el tiempo que transcurre entre la emisin y la
recepcin del pulso, enfocando el grupo ptico a esta distancia equivalente. Si no se detecta la
recepcin del pulso el sistema enfoca automticamente hacia el infinito. Se trata de un sistema muy
econmico que se utiliza en cmaras de gama baja (normalmente cmaras miniatura de fotografa).
Uno de los principales inconvenientes de los sistemas basados en ultrasonidos es que no pueden
enfocar a travs de un cristal (queda enfocado el cristal)

Fig. 5.42 Sistema de autoenfoque por ultrasonidos

Los sistemas basados en infrarrojos transmiten una seal continua en esta banda de frecuencia. La
distancia del objeto principal se obtiene por trigonometra a partir del diagrama de la figura 5.43. La
distancia entre el emisor y el receptor de infrarrojos (D) es conocida. El sistema mide la distancia d,
Transmisor
Ultrasonidos
Receptor
Ultrasonidos
Retardo
Transmisor
Ultrasonidos
Receptor
Ultrasonidos
Retardo
5 Cmaras 431
respecto al centro del array de fotodiodos, a la que se recibe el rayo transmitido. La distancia real del
objeto puede determinarse a partir de estos dos parmetros. En general, los sistemas de autoenfoque
basados en infrarrojos suelen proporcionar mejores resultados que los sistemas basados en
ultrasonidos.

Fig. 5.43 Sistema de autoenfoque basado en infrarrojos

Fig. 5.44 Enfoque pasivo mediante sistema ptico auxiliar

Los sistemas pasivos suelen proporcionar una mayor precisin en el enfoque de las imgenes. Existen
dos posibles variantes en funcin de la imagen que se utiliza para calcular el punto de enfoque. En las
figuras 5.44 y 5.45 se representan estas dos alternativas. En el primer caso, la imagen utilizada para
determinar el enfoque se obtiene mediante un sistema ptico auxiliar, independiente del grupo ptico
que se utiliza para registrar la escena. La alternativa a este sistema consiste en integrar un prisma
H
D
d
Diodo
infrarrojo
Fotodiodos
H
D
d
Diodo
infrarrojo
Fotodiodos
Lente
zoom
autoiris
Lente
principal
CCD
Lente
de enfoque
Lente
AF
Conversor
Sensor de
enfoque
Procesador
Motor
enfoque
Lente
zoom
autoiris
Lente
principal
CCD
Lente
de enfoque
Lente
AF
Conversor
Sensor de
enfoque
Procesador
Motor
enfoque
separador de luz, que permite utilizar la misma imagen para el clculo del foco. En cmaras reflex de
35 mm el propio espejo reflector del visor realiza esta funcin.

Fig. 5.45 Enfoque pasivo integrado dentro del propio grupo ptico

Para determinar el enfoque pueden usarse divisores pticos de imagen parecidos a los que se utilizan
en las cmaras de fotografa para el enfoque manual. Estos sistemas dividen la imagen en el sentido
horizontal en dos partes, de forma que, tal y como se ilustra en la parte derecha de la figura 5.46, al
modificar la posicin del foco las imgenes resultantes se desplazan hacia la izquierda o hacia la
derecha. La imagen slo permanece correctamente enfocada cuando las lneas verticales de ambas
subimgenes coinciden. Para realizar el ajuste automtico de foco mediante este sistema, es necesario
utilizar lentes lenticulares y pares de fotodiodos situados a ambos extremos de la imagen dividida. El
sistema de control acta sobre el motor de foco hasta que la seales recibidas por los pares de
fotosensores coincidan.

Una alternativa a este sistema consiste en utilizar un sensor CCD lineal, que se sita en el centro de la
imagen, tal y como se muestra en la figura 5.46. Incluso, para cmaras basadas en CCD matriciales, es
posible aprovechar la informacin obtenida en los sensores centrales. El control de enfoque se realiza
a partir del anlisis de la energa de seal recibida en estos sensores, moviendo el motor hasta que se
obtiene una seal en la que aparecen rpidas transiciones entre el fondo y los objetos. El principio de
funcionamiento de este sistema se ilustra en la figura 5.47, donde se representa la seal obtenida en el
sensor CCD para una imagen enfocada y una imagen desenfocada. Para determinar el foco correcto
suele estimarse la derivada de la luminancia recogida en el sensor. Esta derivada se determina
mediante diferencias entre los niveles de luminancia entre pxeles consecutivos y es una medida de lo
abruptos que son los contornos y, por tanto, de la nitidez de la imagen. Ntese que en la figura 5.47 se
obtiene una derivada con una energa mucho mayor para la imagen enfocada que para la imagen
desenfocada. En general, la energa de la derivada es una buena medida del enfoque de la imagen.
Lente
zoom
autoiris
Lente
principal
CCD
Lente
de enfoque
Procesador
Motor
enfoque
Lente
AF
Sensor de
enfoque
Espejo
Prisma
Lente
zoom
autoiris
Lente
principal
CCD
Lente
de enfoque
Procesador
Motor
enfoque
Lente
AF
Sensor de
enfoque
Espejo
Prisma
5 Cmaras 433

Fig. 5.46 Enfoque pasivo mediante descomposicin de imagen y CCD de lnea

Fig. 5.47 Gradiente de la seal obtenida en el sensor CCD

Los principales problemas de los sistemas de enfoque pasivo es que slo pueden enfocar en la zona
central de la imagen y que es necesario que existan contornos verticales en esta zona para poder
realizar un enfoque correcto. En cmaras de fotografa estos problemas se solucionan mediante un
Descomposicin
imagen
CCD de lnea
Descomposicin
imagen
CCD de lnea
0 50
0. 2
0. 4
0. 6
0. 8
1
0 50
0. 2
0. 4
0. 6
0. 8
1
0 50
-0. 1
-0. 05
0
0. 05
0. 1
0 50
-1
-0. 5
0
0. 5
0 50
-0. 1
-0. 05
0
0. 05
0. 1
0 50
-1
-0. 5
0
0. 5
1
lnea
Derivada
primera
Derivada
segunda
0 50
0. 2
0. 4
0. 6
0. 8
1
0 50
0. 2
0. 4
0. 6
0. 8
1
0 50
-0. 1
-0. 05
0
0. 05
0. 1
0 50
-1
-0. 5
0
0. 5
0 50
-0. 1
-0. 05
0
0. 05
0. 1
0 50
-1
-0. 5
0
0. 5
1
lnea
Derivada
primera
Derivada
segunda
botn que mantiene el ajuste de enfoque. Si desea realizarse una fotografa de un motivo que no tiene
contornos en la parte central, deberemos enfocar primero sus contornos y posteriormente desplazar la
cmara, con el enfoque fijado, hasta obtener el ngulo deseado. Si se requiere realizar fotografas de
objetos que tienen slo contornos horizontales se recomienda girar la cmara 90 (con lo que situamos
el sensor perpendicular a los contornos), ajustar y fijar el enfoque y posteriormente realizar la toma.
En cmaras de vdeo pueden utilizarse los mismos trucos, siempre que no se requiera registrar
constantemente la escena, en cuyo caso, se recomienda utilizar el enfoque manual.

Algunos modelos de cmaras avanzadas disponen de varios sensores CCD con los que el usuario
puede seleccionar la zona de la imagen en la que se realizar el clculo de enfoque. Un ejemplo de
estos sistemas es el MultiCam 1300AF de Nikon, cuya distribucin de sensores CCD se representa en
la figura 5.48. El subsistema de autoenfoque dispone de un total de 14 sensores CCD del tipo lineal.
El usuario puede seleccionar cinco regiones distintas para el enfoque de la imagen (el centro y las
cuatro direcciones principales). En las posiciones central, derecha e izquierda, los sensores estn
dispuestos en forma de cruz para poder detectar tanto los contornos horizontales como los verticales.
Adems de las CCD convencionales se integran unas CCD de mayor rea, y por tanto mayor
sensibilidad a la luz, que permiten realizar enfoques de gran precisin en condiciones de baja
iluminacin.

Fig. 5.48 Sistema de autoenfoque pasivo con mltiples sensores CCD

5.6.4 Ajuste del balance de blancos
Los colores capturados por la cmara dependen, como es evidente, de la iluminacin. En condiciones
de luz natural diurna la energa lumnica est distribuida de forma aproximadamente igual en las tres
componentes de color. Sin embargo, con iluminacin artificial es muy probable que una de las
componentes de color sea ms importante que las otras. As, para iluminacin de tungsteno predomina
la componente roja, lo que resulta apropiado en escenarios clidos en los que predominan los tonos
rojizos. Los efectos de la iluminacin en la imagen pueden en principio compensarse actuando sobre
13 mm
16 mm
7
.
1

m
m
13 mm
16 mm
7
.
1

m
m
5 Cmaras 435
la ganancia de cada una de las componentes de color en la cmara. Este ajuste se conoce como el
balance de blancos y es conveniente realizarlo antes de empezar un registro de imagen para
adaptarnos a las condiciones de iluminacin. El ajuste del balance blancos en las cmaras actuales se
ha simplificado notablemente y basta con enfocar la cmara hacia una hoja de papel u objeto blanco y
pulsar el botn de calibracin de blancos. La ganancia de las tres componentes de color se ajusta
automticamente para que den el mismo nivel de seal en estas condiciones de iluminacin. El ajuste
de blancos se incorpora en todas las cmaras profesionales y en los modelos domsticos de gama alta.

5.6.5 Modos de exposicin y efectos
La mayor parte de cmaras de vdeo domsticas incorporan programas que controlan la exposicin y
el diafragma de forma automtica en funcin de las condiciones de iluminacin y tipo de escenas que
se estn registrando. Los modos de exposicin ms habituales son:

Deportes: Se utilizan velocidades de obturacin elevadas (mayores que 1/400) para que los
sujetos no queden borrosos debidos al movimiento. Esto significa que se proporciona
prioridad al tiempo de exposicin, de modo que en condiciones de baja iluminacin el
diafragma deber abrirse resultando poca profundidad de campo.

Retratos: En este modo se pretende resaltar el sujeto principal dejando el fondo borroso. Por
ello, se fuerza que el diagrama est muy abierto para reducir la profundidad de campo.

Playa y Nieve: Se trata de un modo pensado para condiciones de iluminacin intensa en los
que es habitual que se produzca sobre-exposicin si se utiliza un modo automtico
convencional.

Puestas de Sol y Escenas Nocturnas: En condiciones de baja iluminacin los modos
automticos tienden a aumentar la ganancia de la seal proporcionada por el sensor
reproduciendo escenas poco naturales.

Baja Iluminacin: Este modo slo se incorpora en cmaras digitales en las que se puede
aumentar el tiempo de exposicin del fotograma por debajo de la frecuencia de campo. En
efecto, los fotogramas, tomados a velocidades lentas, se almacenan en memoria y se repiten
durante varias imgenes, pudiendo capturar escenas en condiciones de baja iluminacin.
Evidentemente, la frecuencia de imgenes reales se reduce, por lo que se aprecia
discontinuidad en el movimiento.

Paisajes: En este caso se fuerza que la cmara enfoque al infinito, por lo que pueden
capturarse imgenes del paisaje a travs de cristales de un automvil o con la presencia de
obstculos en primer plano.

La mayora de cmaras porttiles tambin integran efectos de imagen simples que proporcionan al
usuario cierta flexibilidad para producir vdeos domsticos con buenos acabados sin necesidad de
realizar ediciones posteriores. Entre estos efectos son especialmente importantes los fundidos entre
escenas, el registro de imgenes en blanco y negro, sepia o muy baja resolucin (efecto mosaico), la
mezcla de imgenes en memoria con imgenes de vdeo real, etc. Algunos modelos incorporan incluso
utilidades de titulacin.

5.7 Tipos de cmaras
En este apartado revisaremos, de forma muy breve, los diferentes tipos de cmaras de vdeo que
pueden encontrarse en el mercado, as como sus caractersticas y sus aplicaciones. El objetivo es
proporcionar una idea general de los criterios que deben utilizarse para seleccionar un determinado
tipo de cmara en funcin de la aplicacin.

5.7.1 Cmaras de estudio
Estas cmaras estn orientadas a estudios de grabacin y suelen ser de un tamao y peso considerable,
por lo que, generalmente, estn montadas sobre soportes estables o carriles mviles. Existen algunos
modelos porttiles que pueden ser transportados por el operador para realizar tomas mviles.
Proporcionan como seal de salida las tres componentes de color independientes, aunque el formato
de estas seales puede variar en funcin de las caractersticas de la cmara y los equipos del estudio.
Existen modelos en que las seales se transmiten en banda base por cables independientes, modelos en
los que se realiza una multiplexacin temporal; otros emplean transmisiones bidireccionales mediante
cables del tipo Triax o incluso transmisiones analgicas o digitales va fibra ptica.

La caracterstica principal de estas cmaras es que estn conectadas a una unidad de control de cmara
externa (CCU-Camera Control Unit), que es donde generalmente se realiza la compensacin de la
matriz de color, el ajuste de ganancia de las componentes de color , la mejora de imagen, la correccin
de gamma y las conversiones a seal de luminancia y componentes diferencia de color. El cable que
une el cabezal de cmara con la unidad de control de cmara se utiliza tambin para proporcionar
diversas seales de retorno al operador de cmara, como por ejemplo la seal de audio del ayudante de
realizacin, la seal de vdeo que se observa por el visor, etc. Tambin se proporcionan seales de
control del diafragma y foco as como la alimentacin de la cmara. Debe tenerse en cuenta que,
generalmente, el operador de cmara slo controla el enfoque y el zoom de la cmara. El diafragma o
iris, los tiempos de exposicin, la ganancia de las componentes de color, etc., se controlan desde
paneles de control independientes. Al centralizar el control de todas las cmaras en un nico punto,
permite obtener un equilibrado perfecto de todas las cmaras que intervienen en la produccin.

Los formatos de seal de vdeo proporcionados por las cmaras de estudio son muy diversos y
dependen de las caractersticas de la cmara. As, en una cmara de alta definicin los tiempos de
lnea o de campo dependen del nmero de lneas de la cmara y del nmero de imgenes por segundo.
Anlogamente, en modelos pensados para la captura de escenas en cmara lenta, el formato de salida
suele depender del nmero de fotogramas por segundo. En general, la conversin a formatos estndar
puede realizarse en la unidad de control de cmara.

5 Cmaras 437
5.7.2 Cmaras de campo (Electronic News Gathering ENG)
Estas cmaras tambin estn orientadas al mercado profesional. Se trata de cmaras porttiles
pensadas para la realizacin de reportajes en exteriores y se caracterizan por incorporar un subsistema
de registro de la secuencia de vdeo sobre soporte magntico (magnetoscopios). Existen modelos en
los que el cuerpo principal de la cmara (ptica y captura de seales) es independiente del sistema de
registro de la seal, que puede intercambiarse en funcin de las necesidades. Generalmente, disponen
de mltiples formatos de salida de la seal de vdeo (vdeo compuesto, componentes, formatos
digitales, etc).

5.7.3 Cmaras de circuito cerrado de TV o de video vigilancia
Generalmente son cmaras en miniatura que proporcionan una seal de vdeo compuesto PAL o
NTSC estndar. Existen modelos en blanco y negro y en color y tienen un coste relativamente bajo.
En algunos modelos es posible controlar el foco y el zoom del grupo ptico a distancia. La mayora
disponen de un sistema de autoiris que regula la cantidad de luz incidente en funcin de las
condiciones de iluminacin, que, en algunos modelos, tambin puede controlarse manualmente. En la
mayora de instalaciones las cmaras se distribuyen en distintos puntos del edificio y las seales se
dirigen a un centro de control, donde un multiplexor de entrada permite seleccionar al operador la
cmara que se visualiza. Existen paquetes de software especficos para video vigilancia que gestionan
la inspeccin automtica de las cmaras y el registro de las imgenes en disco duro o en
magnetoscopios convencionales en funcin de las alarmas que se producen en el edificio. En edificios
de dimensiones considerables es probable que deban incorporarse moduladores de vdeo para cable,
para que las imgenes puedan ser recibidas con calidad desde el centro de control. Algunos modelos
de cmaras para video vigilancia son de tamao muy reducido, por lo que pueden disimularse en el
entorno y pasar fcilmente desapercibidas. Este tipo de cmaras se utilizan con frecuencia en centros
comerciales.

5.7.4 Cmaras industriales y de visin
Se engloban dentro de este apartado todas las cmaras que se utilizan en aplicaciones de
reconocimiento automtico de formas y visin por computador. Las caractersticas de las cmaras
dependen del tipo de aplicacin y pueden encontrarse tipos muy distintos. Normalmente la cmara
est conectada a una tarjeta de digitalizacin de imagen que puede realizar la adquisicin de la
secuencia de vdeo en tiempo real o adquirir un nico fotograma cada vez que se produzcan las
condiciones de la imagen que debe reconocerse. Este segundo caso es el ms extendido en la mayora
de aplicaciones, utilizndose tarjetas de digitalizacin que se denominan capturadoras de imagen
(frame grabber), que generalmente aceptan distintos formatos de seal de cmara y que disponen de
puertos para controlar algunos de los parmetros de la cmara.

En las aplicaciones ms simples pueden utilizarse cmaras de vdeo vigilancia que proporcionan una
seal PAL estndar en color o, en la mayora de los casos, en blanco y negro. La adquisicin de la
imagen se realiza cuando se producen las condiciones en las que se requiere realizar un
reconocimiento de la imagen. Generalmente estas condiciones son controladas por circuitos externos
que producen una seal de inicio de captura. Una vez la imagen ha sido digitalizada, se realiza la
identificacin o reconocimiento de los objetos produciendo seales externas de control y quedando el
sistema en condiciones de capturar una nueva imagen. As, en una aplicacin de reconocimiento de
matrculas en un parking, la seal de inicio de captura la producira un sensor que detecta la presencia
de un automvil en la barrera de entrada al parking. Una vez adquirida la imagen y procesada se
procede a actuar sobre el sistema proporcionando el ticket de entrada y abriendo la barrera del
parking. Es evidente que, en funcin de las caractersticas del problema puede resultar necesario que
las caractersticas de la seal PAL no proporcionen suficiente resolucin de imagen para resolver el
problema de reconocimiento de formas. En estos casos, se suelen utilizar cmaras de alta definicin
que proporcionan seales de vdeo no estndar pero cuyo formato debe ser interpretado correctamente
por la tarjeta digitalizadora.

Aparte de las cmaras convencionales, las ms utilizadas son las progresivas, las lineales y las
denominadas cmaras inteligentes. En cualquier caso, es posible que la seal proporcionada sea
analgica o directamente digital. Las seales digitales suelen entregarse mediante un cable especfico
en el que todos los bits del elemento de imagen se suministran en paralelo. Tambin existen versiones
que utilizan protocolos serie estndar a travs de un puerto RS-232 o RS-422. La lectura de la
informacin de los datos proporcionados por la cmara requiere el uso de programas adaptados a estos
formatos.

Las cmaras progresivas proporcionan todas las lneas que constituyen la imagen en un nico campo.
Con ello, aumenta la calidad y resolucin de la imagen, sobre todo cuando se realiza la captura de
objetos mviles. Existen modelos de alta definicin que pueden entregar imgenes de hasta 2000
lneas. Generalmente, estas cmaras pueden controlarse mediante una interfaz digital en la que es
posible variar el tiempo de exposicin, la apertura del diafragma, el enfoque y el ngulo de visin.
Como generalmente no es necesario que la cmara proporcione seales de vdeo en tiempo real,
tambin es posible controlar el instante en el que se realiza la captura de la imagen en el sensor CCD.
Asimismo, el tiempo de exposicin puede superar los 1/50 segundos de las cmaras convencionales,
ya que la frecuencia de imagen puede controlarse externamente e incluso, trabajar basndose
exclusivamente en fotogramas. En estos modelos, el tiempo mnimo entre dos fotogramas viene
determinado por el tiempo de transferencia de la imagen desde la cmara a la tarjeta digitalizadora.

Las cmaras lineales estn basadas en una CCD de lnea en vez de una CCD matricial. La ventaja
principal de este tipo de cmaras es que pueden obtener un gran nmero de elementos de imagen por
lnea (hasta 4000 pxeles). No obstante, la captura de la imagen debe realizarse lnea a lnea, por lo
que es preciso que exista un desplazamiento relativo entre la cmara y el objeto que se est
capturando. La velocidad de desplazamiento entre ellos determina la resolucin de la imagen en el
sentido ortogonal a la lnea de CCD. Es importante que esta velocidad sea lineal para reducir las
posibles distorsiones geomtricas de imagen que obtendramos si el movimiento relativo no es
uniforme. Generalmente, el movimiento del objeto se realiza con sistemas de posicionamiento
mecnicos de gran precisin que son controlados directamente por el sistema encargado del
reconocimiento de imagen. Los formatos de seal que se obtienen en la salida de la cmara pueden ser
analgicos o digitales, aunque estos ltimos son los que ms predominan en los modelos actuales. La
tasa de transmisin de bits entre la cmara y la tarjeta de digitalizacin depende del modelo de
cmara, el nmero de pxeles, si es en color o en blanco y negro, etc. Las tarjetas de digitalizacin
suelen poder configurarse para adaptarse a las caractersticas de las cmaras.

5 Cmaras 439
Algunas cmaras incorporan la posibilidad de realizar tratamiento de datos interno, por lo que se
denominan cmaras inteligentes. Entre las operaciones que pueden realizar estas cmaras destaca la
estimacin de gradiente, el ajuste digital de contraste o la transformada de Fourier de la imagen. La
ventaja de estos sistemas es que proporcionan una informacin previamente tratada, por lo que
simplifican la tarea del procesador durante el reconocimiento de formas. En algunos casos el
tratamiento puede realizarse directamente por mtodos pticos (transformada de Fourier) utilizando
lentes especialmente diseadas para que proporcionen este tipo de informacin. En general se trata de
cmaras de precio muy elevado cuyo uso slo se ha popularizado en aplicaciones muy concretas.

5.7.5 Cmaras de vdeo domsticas
Tambin se denominan cmaras porttiles y se caracterizan por ser equipos de tamao reducido en los
que se integra el cabezal de la cmara y un sistema de registro de seal en cinta magntica
(camcorders). Al orientarse al mercado domstico suelen incorporar sistemas electrnicos de ajuste
automtico de las componentes de color, ganancia de la cmara, control de iris, seleccin de modos de
exposicin en funcin del tipo de escena, etc., con objeto de simplificar el control de la cmara a
usuarios no expertos. Los sistemas de registro de la seal de vdeo ms utilizados actualmente son el
Hi-8 y el Video8, en formatos analgicos, y el miniDV o el Digital8 en digital. Existen algunos
modelos, denominados semiprofesionales, de altas prestaciones, que se utilizan en ocasiones para la
captura de imgenes en exteriores en sustitucin de las cmaras ENG. Su calidad es bastante aceptable
y su reducido coste las hace ms rentable para estudios de TV local o productoras pequeas.

5.7.6 Cmaras para aplicaciones cientficas
En este apartado englobamos un gran nmero de sistemas de adquisicin de imagen que cubre los
campos de la medicina, la microscopa, la astronoma, etc. Las caractersticas de estas cmaras son
muy diversas y quedan fuera del alcance de este texto. En la mayora de aplicaciones se utilizan
cmaras convencionales o de alta definicin en las que se incorporan sistemas pticos que adaptan la
imagen que se desea adquirir. As, es habitual en medicina disponer de sofisticadas sondas de
inspeccin controladas electrnicamente que proporcionan una imagen que posteriormente es
capturada por una CCD externa. En microscopa suelen utilizarse adaptadores de la cmara de vdeo al
microscopio. En astronoma se utilizan CCD de grandes dimensiones (para tener una excelente
resolucin) y de alta sensibilidad a la luz.

5.7.7 WebCams
Reciben este nombre las cmaras que se utilizan en aplicaciones de videoconferencia por internet. En
principio, puede utilizarse cualquier cmara de vdeo convencional conectada a una tarjeta de
digitalizacin de vdeo siempre que se utilice un software de codificacin de la seal de vdeo y audio
adecuado al ancho de banda que proporciona el sistema. No obstante, la caracterstica fundamental de
una WebCam es su inmediata integracin al ordenador personal. Normalmente se conectan
directamente al puerto serie RS-232 o al puerto USB sin necesidad de disponer de tarjetas de
digitalizacin genricas, por lo que facilitan notablemente las tareas de configuracin del sistema. La
cmara suele ser de reducidas dimensiones, con una ptica del tipo gran angular, y pueden fijarse
sobre el monitor o la mesa de trabajo con facilidad. Algunos modelos disponen de una memoria
interna que permite utilizarlas como cmaras de fotografa digital cuando se desconectan del
ordenador.


Television Analogia y Digital

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Television Analogia y Digital

Uploaded by

Copyright:

Available Formats

POLITEXT

Pr oyecci ones Pl anas

Pr oyecci ones Pl anas

Los autores, 2000; Edicions UPC, 2000.

=1. Tambin se determinan los valores de las variables Y, U

) 33 2 cos( ) ( ' ) ( ' ) (

) 33 2 cos( ) ( ' ) ( ' ) (

) ( ' ) ( ' ) ( '

) 33 4 cos( ) ( ' ) 33 4 ( ) ( '

) 33 ( ) ( ' ) 33 cos( ) ( '

) 33 4 cos( ) ( ' ) 33 4 ( ) ( '

) 33 ( ) ( ' ) 33 cos( ) ( '

Los autores, 2000; Edicions UPC, 2000.

Los autores, 2000; Edicions UPC, 2000.

Los autores, 2000; Edicions UPC, 2000.

You might also like