You are on page 1of 16

Alberto Quevedo Enrique Juan

Indice
Definicin Cmo funciona La resolucin Profundidad de anlisis de color Cunto ocupa la imagen? Formatos de escner Conectores La interfaz TWAIN El OCR

Definicin
Escner es la palabra que se utiliza en informtica para designar a un aparato digitalizador de imagen. Por digitalizar se entiende la operacin de transformar algo analgico (algo fsico, real, de precisin infinita) en algo digital (un conjunto finito y de precisin determinada de unidades lgicas denominadas bits). Consiste en coger una imagen (fotografa, dibujo o texto) y convertirla a un formato que podamos almacenar y modificar con el ordenador.

Cmo funciona
El proceso de captacin de una imagen resulta casi idntico para cualquier escner: se ilumina la imagen con un foco de luz, se conduce mediante espejos la luz reflejada hacia un dispositivo denominado CCD que transforma la luz en seales elctricas, se transforma dichas seales elctricas a formato digital en un DAC (conversor analgicodigital) y se transmite el caudal de bits resultante al ordenador. El CCD (Charge Coupled Device, dispositivo acoplado por carga -elctrica-) es el elemento fundamental de todo escner, independientemente de su forma, tamao o mecnica. Consiste en un elemento electrnico que reacciona ante la luz, transmitiendo ms o menos electricidad segn sea la intensidad y el color de la luz que recibe; es un autntico ojo electrnico. Hoy en da es bastante comn: en la cmara de vdeo, en el fax, en la cmara de fotos digital... La calidad final del escaneado depender fundamentalmente de la calidad del CCD; los dems elementos podrn hacer un trabajo mejor o peor, pero si la imagen no es captada con fidelidad cualquier operacin posterior no podr arreglar el problema. Teniendo en cuenta lo anterior, tambin debemos tener en cuenta la calidad del DAC, puesto que de nada sirve captar la luz con enorme precisin si perdemos mucha de esa informacin al transformar el caudal elctrico a bits. Por este motivo se suele decir que son preferibles los escners de marcas de prestigio como Nikon o Kodak a otros con una mayor resolucin terica, pero con CCDs que no captan con fidelidad los colores o DACs que no aprovechan bien la seal elctrica, dando resultados ms pobres, ms planos.

La resolucin
La resolucin (medida en ppp, puntos por pulgada) puede definirse como el nmero de puntos individuales de una imagen que es capaz de captar un escner... La resolucin as definida sera la resolucin ptica o real del escner. As, cuando hablamos de un escner con resolucin de "300x600 ppp" nos estamos refiriendo a que en cada lnea horizontal de una pulgada de largo (2,54 cm) puede captar 300 puntos individuales, mientras que en vertical llega hasta los 600 puntos; como en este caso, generalmente la resolucin horizontal y la vertical no coinciden, siendo mayor (tpicamente el doble) la vertical. Esta resolucin ptica viene dada por el CCD y es la ms importante, ya que implica los lmites fsicos de calidad que podemos conseguir con el escner. Por ello, es un mtodo comercial muy tpico comentar slo el mayor de los dos valores, describiendo como "un escner de 600 ppp" a un aparato de 300x600 ppp o "un escner de 1.200 ppp" a un aparato de 600x1.200 ppp; tngalo en cuenta, la diferencia es obtener o no el cudruple de puntos. Tenemos tambin la resolucin interpolada; consiste en superar los lmites que impone la resolucin ptica (300x600 ppp, por ejemplo) mediante la estimacin matemtica de cules podran ser los valores de los puntos que aadimos por software a la imagen. Por ejemplo, si el escner capta fsicamente dos puntos contiguos, uno blanco y otro negro, supondr que de haber podido captar un punto extra entre ambos sera de algn tono de gris. De esta forma podemos llegar a resoluciones absurdamente altas, de hasta 9.600x9.600 ppp, aunque en realidad no obtenemos ms informacin real que la que proporciona la resolucin ptica mxima del aparato. Por ltimo est la propia resolucin de escaneado, aquella que seleccionamos para captar una imagen concreta. Su valor ir desde un cierto mnimo (tpicamente unos 75 ppp) hasta el mximo de la resolucin interpolada. En este caso el valor es siempre idntico para la resolucin horizontal y la vertical, ya que si no la imagen tendra las dimensiones deformadas.

Profundidad de anlisis de color


Al hablar de imgenes, digitales o no, a nadie se le escapa la importancia que tiene el color. Una fotografa en color resulta mucho ms agradable de ver que otra en tonos grises; un grfico acertadamente coloreado resulta mucho ms interesante que otro en blanco y negro; incluso un texto en el que los epgrafes o las conclusiones tengan un color destacado resulta menos montono e invita a su lectura. Sin embargo, digitalizar los infinitos matices que puede haber en una foto cualquiera no es un proceso sencillo. Hasta no hace mucho, los escners captaban las imgenes nicamente en blanco y negro o, como mucho, con un nmero muy limitado de matices de gris, entre 16 y 256. Posteriormente aparecieron escners que podan captar color, aunque el proceso requera tres pasadas por encima de la imagen, una para cada color primario (rojo, azul y verde). Hoy en da la prctica totalidad de los escners captan hasta 16,7 millones de colores distintos en una nica pasada, e incluso algunos llegan hasta los 68.719 millones de colores. Para entender cmo se llega a estas cifras debemos explicar cmo asignan los ordenadores los colores a las imgenes. En todos los ordenadores se utiliza lo que se denomina sistema binario, que es un sistema matemtico en el cual la unidad superior no es el 10 como en el sistema decimal al que estamos acostumbrados, sino el 2. Un bit cualquiera puede por tanto tomar 2 valores, que pueden representar colores (blanco y negro, por ejemplo); si en vez de un bit tenemos 8, los posibles valores son 2 elevado a 8 = 256 colores; si son 16 bits, 2 elevado a 16 = 65.536 colores; si son 24 bits, 2 elevado a 24 = 16.777216 colores; etc, etc. Por tanto, "una imagen a 24 bits de color" es una imagen en la cual cada punto puede tener hasta 16,7 millones de colores distintos; esta cantidad de colores se considera suficiente para casi todos los usos normales de una imagen, por lo que se le suele denominar color real. La casi totalidad de los escners actuales capturan las imgenes con 24 bits, pero la tendencia actual consiste en escanear incluso con ms bits, 30 incluso 36, de tal forma que se capte un espectro de colores absolutamente fiel al real; sin embargo, casi siempre se reduce posteriormente esta profundidad de color a 24 bits para mantener un tamao de memoria razonable, pero la calidad final sigue siendo muy alta ya que slo se eliminan los datos de color ms redundantes.

Cunto ocupa una imagen?


Para saber exactamente cul va a ser el tamao de una imagen, deberemos usar la siguiente frmula: Tamao imagen (KB) = L x A x RH x RV x bits / 8.192 Donde L y A son las dimensiones de la imagen en pulgadas (una pulgada = 2,54 cm) y RH y RV las resoluciones horizontal y vertical respectivamente. Ejemplo: una imagen DIN-A4 (aproximadamente 11,7x8,3 pulgadas) escaneada a 300 ppp (300x300) con 24 bits de color (color real) ocupa 25.490 KB!! (unos 25 MB, 25 megas!!). La cifra resulta impactante, pero no se preocupe; existen muchos mtodos para reducir el tamao de las imgenes, tanto a la hora de manejarlas en memoria como a la de almacenarlas en el disco duro. El primer mtodo consiste en escanear a menor resolucin; la calidad es menor, pero el tamao del fichero resultante tambin. Si la imagen va a tener como destino la pantalla de un ordenador, 75 ppp sern casi siempre suficientes, lo que reducira el tamao de la imagen anterior a apenas 1.593 KB, poco ms de 1,5 MB. Como segundo mtodo tenemos reducir la profundidad de color. Si la imagen anterior es un dibujo a tinta china, con escanear a 1 bit (en blanco y negro) puede que tengamos suficiente. Esto reducira el tamao a tan slo 1.062 KB, casi exactamente 1 MB. Por ltimo podemos archivar la imagen en formato comprimido. En este caso el tamao de la imagen en memoria permanece invariable (25 MB), pero el tamao en disco puede quedar en menos de una quinta parte sin prdida de calidad, o incluso menos si la compresin se realiza eliminando informacin redundante. Como ejemplo de formatos de archivo de imagen con compresin tenemos los JPEG (o JPG), GIF o TIFF, frente al clsico BMP que carece de compresin alguna. Lo ms importante es que podemos combinar los factores anteriores para conseguir resultados realmente optimizados; as, escaneando la imagen del ejemplo a 75 ppp, con 1 bit de color y guardndola en formato GIF, el resultado puede ocupar tan slo 66 KB en memoria y menos de 15 KB en disco. Para terminar con este tema vamos a poner una tabla resumen en la que se ilustra la cantidad de memoria RAM que ocupan algunos ejemplos tpicos de original a diferentes resoluciones y colores:
Tipo de original Fotografa 10x15 cm Destino Pantalla Impresora B/N Mtodo escaneado 75 ppp / 24 bits 300 ppp / 8 bits Tamao en RAM 0,4 MB 2 MB

Texto o dibujo en blanco y negro tamao DIN-A4 Foto DIN-A4 en color

Impresora color Pantalla Impresora OCR Pantalla Impresora

300 ppp 75 ppp / 300 ppp 300 ppp 75 ppp / 300 ppp

/ 24 bits 1 bit / 8 bit / 1 bit 24 bits / 24 bits

6 MB 66 KB 8 MB 1 MB 1,6 MB 25 MB

Formatos de escner
Escner plano (de mesa) Este es el tipo de escner ms conocido y vendido. Adems de ser sencillos en la forma de uso, tuvieron un gran auge cuando se utilizaron para publicar imgenes en Escner internet. En este tipo de escners la fuente de luz y el plano sensor CCD, se encuentran acoplados en un brazo mvil que se desliza sobre el documento que se encuentra inmvil sobre una placa de vidrio. Por lo general tienen un rea de lectura de dimensiones 22 por 28 cm y una resolucin real de escaneado entre 300 y 400 ppp aunque mediante interpolacin lleguen a resoluciones de hasta 1600 ppp. Existen escners planos profesionales que cuentan con sistemas de eliminacin de ruido electrnico, alto rango dinmico y mayores niveles de resolucin. Una variante del escner plano es el escner de libros de trayectoria area, el cual permite escanear volmenes encuadernados con las hojas hacia arriba gracias a que la fuente de luz y el sensor CCD se encuentran ensamblados a un brazo de trayectoria area.

Escner de trayectoria

Con los escners planos se pueden escanear fotografas, hojas sueltas, peridicos, libros encuadernados e incluso transparencias, diapositivas o negativos con los adaptadores adecuados.

Escner con alimentador de hojas En este tipo de escner el sensor y la fuente de luz permanecen fijos mientras que lo que se mueve es el documento, ayudado por un transporte de rodillos, cinta, tambor o de vaco. Estn diseados para documentos que sean de un tamao uniforme y con una solidez suficiente para soportar una manipulacin brusca. Son

Escner con alimentador de hojas

utilizados principalmente en negocios grandes, donde importa maximizar el rendimiento, por lo general a expensas de la calidad. Suelen escanear en blanco y negro o con una escala de grises con resoluciones relativamente bajas. Un tipo de escner con alimentador de hojas es el modelo de pie, diseado para los documentos de gran formato, como los mapas y los planos arquitectnicos.

Escner de tambor Este tipo de mquinas consiguen la mayor resolucin, que puede llegar hasta 4.000 ppp en modo ptico. Estos escners en lugar de utilizar el sensor CCD utilizan un sistema de tubos fotomultiplicadores (PMT) en el bloque lector. Un sistema de transmisin fotomecnico recorre la imagen punto por punto, obteniendo as una gran resolucin y gama dinmica entre bajas y altas luces. Produce una imagen en colores primarios, pero sta puede ser convertida en CMYK mientras el lector recorre la imagen.

Escner de tambor

Los escners de tambor son lentos, no son indicados para documentos de papel quebradizo y requieren un alto nivel de habilidad por parte del operador. Escner para transparencias Los escners para transparencias digitalizan varios formatos de pelcula transaprente, ya sea negativa, positiva, color o blanco y negro. El tamao de escaneado va desde 35 mm hasta placas de 9 x 12 cm. Por lo general el resultado es una imagen con un buen rango dinmico, sin embargo Escner para dependiendo del tamao del original, la transparencias resolucin puede ser insuficiente para algunas necesidades, adems que el rendimiento puede ser lento. El escner de mesa plana puede realizar tambin este tipo de escaneado, siempre y cuando se cuente con el adaptador necesario.

Escner de mano o portatil Es un escner pequeo, de bajo precio y buena resolucin, casi como la de los escners de mesa plana. Hasta hace unos aos eran los escners ms accesibles econmicamente, ya que los precios de los escners de mesa plana eras exageradamente caros. Su principal limitacin est en el tamao que deben tener los documentos que se desea digitalizar, generalmente el largo no importa, pero el Escner de mano o ancho no puede sobrepasar los 10 cm. Son porttil lentos y los modelos ms econmicos no manejan colores. La mayora de estos modelos carecen de un motor para pasar las hojas, es el mismo usuario el que debe deslizar el escner sobre el original. Suelen conectarse al puerto de impresora de la computadora y otros modelos llevan su propia tarjeta para puerto ISA. Este tipo de escner es muy til para digitalizar imgenes de libros encuadernados, artculos periodsticos, facturas y todo tipo de imgenes pequeas.

Conectores
La conexin por la cual se transmite la imagen digitalizada al ordenador se puede realizar actualmente por puerto SCSI, paralelo o USB. Independientemente del puerto utilizado al final siempre obtendremos una imagen digital en nuestro ordenador.

Puerto paralelo Es una conexin lenta y presenta el inconveniente de que usa el mismo puerto que la impresora. Para que funcione ste debe ser de tipo EPP o ECP y que la BIOS lo soporte.

SCSI Es una solucin mucho ms rpida pero con el conveniente del elevado coste y la necesidad de una controladora especfica para el escner que slo ste puede utilizar.

USB Hoy en da casi la totalidad se fabrican con este tipo de conexin debido a la gran tasa de transferencia conseguido con el USB 2.0 y su bajo coste.

La interfaz TWAIN
El driver TWAIN (Technology Wiithout An Interesting Name Tecnologa Sin Un Nombre Interesante). Es un protocolo creado por fabricantes de software y hardware para que cualquier aplicacin pueda adquirir imgenes desde dentro del propio programa, de manera que desde cualquier aplicacin instalada en nuestro equipo se puedan digitalizar imgenes, modificarlas y salvarla en el formato deseado. El driver TWAIN es propietario de cada marca y modelo, pero debe cumplir con las normas para que sea reconocido por cualquier aplicacin compatible con TWAIN. Normalmente todos los driver de escner son compatible con el protocolo TWAIN. Al driver TWAIN al ser especfico para cada modelo incluye ms o menos controles del escner, la cual nos permite afinar en el resultado final de la digitalizacin.

El OCR
Se trata de una de las aplicaciones ms comunes de los escners. OCR son las siglas de Optical Character Recognition, reconocimiento ptico de caracteres, o con una descripcin ms sencilla: cmo hacer para ensear a leer al ordenador. Si pensamos un poco en el proceso de escaneado que hemos descrito anteriormente, nos daremos cuenta de que al escanear un texto no se escanean letras, palabras y frases, sino sencillamente los puntos que las forman, una especie de fotografa del texto. Evidentemente, esto puede ser til para archivar textos, pero sera deseable que pudiramos coger todas esas referencias tan interesantes pero tan pesadas e incorporarlas a nuestro procesador de texto no como una imagen, sino como texto editable. Lo que desearamos en definitiva sera que el ordenador supiera leer como nosotros. Bueno, pues eso hace el OCR: es un programa que lee esas imgenes digitales y busca conjuntos de puntos que se asemejen a letras, a caracteres. Dependiendo de la complejidad de dicho programa entender ms o menos tipos de letra, llegando en algunos casos a interpretar la escritura manual, mantener el formato original (columnas, fotos entre el texto...) o a aplicar reglas gramaticales para aumentar la exactitud del proceso de reconocimiento. El primer programa de OCR fue presentado en 1959 por Intelligent Machine Corporation. Slo era capaz de leer un tipo de letra de tamao fijo de punto, se utilizaba para procesar formularios de hipotecas preimpresos, dentro del sector bancario. Posteriormente se disearon los equipos de fuentes mltiples, capaces de leer diez o ms tipos de fuentes mediante tcnicas de coincidencia de patrones, en las que se comparaba la imagen obtenida por el escner con una biblioteca de imgenes almacenadas. Estos equipos, concebidos para entornos de oficina, utilizaban bibliotecas de fuentes "teletipo", es decir, de mquinas de escribir. Otras instituciones, como las oficinas gubernamentales y empresas suministradoras de tarjetas de crdito, que requeran una precisin excepcional, utilizaban equipos informticos con fuentes personalizadas diseadas para reducir al mximo la confusin posible entre caracteres de apariencia similar. A finales de los 80 se desarrollaron sistemas que utilizaban redes neuronales, es decir algoritmos capaces de aprender a partir de ejemplos. Los desarrolladores los alimentaron con ms de 10.000

ejemplos para cada carcter en ingls, extrados de todo tipo de material real, incluso pginas daadas. Esto dio como resultado un sistema de OCR lo suficientemente inteligente como para controlar fuentes que nunca haba encontrado hasta entonces, y mucho ms eficaz a la hora de reconocer documentos daados. Hoy en da se usan algoritmos expertos, diseados especficamente para diferentes campos del reconocimiento de caracteres. Uno de ellos puede saber mucho sobre estilos de fuentes, otro sobre cmo utilizar informacin de diccionarios, mientras otro identifica daos especficos de las hojas. Cada uno podra de este modo indicar su "voto" acerca de la interpretacin del carcter, de tal modo de elegirse el que ms votos recibe. Aunque una votacin tiene ventajas sobre la simple coincidencia de patrones, tambin presenta problemas. En primer lugar, no todos los expertos tienen el mismo peso. Algunos tienen carencias o no ven aspectos que otros s encuentran. An as, sus votos pueden contar con el mismo peso que el de otros expertos ms confiables. Para hacerse una idea de cmo funciona un OCR vea la siguiente figura.

Figura 1 Para comprender de qu letra se trata supongamos que el OCR consulta a tres expertos clasificadores. El primero cree que la letra corresponde a una "c" y su grado de convencimiento es 8. El segundo afirma: "c", y su grado de convencimiento es 4. El tercero dice que puede tratarse de la letra "c", con un convencimiento igual a 3, pero tambin de la letra "e" con un grado de convencimiento 2. Por ahora, el motor del OCR no saca ninguna conclusin. Espera a que termine el examen del resto de los caracteres en la palabra, y quizs, del resto de la pgina. Mientras tanto almacena la estimacin de probabilidades de las distintas opciones de decisin. Hasta donde llega la evidencia, existen dos opciones, "c" y "e". Al estimar las probabilidades, el motor considera: La fiabilidad general de los diferentes expertos. El experto 1 acierta un 95 por ciento de las veces, y el experto 2 un 90 por ciento. El grado de convencimiento de cada experto. El convencimiento del experto 2 es casi siempre elevado cuando acierta. Al observar que esta vez el experto 2 no se muestra demasiado convencido, el detective decide restarle peso a su estimacin.

La fiabilidad de los expertos en situaciones similares a la actual. El experto 1 es muy bueno con imgenes ntidas pero no tanto cuando estn "recortadas". sta es una buena razn para pensar (aqu, testimonios de otros expertos) que esta porcin de la pgina est cortada. Cuanto ms se convence el detective de que esta porcin de la pgina est cortada, disminuye ms el crdito que atribuye a la opinin del experto 1, y aumenta el peso del experto 3, del que sabe que es muy bueno con caracteres daados. El detective combina todas las posibilidades hasta obtener una probabilidad general para cada opcin. Para ampliar informacin, el detective considera una porcin mayor de la palabra.

Figura 2 El OCR consulta a tres expertos clasificadores. Sus respuestas se muestran en la Figura 2. Ahora se dan numerosas opciones a investigar: "ebo," "cbo," "eho," "cho,"... Por supuesto, en la realidad se consultaran ms de tres clasificadores. Uno de los clasificadores ms importantes es el experto en segmentaciones. Al iniciar esta descripcin, explicamos que el motor de OCR realiza una modelizacin de puntos en la imagen escaneada para aislar caracteres. Este proceso se denomina segmentacin. En funcin de la calidad de la pgina original, el proceso inicial puede presentar grandes dificultades. En el ejemplo que hemos visto, el motor deduce que la segmentacin original puede no ser la correcta. El motor interroga a varios expertos en segmentaciones acerca de agrupaciones alternativas, y a continuacin hace lo mismo con otros expertos clasificadores, con el fin de generar nuevas opciones posibles dentro del abanico de probabilidades vigentes.

Figura 3

Existen tres opciones diferentes, mostradas en la Figura 3. Debido a la exponenciacin, no es infrecuente encontrarse con una explosin de millones de opciones diferentes. Lo que ms impresiona del modo de operar del motor es que analiza y descarta estas opciones una tras otra hasta quedarse con el carcter ms probable... en un abrir y cerrar de ojos.

Adems de un diseo ingenioso y un aprovechamiento perspicaz de las mejores cualidades de ambos motores, conviene reconocer tambin la importancia que tienen aqu los microprocesadores actuales, con mayores prestaciones, as como la mayor cantidad de memoria disponible en los equipos de sobremesa modernos. En el pasado, los desarrolladores no hubieran podido crear la mquina POWR++, incluso de querer hacerlo, porque los equipos de entonces no la hubieran podido ejecutar.