MANUAL MANUAL MANUAL MANUAL MANUAL DEL USUARIO DEL USUARIO DEL USUARIO DEL USUARIO DEL USUARIO foreword.pmd 3/04/2006, 15:34 1 II Readiris Pro 1990-2006 I.R.I.S. Reservados todos los derechos Tecnologa de OCR propriedad de I.R.I.S. Tecnologas Connectionist, AutoFormat y tecnologa lingstica propriedad de I.R.I.S. Tecnologa de ICR y de lectura de cdigos de barras de I.R.I.S. 1990-2006 I.R.I.S. Reservados todos los derechos foreword.pmd 3/04/2006, 15:34 2 III MANUAL DEL USUARIO A A A A AHORRE HORRE HORRE HORRE HORRE TIEMPO TIEMPO TIEMPO TIEMPO TIEMPO, , , , , NO NO NO NO NO VUEL VUEL VUEL VUEL VUELV VV VVA AA AA A AA AA TECLEAR TECLEAR TECLEAR TECLEAR TECLEAR! !! !! Queremos darle la enhorabuena por haber adquirido Readiris. Este paquete de software le resultar, sin duda, de gran ayuda a la hora de capturar textos, tablas, grficos, cdigos de barras y incluso textos escritos a mano. Por eficientes que sean los ordenadores, primero tiene que teclear su informacin. Si alguna vez ha tenido que volver a teclear un informe de 15 pginas o una amplia tabla de cifras, sabr lo tedioso y prolongado que puede ser. Utilice este innovador paquete de software de OCR para introducir texto automticamente en sus aplicaciones y disfrute de un nivel de eficiencia y comodidad sin precedentes. (Hay dos modos de reconocimiento disponibles: uno que garantiza una velocidad ptima, y otro que garantiza una precisin de OCR ptima.) Escanee cualquier documento impreso o mecanografiado, indique las zonas de inters - o deje que el sistema lo haga por usted -, ejecute el reconocimiento de caracteres y exporte el documento al procesador de textos que prefiera. Los documentos de mltiples pginas se procesan de principio a fin de una sola vez. Unos cuantos clics con el ratn equivalen a largas horas de trabajo, puesto que Readiris convierte sus documentos en papel en archivos digitales modificables hasta 40 veces ms rpido que si volviese a teclearlos. El asistente de OCR lo ayudar durante el proceso de reconocimiento: responda a unas simples preguntas para obtener rpidos resultados con Readiris! Podr enviar directamente el resultado del reconocimiento a un procesador de textos o a una hoja de clculo. Para reconocer un fax y convertir documentos PDF, basta con arrastrar el archivo desde el Explorador de Windows hasta la ventana de la aplicacin Readiris. O hacer clic sobre cualquier imagen con el botn secundario del ratn para enviarla inmediatamente a Readiris. Readiris reconoce datos tabulados y los reproduce como hojas de clculo o como objetos de tabla en un procesador de textos; los datos numricos estn as listos para ser procesados. Basado en la tecnologa Connectionist de I.R.I.S., Readiris representa lo me- jor que puede ofrecer el reconocimiento de caracteres. La extraccin de carac- foreword.pmd 3/04/2006, 15:34 3 IV tersticas independiente de las fuentes est complementada por tcnicas de autoaprendizaje derivadas de una red neural patentada. El sistema puede apren- der nuevos caracteres mediante anlisis del contexto: los conocimientos lingsticos sobre slabas y palabras mejoran el rendimiento del reconocimiento. Readiris reconoce hasta 126 idiomas: todos los idiomas americanos y europeos, incluyendo los idiomas centroeuropeos y blticos, adems de los alfabetos cirlico (ruso) y griego. (Opcionalmente, puede reconocer documentos escritos en rabe y en cuatro idiomas asiticos: el japons, el chino simplificado, el chino tradicional y el coreano.) Readiris puede procesar incluso alfabetos mixtos: el programa detecta las palabras occidentales que aparecen en documentos escritos en griego, cirlico, rabe o alguna lengua asitica, como muchos nombres propios, nombres de marcas, etc. que no se pueden transcribir y se escriben utilizando los smbolos occidentales. Readiris usa la lingstica durante la fase de reconocimiento, no despus. Como resultado de ello, Readiris reconoce documentos de todo tipo con mxima precisin, incluyendo documentos de baja calidad, faxes e impresiones con matriz de agujas. Procesa los documentos mal escaneados y copiados que contienen formas de fuentes demasiado claras u demasiado oscuras. Los caracteres unidos entre s (ligaduras) se resuelven y las formas fragmentadas, como los smbolos de las matrices de agujas, se vuelven a componer. La ventana de verificacin por parte del usuario no slo destaca los caracte- res dudosos, sino que tambin aumenta la precisin del sistema. Todas las solu- ciones confirmadas por el usuario se almacenan en memoria, aumentando as la velocidad y confianza a medida que trabaja. Usar Readiris significa hacerlo ms inteligente cada vez! Esta potente herramienta de aprendizaje le permite ensear a Readiris para que reconozca caracteres especiales, como smbolos matemti- cos y dingbats, e incluso procesar fuentes distorsionadas como las que se en- cuentran en los documentos de la vida real. Para aumentar an ms su productividad, Readiris no slo reconoce textos, sino que tambin puede darles formato. Si utiliza el formato automtico, Readiris reproducir una copia facsmil del documento escaneado, manteniendo el forma- to de las palabras, prrafos y pginas del documento original. foreword.pmd 3/04/2006, 15:34 4 V MANUAL DEL USUARIO Se utilizan tipos de letras similares, los tamaos y estilos usados en el documento original se mantienen tras el reconocimiento. La colocacin de columnas, bloques de texto y grficos imita la de los documentos originales. Y como Readiris escanea sin ningn problema imgenes en escala de grises o en color, puede capturar cualquier grfico - ya sean dibujos, fotografas en blanco y negro o ilustraciones en color. Cuando el documento contiene tablas, Readiris las recoloca imitando perfectamente las celdas y reproduciendo los bordes de las tablas originales. En otras palabras, Readiris le permite archivar una copia fiel de sus documen- tos en forma de archivos digitales de texto que puede modificar en lugar de una imagen escaneada. Existen varios niveles de formato, la eleccin la tiene el usua- rio. Tambin es posible leer los cdigos de barras que aparezcan en las pginas escaneadas, as como cualquier tipo de texto escrito a mano - siempre que se haya escrito utilizando letras de palo seco debidamente separadas entre ellas. Readiris permite utilizar una amplia gama de escneres: escneres planos, escneres con alimentador de hojas, perifricos multifuncionales (MFP - mul- tifunctional peripheral) y cmaras digitales. Readiris tambin cumple la norma Twain y, adems, puede utilizarse en algunas plataformas de escaneado. El escaneado a intervalos le permite escanear documentos de mltiples pginas de manera eficiente si su escner no dispone de alimentador de documentos. T TT TTABLA ABLA ABLA ABLA ABLA DE DE DE DE DE MA MA MA MA MATERIAS TERIAS TERIAS TERIAS TERIAS Ahorre tiempo, no vuelva a teclear! ............................................................................. III Tabla de materias ........................................................................................................... V Crditos y derechos de autor ....................................................................................... VII Captulo 1: Instalacin Captulo 1: Instalacin Captulo 1: Instalacin Captulo 1: Instalacin Captulo 1: Instalacin Requisitos del sistema ................................................................................................. 1-1 Instalacin del software de Readiris ............................................................................ 1-1 Desinstalacin del software de Readiris ...................................................................... 1-3 Instalacin de software opcional ................................................................................. 1-4 Instalacin de productos relacionados ........................................................................ 1-6 foreword.pmd 3/04/2006, 15:34 5 VI Archivos instalados ..................................................................................................... 1-8 Archivo Lame y documentacin ............................................................................................... 1-8 Patrn de escritura ............................................................................................................................ 1-8 Regstrese! .................................................................................................................. 1-8 Cmo obtener asistencia tcnica ............................................................................... 1-10 Captulo 2: Captulo 2: Captulo 2: Captulo 2: Captulo 2: V VV VVisita guiada isita guiada isita guiada isita guiada isita guiada Inicio del software ........................................................................................................ 2-1 Primera ejecucin ......................................................................................................... 2-2 Descubrir el interfaz de Readiris ................................................................................... 2-2 Primera leccin introductoria ....................................................................................... 2-5 Ampliacin de imgenes ............................................................................................ 2-10 Uno, descomponer una imagen escaneada ................................................................ 2-13 Una y media, clasificacin de ventanas ..................................................................... 2-16 Dos, trazar ventanas manualmente ............................................................................ 2-19 Tres, guardar modelos de ventanas ........................................................................... 2-23 Readiris lo lleva por todo el mundo............................................................................ 2-25 Readiris cambia de idioma cuando es necesario ........................................................ 2-30 Definir las caractersticas del documento................................................................... 2-33 Velocidad contra precisin ......................................................................................... 2-35 Readiris se hace cada vez ms inteligente! ............................................................... 2-37 Aprender ........................................................................................................................................... 2-39 Descartar Aprendizaje ..................................................................................................................... 2-40 Borrar ................................................................................................................................................ 2-41 Deshacer ........................................................................................................................................... 2-41 Terminar ........................................................................................................................................... 2-41 Cancelar ............................................................................................................................................ 2-41 Papel de los diccionarios de fuentes .......................................................................... 2-41 Envo de resultados a la aplicacin de trabajo ........................................................... 2-44 Guardar los resultados en un archivo de texto ........................................................... 2-48 Creacin de documentos porttiles ............................................................................ 2-51 ... o reconocimiento de dichos documentos ............................................................... 2-60 Reconocimiento de varias pginas ............................................................................ 2-63 Edicin de documentos de mltiples pginas ............................................................ 2-73 Abrir un nuevo documento........................................................................................ 2-75 Reconocimiento de zonas de texto ............................................................................. 2-76 Organizacin del texto resultante ............................................................................... 2-77 Configuracin del escner ......................................................................................... 2-79 foreword.pmd 3/04/2006, 15:34 6 VII MANUAL DEL USUARIO Ponga colores en sus textos digitalizados! ................................................................ 2-81 Aparatos distintos, resolucin distinta...................................................................... 2-84 Guardar la configuracin predeterminada .................................................................. 2-89 Guardar propiedades especficas ............................................................................... 2-90 Escanear documentos ................................................................................................ 2-91 Ajuste de las imgenes escaneadas ........................................................................... 2-95 Deje que el asistente trabaje por usted .................................................................... 2-100 Readiris reproduce el diseo de sus documentos .................................................... 2-101 Utilice columnas en lugar de cuadros ...................................................................... 2-106 Formato de textos, 2 parte ....................................................................................... 2-109 Exportar el texto varias veces ................................................................................... 2-110 Guardar grficos por separado ................................................................................. 2-111 Recrear columnas, cuadros, etc. de color ................................................................. 2-114 Conservar los colores del texto ................................................................................ 2-116 Lectura de faxes y reconocimiento diferido.............................................................. 2-118 Reconocimiento de tablas ........................................................................................ 2-120 Reconocimiento de textos escritos a mano .............................................................. 2-128 Lectura de barras y espacios ................................................................................... 2-133 Cmo obtener ayuda en lnea................................................................................... 2-136 C CC CCRDIT RDIT RDIT RDIT RDITOS OS OS OS OS Y YY YY DERECHOS DERECHOS DERECHOS DERECHOS DERECHOS DE DE DE DE DE AUT AUT AUT AUT AUTOR OR OR OR OR El programa Readiris ha sido diseado y desarrollado por I.R.I.S. Las tecnologas de OCR, ICR, lectura de cdigos de barras, Connectionist, AutoFormat y lingstica son propiedad de I.R.I.S. Asmismo, I.R.I.S. detenta los derechos de autor del software Readiris, de la tecnologa de OCR, de la tecnologa de ICR, de la tecnologa de lectura de cdigos de barras, de la tecnologa lingstica, del sistema de ayuda en lnea y del presente manual. AutoFormat, Cardiris, Connectionist, el logotipo de I.R.I.S., Readiris y la tecnologa lingstica I.R.I.S. son marcas de I.R.I.S. Analizador sintctico XML desarrollado por Apache. Este producto incluye software desarrollado por la Apache Software Foundation (www.apache.org). foreword.pmd 3/04/2006, 15:34 7 VIII Acrobat y Reader son marcas (registradas) de Adobe. Excel, Windows y Word son marcas de Microsoft. Intel es una marca registrada de Intel. foreword.pmd 3/04/2006, 15:34 8 1 - 1 MANUAL DEL USUARIO Captulo 1 INSTALACIN Este captulo describe los requisitos del sistema y la instalacin del software Readiris. R RR RREQUISITOS EQUISITOS EQUISITOS EQUISITOS EQUISITOS DEL DEL DEL DEL DEL SISTEMA SISTEMA SISTEMA SISTEMA SISTEMA sta es la configuracin mnima del sistema necesaria para utilizar Readiris: un procesador Intel 486 o compatible. Se recomienda un procesador Pentium. 64 MB de RAM. Se recomiendan 128 MB para procesar imgenes en escala de grises o en color. 120 MB de espacio en el disco duro. Bastarn 105 MB si deja los archivos de muestra en el CD-ROM. sistema operativo Windows XP, Windows ME, Windows 2000, Win- dows 98 o Windows NT 4.0. Puede que algunos controladores de escner controladores de escner controladores de escner controladores de escner controladores de escner no funcionen con la(s) ltima(s) versin(es) de Windows. Consulte la documentacin del escner para ver qu plataformas pueden utilizarse. I II IINST NST NST NST NSTALACIN ALACIN ALACIN ALACIN ALACIN DEL DEL DEL DEL DEL SOFTW SOFTW SOFTW SOFTW SOFTWARE ARE ARE ARE ARE DE DE DE DE DE R RR RREADIRIS EADIRIS EADIRIS EADIRIS EADIRIS El programa Readiris se entrega exclusivamente en un CD-ROM CD-ROM CD-ROM CD-ROM CD-ROM autoejecutante autoejecutante autoejecutante autoejecutante autoejecutante. Para instalarlo, simplemente introduzca el CD-ROM en la unidad de CD-ROM y espere a que el programa de instalacin comience a ejecutarse. Siga las instrucciones que aparecen en la pantalla. chapter1.pmd 3/04/2006, 15:36 1 1 - 2 Si la instalacin no comienza a ejecutarse con el CD-ROM introducido en la unidad de CD-ROM, ejecute el programa MENU.EXE para instalar el programa. Los usuarios de Windows XP, Windows 2000 y Windows NT 4.0 deben comprobar que tienen los derechos de acceso derechos de acceso derechos de acceso derechos de acceso derechos de acceso adecuados. Si fuera necesario, debern ponerse en contacto con el administrador del sistema. El usuario puede escoger entre una instalacin completa y una instalacin personalizada. Asegrese de instalar las bases de datos lingsticas bases de datos lingsticas bases de datos lingsticas bases de datos lingsticas bases de datos lingsticas de todos los idiomas con los que piensa trabajar. Por defecto, se instalan todas. Le recomendamos que tambin instale las imgenes de muestra imgenes de muestra imgenes de muestra imgenes de muestra imgenes de muestra que se usan en los tutoriales del presente manual. De igual manera, el manual electrnico manual electrnico manual electrnico manual electrnico manual electrnico se copia por defecto en el disco duro, pero puede dejarlo en el CD-ROM. (Asegrese de instalar Abobe Reader para acceder a la documentacin del programa Readiris en caso necesario.) chapter1.pmd 3/04/2006, 15:36 2 1 - 3 MANUAL DEL USUARIO El programa de instalacin crea automticamente el submen "Aplicaciones I.R.I.S. - Readiris" en el men "Programas". Har lo mismo creando un acceso directo acceso directo acceso directo acceso directo acceso directo a Readiris en el escritorio escritorio escritorio escritorio escritorio de Windows. As podr usted lanzar Readiris directamente desde su escritorio. D DD DDESINST ESINST ESINST ESINST ESINSTALACIN ALACIN ALACIN ALACIN ALACIN DEL DEL DEL DEL DEL SOFTW SOFTW SOFTW SOFTW SOFTWARE ARE ARE ARE ARE DE DE DE DE DE R RR RREADIRIS EADIRIS EADIRIS EADIRIS EADIRIS Slo hay una forma correcta de eliminar Readiris: utilizando el asistente de (des)instalacin de Windows. Le recomendamos encarecidamente no desinstalar Readiris o sus mdulos de software borrando manualmente los archivos de programa. Ejecute los siguientes pasos para utilizar el programa automtico de programa automtico de programa automtico de programa automtico de programa automtico de (des)instalacin de (des)instalacin de (des)instalacin de (des)instalacin de (des)instalacin de W WW WWindows indows indows indows indows. Haga clic en "Configuracin" en el men "Inicio" de Windows y vaya al "Panel de Control". Haga clic en el "Agregar o Quitar Programas" situado en el panel de control. chapter1.pmd 3/04/2006, 15:37 3 1 - 4 Siga las instrucciones que aparecen en pantalla para eliminar el soft- ware de Readiris. I II IINST NST NST NST NSTALACIN ALACIN ALACIN ALACIN ALACIN DE DE DE DE DE SOFTW SOFTW SOFTW SOFTW SOFTWARE ARE ARE ARE ARE OPCIONAL OPCIONAL OPCIONAL OPCIONAL OPCIONAL Existe un software opcional complementario a Readiris. Se trata del Mdulo Mdulo Mdulo Mdulo Mdulo de OCR asitico de OCR asitico de OCR asitico de OCR asitico de OCR asitico, que le permitir reconocer documentos en japons, chino simplificado, tradicional y coreano. chapter1.pmd 3/04/2006, 15:37 4 1 - 5 MANUAL DEL USUARIO Este software se suministra asimismo en un CD-ROM autoejecutable. Al instalar esta opcin, se habilitar la documentacin especfica en la que se explica cmo reconocer documentos escritos en lenguas asiticas. chapter1.pmd 3/04/2006, 15:37 5 1 - 6 I II IINST NST NST NST NSTALACIN ALACIN ALACIN ALACIN ALACIN DE DE DE DE DE PRODUCT PRODUCT PRODUCT PRODUCT PRODUCTOS OS OS OS OS RELACIONADOS RELACIONADOS RELACIONADOS RELACIONADOS RELACIONADOS Segn del paquete de software que haya adquirido, Readiris puede suministrarse con una versin de evaluacin del producto Cardiris, un organizador de tarjetas organizador de tarjetas organizador de tarjetas organizador de tarjetas organizador de tarjetas de visita de visita de visita de visita de visita. Si su versin de Readiris contiene este programa gratuito, tambin se instalar mediante el programa autoejecutable del CD-ROM. Siga para ello las instrucciones que aparecen en pantalla. Pngase en contacto con I.R.I.S. para obtener ms informacin acerca de este software; la opcin "Contactar con I.R.I.S" del men "Ayuda" de Readiris describe las formas en que puede ponerse en contacto con I.R.I.S. chapter1.pmd 3/04/2006, 15:37 6 1 - 7 MANUAL DEL USUARIO Un icono del submen "Aplicaciones I.R.I.S. - Readiris" del men "Programas" lo conducir directamente a la pgina web pgina web pgina web pgina web pgina web de I.R.I.S. Tambin podr acceder a esta pgina desde la pantalla de inicio del programa, o seleccionando la opcin "I.R.I.S. en Internet" del men "Ayuda". chapter1.pmd 3/04/2006, 15:37 7 1 - 8 A AA AARCHIVOS RCHIVOS RCHIVOS RCHIVOS RCHIVOS INST INST INST INST INSTALADOS ALADOS ALADOS ALADOS ALADOS El programa de instalacin crea una carpeta en la que se localizan los archivos de Readiris. Nunca intente desinstalar Readiris o alguno de sus mdulos borrando manualmente los archivos de programa, utilice el programa automtico de (des)instalacin de Windows. Vase ms arriba. Archivo Lame y documentacin Archivo Lame y documentacin Archivo Lame y documentacin Archivo Lame y documentacin Archivo Lame y documentacin README.HTM Archivo Lame (en formato HTML) MANUAL.PDF Manual del usuario (en formato Adobe Acrobat) Patrn de escritura Patrn de escritura Patrn de escritura Patrn de escritura Patrn de escritura TEMPLATE.PDF Patrn de escritura en blanco para reimprimir (en formato Adobe Acrobat) TEMPLATE.DOC Patrn de escritura en blanco para editar (en formato Word) R R R R REGSTRESE EGSTRESE EGSTRESE EGSTRESE EGSTRESE! !! !! No olvide de registrar su licencia Readiris. Si lo hace lo mantendremos informado sobre futuros productos y productos conexos de I.R.I.S. Las ventajas de registrarse, como la asistencia asistencia asistencia asistencia asistencia gratuita y las ofertas especiales ofertas especiales ofertas especiales ofertas especiales ofertas especiales, estn reservadas estrictamente a los usuarios registrados. Puede registrarse de muchas formas: envindonos por correo el formulario de registro, o por fax el formulario electrnico, llamando a I.R.I.S. en horas de oficina, o bien completando el formulario de registro en la pgina web de I.R.I.S. chapter1.pmd 3/04/2006, 15:37 8 1 - 9 MANUAL DEL USUARIO El asistente de registro asistente de registro asistente de registro asistente de registro asistente de registro de Readiris, que encontrar en el men "Registrar" del programa Readiris, lo guiar cmodamente durante todo el proceso. chapter1.pmd 3/04/2006, 15:37 9 1 - 10 Dependiendo de la versin adquirida, recibir la clave de acceso clave de acceso clave de acceso clave de acceso clave de acceso necesario para continuar utilizando el programa Readiris despus de un mes de demostracin. C CC CCMO MO MO MO MO OBTENER OBTENER OBTENER OBTENER OBTENER ASISTENCIA ASISTENCIA ASISTENCIA ASISTENCIA ASISTENCIA TCNICA TCNICA TCNICA TCNICA TCNICA La opcin "Asistencia Tcnica" del men "Ayuda" de Readiris explica cmo obtener asistencia tcnica. Describa claramente lo que le sucede e incluya toda la informacin pertinente sobre Readiris, su escner y su sistema informtico. chapter1.pmd 3/04/2006, 15:37 10 1 - 11 MANUAL DEL USUARIO Antes de solicitar asistencia tcnica, le recomendamos que compruebe si hay actualizaciones de actualizaciones de actualizaciones de actualizaciones de actualizaciones de software software software software software disponibles para ser descargadas. Utilice la opcin "Buscar Actualizaciones" del men "Ayuda" para hacerlo. chapter1.pmd 3/04/2006, 15:37 11 1 - 12 chapter1.pmd 3/04/2006, 15:37 12 2 - 1 MANUAL DEL USUARIO Captulo 2 VISITA GUIADA Readiris es un paquete con la tecnologa OCR de punta provisto de numerosas caractersticas avanzadas. En este captulo describiremos todas sus principales caractersticas y aadiremos consejos sobre el uso de Readiris. I II IINICIO NICIO NICIO NICIO NICIO DEL DEL DEL DEL DEL SOFTW SOFTW SOFTW SOFTW SOFTWARE ARE ARE ARE ARE Haga clic en el submen "Aplicaciones I.R.I.S. - Readiris", o en el acceso directo a la aplicacin Readiris situada en su escritorio. Se visualizarn la pantalla de inicio y la ventana de la aplicacin Readiris. La pantalla de inicio muestra la versin y los derechos de autor del programa Readiris. Le permite tambin un acceso directo a la portada web portada web portada web portada web portada web de I.R.I.S. - haga clic en la direccin URL para acceder a la pgina. Esta pantalla desaparecer haciendo clic en cualquier otra zona. La siguiente ventana se refiere al asistente de OCR. Haga clic en "Cancelar". chapter2.pmd 3/04/2006, 15:38 1 2 - 2 P PP PPRIMERA RIMERA RIMERA RIMERA RIMERA EJECUCIN EJECUCIN EJECUCIN EJECUCIN EJECUCIN Dependiendo del paquete de software que haya adquirido, la primera ejecucin puede ser especial, pues se le pedir que registre su licencia. En tal caso, la utilizacin de Readiris est limitada a un mes y, al registrarse, recibir de I.R.I.S. una clave de acceso clave de acceso clave de acceso clave de acceso clave de acceso gratuita para continuar utilizando el software transcurrido dicho plazo. Necesitar su nmero de identificacin nmero de identificacin nmero de identificacin nmero de identificacin nmero de identificacin para generar la clave de acceso; asegrese de disponer de dicho nmero o de mencionarlo al registrar su licencia. D DD DDESCUBRIR ESCUBRIR ESCUBRIR ESCUBRIR ESCUBRIR EL EL EL EL EL INTERF INTERF INTERF INTERF INTERFAZ AZ AZ AZ AZ DE DE DE DE DE R RR RREADIRIS EADIRIS EADIRIS EADIRIS EADIRIS La ventana de aplicacin de Readiris no slo contiene mens de opciones mens de opciones mens de opciones mens de opciones mens de opciones, sino tambin dos barras de botones que permiten acceder rpidamente a todas las opciones frecuentes. Al principio, algunos mens estn difuminados, pues se refieren a la vista preliminar. Mientras no se abra una imagen, no se puede dis- poner de ellos. chapter2.pmd 3/04/2006, 15:38 2 2 - 3 MANUAL DEL USUARIO Otro tanto sucede con la barra de herramientas de imagen barra de herramientas de imagen barra de herramientas de imagen barra de herramientas de imagen barra de herramientas de imagen situada a la derecha de la ventana de aplicacin: contiene todas las opciones que necesita durante la vista preliminar de la imagen. La barra principal de herramientas barra principal de herramientas barra principal de herramientas barra principal de herramientas barra principal de herramientas situada a la izquierda permite acceder rpidamente a todas las opciones gen- erales usadas con frecuencia. chapter2.pmd 3/04/2006, 15:39 3 2 - 4 Para saber la opcin que corresponde a cada botn, coloque el cursor del ratn sobre este ltimo durante un momento: una etiqueta emergente etiqueta emergente etiqueta emergente etiqueta emergente etiqueta emergente le dir lo que hace el botn. La parte interior de la ventana o zona de imagen zona de imagen zona de imagen zona de imagen zona de imagen es donde se muestran las imgenes escaneadas. Puede arrastrar los archivos grficos hacia la zona de imgenes (o hacia el icono de Readiris) para reconocerlos. Cuando se procesan pginas, en la parte izquierda aparecer una nueva barra de herramientas, denominada barra de herramientas de pgina barra de herramientas de pgina barra de herramientas de pgina barra de herramientas de pgina barra de herramientas de pgina. En esta barra se representan las distintas pginas del documento y permite el acceso a las funciones de pgina haciendo clic con el botn secundario del ratn. (Se abre el men "Contexto".) chapter2.pmd 3/04/2006, 15:39 4 2 - 5 MANUAL DEL USUARIO A continuacin, aparece el panel de documentos panel de documentos panel de documentos panel de documentos panel de documentos debajo de la imagen escaneada. En l podr encontrar estadsticas estadsticas estadsticas estadsticas estadsticas e informacin acerca de todas las pginas escaneadas - la imagen original y su resolucin, el tiempo empleado en los procesos de escaneado y reconocimiento, etc. (El panel de documentos tambin incluye mensajes emergentes...) P PP PPRIMERA RIMERA RIMERA RIMERA RIMERA LECCIN LECCIN LECCIN LECCIN LECCIN INTRODUCTORIA INTRODUCTORIA INTRODUCTORIA INTRODUCTORIA INTRODUCTORIA La mejor manera de familiarizarse con el manejo de Readiris es sin duda utilizndolo. El programa contiene una serie de imgenes ya escaneadas imgenes ya escaneadas imgenes ya escaneadas imgenes ya escaneadas imgenes ya escaneadas que chapter2.pmd 3/04/2006, 15:39 5 2 - 6 le permitirn comenzar incluso si no tiene un escner conectado a su ordenador. Pasemos a estas imgenes. El botn "Fuente" de la barra principal de herramientas determina si va a utilizar un escner o una imagen ya escaneada como origen de la imagen. Readiris reconoce igualmente imgenes en color, en escala de grises y en blanco y negro. Readiris le permite abrir documentos PDF de Adobe Acrobat y archivos de imagen en los formatos fax DCX (una versin multipgina del formato Paintbrush), DjVu (*.djv, *.djvu), JPEG, JPEG 2000 (*.j2c, *.jp2), PNG, TIFF (no comprimidas o con compresin LZW, PackBits, Grupo 3, Grupo 4 o JPEG), TIFF de mltiples pginas, mapas de bits de Windows (*.bmp) y ZSoft Paintbrush (*.pcx). Esta funcin resulta especialmente til para convertir sus faxes faxes faxes faxes faxes en archivos digitales de texto. Cuando vaya a abrir una imagen ya escaneada, con el botn "Fuente" de la barra principal de herramientas seleccione el disco y no el escner como origen de la imagen. A continuacin haga clic en el botn "Abrir". (Cuando selecciona el disco como origen de la imagen, al botn "Escanear" lo sustituye el botn "Abrir". Asimismo, el mando "Escanear" del men "Accin" la sustituye el mando "Abrir".)
chapter2.pmd 3/04/2006, 15:39 6 2 - 7 MANUAL DEL USUARIO A continuacin haga clic en el botn "Abrir" del men "Archivo" y abre una imagen escaneada previamente - esto es posible incluso si su escner funciona como origen actual de la imagen. Se le pedir que elija un archivo grfico. Seleccione el archivo SPANISH.JPG de la carpeta "Samples", una subcarpeta de la carpeta donde est instalado Readiris. (Todas las imgenes de muestra se encuentran en esta carpeta!) Como se trata de una imagen en color, adems de leerla directamente desde el disco, se crea una versin binaria, en blanco y negro, para el proceso de OCR.
Finalmente, la imagen se visualiza en la zona de imgenes, y la barra de herramientas de pgina y el panel de documentos indican que se ha cargado una pgina en Readiris. chapter2.pmd 3/04/2006, 15:39 7 2 - 8 Una tercera forma de abrir imgenes ya escaneadas es el arrastre con el arrastre con el arrastre con el arrastre con el arrastre con el ratn ratn ratn ratn ratn: arrastre imgenes desde el Explorador de Windows hacia la zona de imagen de Readiris o hacia el icono de Readiris y se abrirn inmediatamente. chapter2.pmd 3/04/2006, 15:39 8 2 - 9 MANUAL DEL USUARIO Por ltimo, podr abrir imgenes directamente desde el Explorador de Win- dows haciendo clic con el botn derecho haciendo clic con el botn derecho haciendo clic con el botn derecho haciendo clic con el botn derecho haciendo clic con el botn derecho del ratn en un archivo grfico y seleccionando el mando "Reconocer" del men "Contexto". (Esto mando slo estar disponible si el archivo en cuestin pertenece a alguno de los reconocidos por el programa.) chapter2.pmd 3/04/2006, 15:39 9 2 - 10 Esto no significa que el OCR se efecte inmediatamente. Con el fin de proporcionar al usuario la mxima flexibilidad de uso, nicamente se ejecuta la aplicacin Readiris y se abre la imagen. La barra de herramientas de imagen situada a la derecha de la ventana de aplicacin de Readiris contiene todas las opciones que necesita durante la vista preliminar de la imagen: herramientas para indicar las zonas de inters, para girar la imagen, para ampliarla o reducirla, etc. A AA AAMPLIACIN MPLIACIN MPLIACIN MPLIACIN MPLIACIN DE DE DE DE DE IMGENES IMGENES IMGENES IMGENES IMGENES Readiris cuenta con varias opciones que le permiten ampliar ampliar ampliar ampliar ampliar la imagen escaneada, por ejemplo, para verificar la calidad de escaneado. La barra de herramientas de imagen contiene botones que le permiten ampliar a tamao real, ajustar la imagen al ancho de pgina y ajustar toda la imagen en la chapter2.pmd 3/04/2006, 15:39 10 2 - 11 MANUAL DEL USUARIO ventana de vista preliminar. El men "Ver" contiene las mismas opciones y aade dos niveles adicionales de ampliacin: puede mostrar la imagen al 50% y al 200% de su tamao real. En tamao real, un pixel de pantalla corresponde a un pixel de la imagen. (Hay mtodos abreviados de teclado para todos los niveles de zoom.)
Observe tambin que dispone de un aceso a los niveles de ampliacin gracias al clic derecho. Haga clic con el botn derecho del ratn para que aparezca el menu contextual y seleccione el nivel de ampliacin adecuado. chapter2.pmd 3/04/2006, 15:39 11 2 - 12 Adems, puede hacer doble clic con el botn derecho del ratn en una zona de la imagen escaneada para ampliarla inmediatamente a tamao real. Repita la operacin para volver a disminuirla. Por ltimo, puede utilizar la lupa lupa lupa lupa lupa para ampliar detalles del documento escaneado. La lupa de aumento tambin est disponible en el men contextual al hacer clic sobre la imagen con el botn derecho del ratn.
Pulse Escape o haga clic con el ratn para que vuelva a desaparecer la lupa. chapter2.pmd 3/04/2006, 15:39 12 2 - 13 MANUAL DEL USUARIO U UU UUNO NO NO NO NO, , , , , DESCOMPONER DESCOMPONER DESCOMPONER DESCOMPONER DESCOMPONER UNA UNA UNA UNA UNA IMAGEN IMAGEN IMAGEN IMAGEN IMAGEN ESCANEADA ESCANEADA ESCANEADA ESCANEADA ESCANEADA Una vez escaneada la imagen debe indicar las partes que desea convertir en texto modificable trazando marcos, denominados ventanas, alrededor de las zonas de inters. De hecho, Readiris lo har automticamente si activa la opcin "Anlisis de Pgina" desde el botn "Opciones" de la barra de herramientas principal (o desde el men "Configuracin"). La descomposicin automtica de pginas resulta especialmente til para reconocer textos con columnas textos con columnas textos con columnas textos con columnas textos con columnas y documentos con un diseo de pgina complejo (incluirn posiblemente grficos y tablas). chapter2.pmd 3/04/2006, 15:39 13 2 - 14 La divisin de pgina se realiza mediante tres tipos de ventanas tipos de ventanas tipos de ventanas tipos de ventanas tipos de ventanas: ventanas de texto, de grficos y de tablas. Readiris separa en cada pgina bloques de texto, zonas de tablas y zonas de grficos (fotografas, ilustraciones, etc.). (La manera de reconocer tablas y guardar grficos se tratar ampliamente ms adelante.) chapter2.pmd 3/04/2006, 15:39 14 2 - 15 MANUAL DEL USUARIO Hay dos otros tipos ms de zona que siempre deben definirse manualmente: las zonas de cdigos de barras y las zonas de texto manuscrito. (La lectura de cdigos de barras y el reconocimiento de letras de palo seco escritas a mano se explican detalladamente en otra seccin de este manual.) Un cdigo de color cdigo de color cdigo de color cdigo de color cdigo de color indica el tipo de ventana de que se trata: las zonas de texto tienen un borde amarillo, las ventanas grficas tienen un borde azul y las de tablas, un borde morado. Las zonas de cdigo de barras son verdes, mientras que las manuscritas son azules. El nmero de ventanas se indica en todo momento en las etiquetas emergentes de las herramientas de ventanas.
El anlisis de pgina es rpido, sumamente preciso y tolera distorsiones: traza formas complejas e irregulares. El anlisis de pgina detectar incluso aquellas zonas en que hay texto blanco texto blanco texto blanco texto blanco texto blanco sobre fondo negro. sobre fondo negro. sobre fondo negro. sobre fondo negro. sobre fondo negro. El reconocimiento de dichos trozos no plantea problema alguno: la vista preliminar muestra el documento escaneado de forma correcta en la pantalla, pero Readiris invierte la imagen cuando es necesario para reconocer dichos bloques de texto. (Gracias al escner, podr generar imgenes totalmente invertidas de pginas que contengan texto blanco sobre fondo negro. Ver ms adelante.) chapter2.pmd 3/04/2006, 15:39 15 2 - 16 U UU UUNA NA NA NA NA Y YY YY MEDIA MEDIA MEDIA MEDIA MEDIA, , , , , CLASIFICACIN CLASIFICACIN CLASIFICACIN CLASIFICACIN CLASIFICACIN DE DE DE DE DE VENT VENT VENT VENT VENTANAS ANAS ANAS ANAS ANAS Readiris no slo detecta los diferentes tipos de bloques, sino que tambin los clasifica: esta clasificacin se realiza por defecto de arriba a abajo y de derecha a izquierda, con objeto de poder trabajar con documentos que contengan columnas. Los nmeros indican la clase de orden. Evidentemente, puede usted modificar el orden de clasificacin orden de clasificacin orden de clasificacin orden de clasificacin orden de clasificacin. Para ello, haga clic en el botn "Ordenar" de la barra de herramientas de imagen. El cursor se convierte en una manecilla en cuanto se activa el modo de clasificacin. Haga clic en las ventanas que desee incluir. Las ventanas en las que no haga clic no sern clasificadas, quedando excluidas del reconocimiento. Es muy fcil saber qu zonas han sido seleccionadas y cules no: las ventanas seleccionadas se visualizan con todo su color, mientras que las no lo han sido presentan unos tonos ms claros y no tienen ningn nmero. chapter2.pmd 3/04/2006, 15:39 16 2 - 17 MANUAL DEL USUARIO Por defecto, el anlisis de pgina est activado. Para obligar a Readiris a descomponer la pgina actual - debido a que desactiv el anlisis de pgina accidentalmente o borr algunas ventanas por error y desea volver a efectuar el anlisis de pgina - simplemente haga clic en el botn "Analizar Pgina" de la barra de herramientas de imagen. chapter2.pmd 3/04/2006, 15:39 17 2 - 18 Seleccione el idioma del documento antes de ejecutar el anlisis de pgina siempre que vaya a reconocer documentos escritos en un idioma asitico. Para estos idiomas se utilizan rutinas especficas, dado que, por una parte, el espacio entre lneas de los documentos escritos en lenguas asiticas es, por regla general, mayor que el de los documentos escritos en lenguas occidentales. Adems, el texto est formado por pequeos iconos denominados ideogramas que podran ser fcilmente confundidos con zonas grficas en los documentos occidentales. Y, por ltimo, es posible que el texto vaya de arriba a abajo y de derecha a izquierda. Si ha olvidado seleccionar el idioma adecuado, seleccionel despus: Readiris volver a ejecutar el anlisis de pgina automticamente. Algunos documentos presentan pequeas manchas sobre la pgina, pueden generar un borde negro alrededor de la imagen real, etc. Para eliminar todas las pequeas ventanas - suponiendo que no contienen texto - haga clic en el mando "Suprimir Pequeas Ventanas" bajo el men "Edicin".
Otra rutina parecida es automtica: la deteccin de zonas en los mrgenes de las pginas. Cuando se desactiva esta rutina en el men "Configuracin", el anlisis de pgina ignora cualquier zona que est muy cerca de los mrgenes. Si el escner genera mrgenes negros alrededor de la imagen, el anlisis de pgina tiende a encontrar zonas en lugares en los que en realidad slo hay ruido Las zonas de grficos que pueda haber en los mrgenes no se tocan: las fotos a menudo se chapter2.pmd 3/04/2006, 15:40 18 2 - 19 MANUAL DEL USUARIO tocan con los mrgenes, los grficos de fondo en muchos casos ocupan toda la pgina, etc.
D DD DDOS OS OS OS OS, , , , , TRAZAR TRAZAR TRAZAR TRAZAR TRAZAR VENT VENT VENT VENT VENTANAS ANAS ANAS ANAS ANAS MANUALMENTE MANUALMENTE MANUALMENTE MANUALMENTE MANUALMENTE El anlisis de pgina es la forma automtica de trazar ventanas en una pgina escaneada. Tambin puede dividir manualmente una imagen con las herramientas herramientas herramientas herramientas herramientas de trazado de ventanas de trazado de ventanas de trazado de ventanas de trazado de ventanas de trazado de ventanas de Readiris. chapter2.pmd 3/04/2006, 15:40 19 2 - 20 (Tal como se comenta en un apartado anterior, el usuario siempre debe trazar manualmente las ventanas de cdigo de barras y de texto manuscrito, ya que el anlisis de pgina no las detecta automticamente!) Para trazar trazar trazar trazar trazar un rectngulo alrededor de una zona concreta, seleccione la herramienta correspondiente en la barra de herramientas de imagen y arrastre el cursor desde el extremo superior izquierdo hasta el extremo inferior derecho de la ventana. (No se permiten lados inferiores a 1 mm., pues no podran contener ni un solo carcter...) En caso de haber seleccionado el tipo de zona errneo, no se preocupe: podr cambiarlo rpidamente haciendo clic con el botn derecho del ratn sobre una ventana y seleccionando el mando "Ventana - Tipo" desde el men contextual. Las ventanas se clasifican automticamente siguiendo el orden de su creacin: el orden de clasificacin se indica mediante nmeros. Tambin puede enmarcar bloques irregulares de texto trazando ventanas ventanas ventanas ventanas ventanas poligonales poligonales poligonales poligonales poligonales alrededor de ellos. Las ventanas no rectangulares se crean fusionando zonas rectangulares: tan pronto como dos rectngulos (del mismo chapter2.pmd 3/04/2006, 15:40 20 2 - 21 MANUAL DEL USUARIO tipo) se intersectan, se convierten automticamente en una sola ventana. De cierta forma, es como construir una casa aadiendo una habitacin tras otra... (Crear ventanas de tablas poligonales y de cdigos de barras carece de sentido.) Adems, puede combinarse el trazado manual de ventanas con la clasificacin de stas: puede trazar nuevas ventanas incluso cuando est activado el modo de clasificacin. As, puede realizar una clasificacin automtica para incluir las ventanas detectadas y despus crear otras ventanas manualmente all donde el anlisis de pgina no ha ofrecido los resultados esperados. En cuanto comience el trazado manual de ventanas, con el modo de clasificacin activado, se borrarn todas las ventanas que no haya seleccionado! Para modificar, mover y eliminar ventanas, primero debe seleccionarlas. seleccionarlas. seleccionarlas. seleccionarlas. seleccionarlas. Para ello, seleccione la herramienta "Seleccin de Ventana" (la flecha) en la barra de herramientas de imagen y haga clic en el interior de la ventana. Aparecern unas marcas rectangulares en cada esquina y en el centro de los lados de la ventana.
chapter2.pmd 3/04/2006, 15:40 21 2 - 22 Para deseleccionar deseleccionar deseleccionar deseleccionar deseleccionar ventanas, pulse el botn del ratn en cualquier otro lugar. Para seleccionar ventanas adicionales ventanas adicionales ventanas adicionales ventanas adicionales ventanas adicionales, mantenga pulsada la tecla Mays mientras hace clic en dichas ventanas. Para seleccionar una ventana y las ventanas ventanas ventanas ventanas ventanas incluidas incluidas incluidas incluidas incluidas (de otro tipo), mantenga pulsada la tecla Ctrl y haga clic en la ventana principal. Hasta aqu la seleccin de ventanas. Para modificar modificar modificar modificar modificar una ventana de texto, seleccinela, coloque el cursor del ratn sobre una marca y arrastre el lado para cambiar el tamao de la ventana. Para mover mover mover mover mover una ventana, simplemente seleccinela y arrstrela al lugar deseado. Para eliminar eliminar eliminar eliminar eliminar ventanas, seleccione la(s) ventana(s) y elija el mando "Suprimir" del men contextual. Dicha funcin borra la(s) ventana(s) seleccionada(s) y la que se encuentre bajo el cursor del ratn. Al pegar ventanas, stas se insertan en su posicin original y debe arrastrarlas al lugar deseado. De igual modo, puede seleccionar zonas y optar los mandos "Cortar" o "Borrar" del men "Edicin". El mando "Cortar" corta la(s) ventana(s) y la(s) enva a una memoria temporal interna; la funcin "Borrar" borra irreversiblemente la(s) ventana(s). Al pegar ventanas, stas se insertan en su posicin original y debe arrastrarlas al lugar deseado. chapter2.pmd 3/04/2006, 15:40 22 2 - 23 MANUAL DEL USUARIO De hecho, todos los mandos del men "Edicin" se aplican a las ventanas: puede eliminarlas, cortarlas, copiarlas y pegarlas. Tambin puede utilizar la opcin "Deshacer": si por error ha eliminado, movido, cambiado de tamao, etc. algunas ventanas, "Deshacer" anular la ltima operacin. Existen macros para todas las opciones. He aqu un ejemplo: para borrar todas las ventanas presentes, puede elegir la opcin "Seleccionar Todo" del men "Edicin" o la macro equivalente Ctrl+A y hacer clic en el mando "Borrar" del men "Edicin" o su macro Supr. Ahora ya est listo para reproducir el diseo necesario. Para restaurar el diseo anterior, elija "Deshacer" o su macro Ctrl+Z. T TT TTRES RES RES RES RES, , , , , GUARDAR GUARDAR GUARDAR GUARDAR GUARDAR MODELOS MODELOS MODELOS MODELOS MODELOS DE DE DE DE DE VENT VENT VENT VENT VENTANAS ANAS ANAS ANAS ANAS Los diseos de ventanas resultantes pueden guardarse en forma de modelos modelos modelos modelos modelos de zonas de zonas de zonas de zonas de zonas para futuro uso, con la opcin "Guardar el Formato" del men "Archivo" y cargarlos en memoria con la opcin "Cargar el Formato". Si desea reconocer documentos con un diseo similar, por ejemplo, un informe de 50 pginas en la que el encabezado y el pie de pgina deben excluirse por razones obvias, se puede aplicar un modelo nico para dividir en zonas las 50 pginas. chapter2.pmd 3/04/2006, 15:40 23 2 - 24 Al cargar una plantilla en la memoria se desactiva automticamente el anlisis de pgina. La divisin en zonas del modelo se mantiene activa hasta que vuelva a activar el anlisis de pgina en la barra principal de herramientas. Cuando cargue un formato en la memoria, puede activar la opcin "Aplicar Formato a Todas las Pginas" para aplicarlo inmediatamente a todas las pginas del documento. De hecho, existe una eficaz alternativa para establecer las plantillas de determinacin de zona. La herramienta de vista preliminar "Ignorar la Zona Ex- terior" limita la descomposicin de la pgina a la seccin cortada de la imagen. Seleccione esta herramienta y encuadre la seccin de la imagen que quiere procesar. Cuando est trabajando con un documento de mltiples pginas, puede eliminar la misma zona exterior mediante un anlisis de pgina de cada pgina. (Vuelva a realizar el anlisis de pgina para cancelar el corte de la imagen o cambie las zonas manualmente.) chapter2.pmd 3/04/2006, 15:40 24 2 - 25 MANUAL DEL USUARIO R RR RREADIRIS EADIRIS EADIRIS EADIRIS EADIRIS LO LO LO LO LO LLEV LLEV LLEV LLEV LLEVA AA AA POR POR POR POR POR T TT TTODO ODO ODO ODO ODO EL EL EL EL EL MUNDO MUNDO MUNDO MUNDO MUNDO Suponiendo que las ventanas estn correctamente definidas, ahora ya casi est listo para ejecutar el reconocimiento de caracteres. Decimos casi porque an no hemos verificado el idioma y las propiedades del documento. chapter2.pmd 3/04/2006, 15:40 25 2 - 26 Las propiedades de idioma se encuentran en la barra principal de herramientas. Haga clic en el botn "Idioma" para modificar el idioma del documento. chapter2.pmd 3/04/2006, 15:40 26 2 - 27 MANUAL DEL USUARIO (Esta opcin tambin permite acceder a los modos de reconocimiento - rpido y preciso. Hablaremos ms de ellos ms adelante...) Para pasar directamente a un idioma pulse la letra inicial de ste: si est seleccionado el espaol y desea localizar el dans, pulse la letra "D" para ir directamente hasta l. Si varios idiomas tienen la misma inicial, pulse la letra varias veces para recorrer las opciones. Por ejemplo, Readiris lee waray y wolof. Si pulsa "W" una vez, seleccionar el waray, si vuelve a pulsar "W" seleccionar el wolof, y pulsando "W" una tercera vez volver al waray. (Para ir a otra letra, por ejemplo la "T", pulse primero la tecla Retroceso.) Readiris no se limita ni con mucho al espaol: se pueden utilizar hasta 126 idiomas idiomas idiomas idiomas idiomas! Se pueden utilizar todos los idiomas americanos y europeos, incluyendo los idiomas centroeuropeos, cirlicos (rusos), blticos, el griego y el turco. Opcionalmente, puede reconocer documentos escritos en lenguas asiticas lenguas asiticas lenguas asiticas lenguas asiticas lenguas asiticas. El software opcional Mdulo de OCR asitico permite el reconocimiento del japons, el chino simplificado, el chino tradicional y el coreano. (El chino simplificado se habla en la Repblica Popular de la China y en Singapur, mientras que el chino tradicional se utiliza en Hong Kong, Taiwan, Macao y entre las comunidades chinas de ultramar.) Cabe sealar que tambin se distingue entre las variedades britnica y norteamericana - o deberamos decir internacional? - de la lengua inglesa, as como entre el espaol de Espaa y el de Mjico, entre otros. Se requiere la configuracin adecuada de Windows para mostrar en pantalla caracteres de idiomas exticos, como los basados en el alfabeto cirlico, los idiomas asiticos, el griego, el turco, etc. Quiz deba instalar el componente de soporte multilenguaje de soporte multilenguaje de soporte multilenguaje de soporte multilenguaje de soporte multilenguaje de W WW WWindows indows indows indows indows para que su sistema operativo pueda procesar dichos idiomas. En un sistema operativo Windows XP, 2000 y Windows NT 4.0, seleccione el icono "Opciones Regionales (y Idiomas)" en el men "Panel de Control". chapter2.pmd 3/04/2006, 15:40 27 2 - 28 En un sistema operativo Windows ME y 98, seleccione el icono "Agregar o Quitar Programas" de "Panel de Control" para ver si el mdulo "Compatibilidad Multilinge" est instalado. chapter2.pmd 3/04/2006, 15:40 28 2 - 29 MANUAL DEL USUARIO Para visualizar y editar documentos en lenguas asiticas, deber instalar una versin asitica del sistema operativo Windows o utilizar Word 2003, Word 2002 o Word 2000 para visualizar y editar este tipo de documentos, dado que los paquetes Office 2003, Office XP y Office 2000 fueron especficamente diseados para trabajar con documentos en muy diversos idiomas. Nada de esto es necesario para ver documentos en formato PDF documentos en formato PDF documentos en formato PDF documentos en formato PDF documentos en formato PDF: Adobe Acrobat y Adobe Reader se actualizan automticamente cuando deben leerse documentos escritos en idiomas exticos - ruso, japons, etc. chapter2.pmd 3/04/2006, 15:40 29 2 - 30 Consulte el archivo Lame archivo Lame archivo Lame archivo Lame archivo Lame de Readiris para obtener ms informacin sobre este tema. La seleccin del idioma adecuado para el documento es imperativa. En funcin de la seleccin del idioma, el programa sabe qu juegos de smbolos juegos de smbolos juegos de smbolos juegos de smbolos juegos de smbolos debe reconocer. El soporte multilinge garantiza un reconocimiento correcto de caracteres exticos como , , y . Asimismo, el programa hace un extenso uso de bases de datos lingsticas bases de datos lingsticas bases de datos lingsticas bases de datos lingsticas bases de datos lingsticas para convalidar sus resultados. Supongamos que se debe leer la palabra "presi- dente" y una mancha de tinta hace que la "r" parezca una "f". Al buscar en el lxico espaol, Readiris detectar de forma autnoma que est leyendo la palabra "presidente" y que no tiene sentido reconocer el smbolo "f". Por supuesto, esta tcnica de tcnica de tcnica de tcnica de tcnica de autoaprendizaje autoaprendizaje autoaprendizaje autoaprendizaje autoaprendizaje depende en gran medida del contexto lingstico. A menudo, la lingstica resulta muy til para resolver casos ambiguos casos ambiguos casos ambiguos casos ambiguos casos ambiguos, como una "O" que puede confundirse errneamente por un '0'. Otro ejemplo es la letra "l" y el nmero '1' que tienen una forma idntica en muchas fuentes; piense por ejemplo en los textos escritos con antiguas mquinas de escribir. El contexto lingstico ayuda a determinar si se trata de una "l" o de un '1'. La ilustracin a continuacin muestra varias formas de '1' y "l". Las formas de la primera lnea carecen de ambigedad, las formas de la segunda son ambiguas, pero la lingstica permite resolverlas. Si no basta con el contexto, el usuario debe intervenir. R RR RREADIRIS EADIRIS EADIRIS EADIRIS EADIRIS CAMBIA CAMBIA CAMBIA CAMBIA CAMBIA DE DE DE DE DE IDIOMA IDIOMA IDIOMA IDIOMA IDIOMA CUANDO CUANDO CUANDO CUANDO CUANDO ES ES ES ES ES NECESARIO NECESARIO NECESARIO NECESARIO NECESARIO Pero eso no es todo: Readiris puede cambiar de idioma a media frase sin intervencin del usuario. Cuando aparecen palabras occidentales en documentos escritos utilizando caracteres griegos, cirlicos o asiticos - muchos nombres propios chapter2.pmd 3/04/2006, 15:40 30 2 - 31 MANUAL DEL USUARIO no modificables, nombres de marcas, etc. se escriben respetando su grafa latina -, Readiris puede adaptarse automticamente al alfabeto apropiado. O sea, es posible activar simultneamente un alfabeto mixto alfabeto mixto alfabeto mixto alfabeto mixto alfabeto mixto de caracteres griegos, cirlicos o asiticos y latinos. Asegrese de seleccionar "Griego-Ingls" o la propiedad adecuada de cirlico - por ejemplo "Bielorruso-Ingls". En otras palabras, si selecciona nicamente "Griego" o "Bielorruso" como idioma del documento, no espere que salgan bien los caracteres latinos!
He aqu un ejemplo en el que un texto en ruso contiene algunas palabras inglesas: abra el archivo de imagen ALPHABETS.TIF y reconozca la pgina correspondiente si desea verlo usted mismo. chapter2.pmd 3/04/2006, 15:40 31 2 - 32 El resultado final es parecido a ste cuando se abre con el tratamiento de textos - quiz debe seleccionar una fuente fuente fuente fuente fuente cirlica para mostrar correctamente el texto ruso en pantalla. chapter2.pmd 3/04/2006, 15:40 32 2 - 33 MANUAL DEL USUARIO Para mezclar otros idiomas mezclar otros idiomas mezclar otros idiomas mezclar otros idiomas mezclar otros idiomas, simplemente seleccione el idioma con el mayor nmero de caracteres. Si tiene un documento en el que, digamos, una traduccin ingles est junto al texto francs, debe seleccionar el idioma francs para garantizar que se reconozcan los caracteres acentuados como , y . D DD DDEFINIR EFINIR EFINIR EFINIR EFINIR LAS LAS LAS LAS LAS CARACTERSTICAS CARACTERSTICAS CARACTERSTICAS CARACTERSTICAS CARACTERSTICAS DEL DEL DEL DEL DEL DOCUMENTO DOCUMENTO DOCUMENTO DOCUMENTO DOCUMENTO Una vez seleccionado el idioma, pasaremos a las otras caractersticas del documento. Puede afinar el reconocimiento especificando algunas de las caractersticas del documento - el tipo de fuente y el espacio entre caracteres. (Estas opciones no se aplican a los documentos asiticos.) Expliquemos lo que esto significa. chapter2.pmd 3/04/2006, 15:41 33 2 - 34 Empecemos con el mando "Tipo de Fuente" en el men "Configuracin". El tipo de fuente distingue los documentos normales de los documentos documentos documentos documentos documentos matriciales matriciales matriciales matriciales matriciales. Los smbolos matriciales de calidad borrador, tambin denominados 9 agujas, estn formados por puntos aislados y separados y su reconocimiento requiere rutinas altamente especializadas. La impresin con matriz de agujas calidad de carta, tambin denominado 25 agujas, requiere la configuracin normal al igual que las calidades de calidades de calidades de calidades de calidades de impresin impresin impresin impresin impresin imprenta, mecanografiado, impresin lser e impresin con chorro de tinta. La opcin "Automtico" significa que Readiris detectarar por s mismo el tipo de fuente. Deje Readiris detectar automaticamente el tipo de los caracteres en todos los casos - a no ser que este seguro que va a leer documentos matriciales! (Obviamente, "Automtico" es el valor por defecto.) La etiqueta emergente del botn "Reconocer-Guardar" indica cul es el el tipo de letra activo. Cuando no se muestra ningn mensaje, se usar la calidad de impresin normal; cuando aparece el mensaje "Matricial", significa que est activado el modo de lectura para textos impresos con impresora matricial. El ancho de fuente ancho de fuente ancho de fuente ancho de fuente ancho de fuente puede establecerse con la opcin "Espacio entre Caracteres" en el men "Configuracin". chapter2.pmd 3/04/2006, 15:41 34 2 - 35 MANUAL DEL USUARIO Con fuentes fijas (o fuentes monoespacios), todos los smbolos de la fuente tienen el mismo ancho. Una "i" ocupa el mismo espacio hori- zontal que una "w", como sucede en esta frase. Piense en los documentos escritos con una mquina de escribir, en la que el carro se mueve una distancia fija para cada smbolo escrito. Un ancho proporcional significa que un carcter depende de su forma. Los smbolos como m y w son ms anchos y ocupan ms espacio horizontal en una lnea que caracteres delgados como l j. Virtualmente todos los libros, revistas y peridicos estn impresos en ancho proporcional. La solucin ms sencilla es dejar esta opcin siempre en el valor por defecto "Automtico", que significa que Readiris detectar automticamente el ancho de los caracteres. V VV VVELOCIDAD ELOCIDAD ELOCIDAD ELOCIDAD ELOCIDAD CONTRA CONTRA CONTRA CONTRA CONTRA PRECISIN PRECISIN PRECISIN PRECISIN PRECISIN Ha una opcin final que podemos configurar antes de empezar con el reconocimiento - el modo de reconocimiento modo de reconocimiento modo de reconocimiento modo de reconocimiento modo de reconocimiento. De hecho, ya hemos tenido la posibilidad de hacerlo cuando indicamos el idioma del documento con el botn "Idioma". Este botn tambin permite seleccionar el equilibrio deseado entre velocidad y precisin. (Estos modos de reconocimiento especializado no son com- patibles con documentos realizados mediante impresin matricial o en algn idioma asitico.) chapter2.pmd 3/04/2006, 15:41 35 2 - 36
El modo de reconocimiento rpido es el ms apropiado para documentos con una buena calidad de impresin (y de escaneado). Por ejemplo, hablamos de ntidos documentos impresos con impresora lser y escaneados con la resolucin y el brillo adecuados... El modo de reconocimiento preciso debera seleccionarse cuando la calidad de imagen es inferior; hablamos ahora de faxes, instantneas tomadas con una cmara digital u otras imgenes de baja resolucin, etc. El modo de reconocimiento preciso garantiza unos resultados de OCR ptimos para todo tipo de documentos, pero tarda ms en procesar los documentos. El modo de reconocimiento preciso est activado por defecto. El mensaje emergente del botn "Reconocer-Guardar" indica cul es el modo de reconocimiento activo. chapter2.pmd 3/04/2006, 15:41 36 2 - 37 MANUAL DEL USUARIO R R R R READIRIS EADIRIS EADIRIS EADIRIS EADIRIS SE SE SE SE SE HACE HACE HACE HACE HACE CADA CADA CADA CADA CADA VEZ VEZ VEZ VEZ VEZ MS MS MS MS MS INTELIGENTE INTELIGENTE INTELIGENTE INTELIGENTE INTELIGENTE! !! !! Una vez seleccionado el idioma del documento y establecidas las caractersticas del documento, active el aprendizaje interactivo y pulse el botn "Reconocer- Guardar".
El progreso del OCR se indica en la pantalla. Puede pulsar el botn de parada o pulsar la tecla Escape para interrumpir el reconocimiento de texto. Al trmino del reconocimiento, Readiris entra en la fase interactiva de aprendizaje en la cual se activa el aprendizaje pulsando el botn "Aprendizaje" de la barra principal de herramientas. El aprendizaje interactivo est desactivado por defecto. (El aprendizaje interactivo no est disponible para los documentos de lenguas asiticas, pues carece de sentido en estos idiomas, que se componen de miles de smbolos diferentes - adems habran de poder introducirse los ideogramas mediante un teclado occidental, cosa nada fcil!) chapter2.pmd 3/04/2006, 15:41 37 2 - 38 El aprendizaje de fuentes aprendizaje de fuentes aprendizaje de fuentes aprendizaje de fuentes aprendizaje de fuentes puede mejorar considerablemente la precisin del sistema de reconocimiento. Si el usuario intenta reconocer formularios distorsionados o desfigurados como los que se encuentran en documentos reales o bien formas estilizadas de fuentes que Readiris no reconoce de forma ptima, este aprendizaje puede resolver este fallo temporal. El aprendizaje del usuario tambin se utiliza para que el sistema aprenda smbolos especiales smbolos especiales smbolos especiales smbolos especiales smbolos especiales que Readiris no es capaz de reconocer, como smbolos matemticos y cientficos y dingbats. Algunos ejemplos: Readiris puede aprender a reconocer el smbolo "" como "pi" o el dingbat "" como "Tel". (Sin embargo, la lista de smbolos reconocidos no puede extenderse a los smbolos "" y "".) El texto reconocido aparece progresivamente en pantalla y el sistema se detiene en los caracteres dudosos, o - si se trata de caracteres unidos (ligaduras) - en cadenas de caracteres dudosas. Los caracteres dudosos siempre se presentan en su contexto y se destacan. Los caracteres no reconocidos se representan con una tilde. chapter2.pmd 3/04/2006, 15:41 38 2 - 39 MANUAL DEL USUARIO Lo primero que debe hacer es comprobar si ha activado el diccionario de fuentes y el modo de diccionario adecuados - stos se indican siempre en el ttulo de la ventana de aprendizaje. Si no es as, haga clic en el botn "Cancelar" - el documento vuelve a aparecer con la divisin por zonas con la que se fue creado - active el diccionario de fuentes o el modo de diccionario adecuados y vuelva a ejecutar el reconocimiento. (Pronto se explicar el funcionamiento de los diccionarios de fuentes.) De ser necesario, introduzca un carcter (o cadena de caracteres) en lugar de la forma incorrecta o desconocida y pulse uno de los siguientes botones. Aprender Aprender Aprender Aprender Aprender Est de acuerdo con la solucin propuesta o la corrige. El programa guarda este carcter dudoso en el diccionario de fuentes como carcter seguro, definitivo. chapter2.pmd 3/04/2006, 15:41 39 2 - 40 Los reconocimientos posteriores no requerirn su intervencin, la forma se considerar aprendida de una vez por todas. En el ejemplo anterior, el sistema se detiene en un carcter sucio y pulsamos "Aprender" para aceptar una forma que no puede confundirse con otros caracteres. Descartar Descartar Descartar Descartar Descartar Aprendizaje Aprendizaje Aprendizaje Aprendizaje Aprendizaje Est de acuerdo con la solucin propuesta o la corrige. La diferencia respecto al botn "Aprender" consiste en que el smbolo aprendido obtiene el calificativo de inseguro en el diccionario. Para su reconocimiento futuro, el sistema propondr la solucin apprendida, pero an requerir una confirmacin. Este botn se utiliza para aquellos smbolos que pueden confundirse con otros: una "e" desfigurada que puede confundirse con una "c", una "t" daada que puede parecerse a una "r", etc. chapter2.pmd 3/04/2006, 15:41 40 2 - 41 MANUAL DEL USUARIO La "e" que se muestra anteriormente est muy daada - de hecho es muy parecida al smbolo "c", por lo que debe pulsar el botn "Descartar Aprendizaje" a fin de no confundirlo con el smbolo "c". Borrar Borrar Borrar Borrar Borrar La forma que aparece en pantalla se elimina del resultado. Este botn se utiliza para ignorar el ruido presente en los documentos - puntos, manchas de caf, etc. - que pueden reconocerse como puntos, comas y otras cosas, as como para borrar los smbolos no deseados. Deshacer Deshacer Deshacer Deshacer Deshacer Para volver y corregir errores. Puede deshacer las ltimas 32 decisiones. T TT TTerminar erminar erminar erminar erminar El proceso de aprendizaje concluye, pero el reconocimiento de caracteres continua en modo automtico. En lo sucesivo, todas las decisiones adoptadas por el usuario son aceptadas sin confirmacin por parte del usuario. Pulse este botn cuando vea que el reconocimiento es sumamente preciso y no requiere una correccin detallada. Cancelar Cancelar Cancelar Cancelar Cancelar No confunda el botn "Terminar" con el botn "Cancelar". Con "Cancelar" no se genera un resultado y vuelve a comenzar desde el principio, con "Terminar" se crea el texto, slo que no ha sido corregido en sus detalles. P PP PPAPEL APEL APEL APEL APEL DE DE DE DE DE LOS LOS LOS LOS LOS DICCIONARIOS DICCIONARIOS DICCIONARIOS DICCIONARIOS DICCIONARIOS DE DE DE DE DE FUENTES FUENTES FUENTES FUENTES FUENTES Los resultados de cada sesin de aprendizaje se conservan temporalmente en la memoria del ordenador, pero pueden y deben guardarse en archivos denominados diccionarios para su uso ulterior. chapter2.pmd 3/04/2006, 15:41 41 2 - 42 (No confunda los diccionarios de fuentes con los lxicos! Los diccionarios de fuentes contienen formas de caracteres adquiridas durante la fase interactiva de OCR, mientras que los lxicos son bases de datos lingsticas que ayudan al reconocimiento.) Debe cargar en memoria estos diccionarios de fuentes si desea reconocer documentos similares para aprovechar la informacin adicional que contienen; de esta forma, Readiris toma en consideracin la informacin almacenada en estas bibliotecas de fuentes. Podra decirse que Readiris se vuelve ms inteligente cada vez que la usa! Cmo funciona esto? El funcionamiento de los diccionarios de fuentes est controlado por el men "Aprendizaje": tiene que seleccionar un diccionario con el mando "Diccionario" y determinar su modo de funcionamiento. Los diccionarios diccionarios diccionarios diccionarios diccionarios de fuentes estn limitados a 500 formas y le recomendamos que elabore distintos diccionarios para cada aplicacin, por ejemplo, por tipo de chapter2.pmd 3/04/2006, 15:41 42 2 - 43 MANUAL DEL USUARIO documento. Por defecto, los diccionarios tienen la extensin *.dus. El aprendizaje carece de efectos si el diccionario est lleno: los resultados no se conservan en la memoria ni se transcriben en el diccionario. Dentro de la opcin "Diccionario" o directamente en el men "Aprendizaje" puede seleccionar un modo de diccionario. Existen tres modos de diccionario: nuevo, aadir y de lectura. Si selecciona "Nuevo Diccionario", indicar que los resultados del aprendizaje deben guardarse en un nuevo diccionario. (Si selecciona un diccionario existente, su contenido se borrar.) El modo aadir indica que los resultados del aprendizaje se guardarn en diccionario existente: el reconocimiento utiliza la informacin que ya contiene el diccionario y se le aaden nuevas formas de fuentes. En otras palabras, esta opcin le permite elaborar un diccionario de fuentes en varios pasos. (Si introduce un nombre de archivo para un nuevo diccionario y activa el modo aadir, se crear un diccionario de fuentes vaco y deber completarlo.) Con la ltima opcin "Consultar Diccionario", el diccionario funciona en modo de slo lectura y se aprovecha el diccionario sin aadirle nuevas formas. Seleccione el modo nuevo si desea reconocer una sola pgina. Para reconocer muchas pginas del mismo tipo - con las mismas fuentes y la misma calidad de impresin - seleccione el modo nuevo para la primera pgina, el modo aadir para unas cuantas pginas ms y el modo de lectura para el resto del documento o documentos. La etiqueta emergente del botn "Aprendizaje" siempre indica el diccionario de fuentes que est activado y el modo en que opera ste. chapter2.pmd 3/04/2006, 15:41 43 2 - 44 Al entrar en aprendizaje interactivo, el diccionario y su modo de funcionamiento se indican en el ttulo de la ventana; pulse el botn "Cancelar" y vuelva a comenzar si stos son incorrectos. E EE EENVO NVO NVO NVO NVO DE DE DE DE DE RESUL RESUL RESUL RESUL RESULT TT TTADOS ADOS ADOS ADOS ADOS A AA AA LA LA LA LA LA APLICACIN APLICACIN APLICACIN APLICACIN APLICACIN DE DE DE DE DE TRABAJO TRABAJO TRABAJO TRABAJO TRABAJO Con el aprendizaje interactivo concluye el reconocimiento de caracteres. Si Microsoft Word es el programa receptor de datos por defecto, el procesador de chapter2.pmd 3/04/2006, 15:41 44 2 - 45 MANUAL DEL USUARIO textos se ejecuta automticamente (si fuese necesario) una vez concluido el reconocimiento, y se inserta el texto reconocido. Puede que en pantalla se muestre una barra de progresin del reconocimiento. (Esto depender de del tamao del documento y de la complejidad del formato que haya de realizarse.) La imagen escaneada se visualiza de nuevo una vez efectuada la divisin en zonas para su posterior procesamiento y permanece en su sitio hasta que se escanee una nueva imagen. De hecho, ha convertido un documento en papel en un archivo digital modificable, y en un tiempo 40 veces inferior al que habra empleado si hubiera tenido que volver a mecanografiarlo! Ahora comprelo con la imagen que tiene en la ventana de Readiris. En realidad, Readiris le ofrece tres mtodos diferentes a la hora de guardar el resultado del reconocimiento: por un lado, enviar directamente el documento reconocido a una aplicacin. Por otro, guardar el resultado en un archivo externo y, por ltimo, copiar el resultado en el portapapeles de Windows. El destino de salida destino de salida destino de salida destino de salida destino de salida se selecciona con el botn "Formato" de la barra de herrramientas principal (o con la opcin "Formato Texto" del men "Configuracin"). chapter2.pmd 3/04/2006, 15:41 45 2 - 46 La funcin "Enviar a" permite un vnculo directo de OCR entre el escner y las aplicaciones para Windows. Con ella podr enviar enviar enviar enviar enviar directamente el documento que acaba de escanear a un procesador de textos, hoja de clculo o programa de navegacin, a Adobe Reader, etc.! chapter2.pmd 3/04/2006, 15:41 46 2 - 47 MANUAL DEL USUARIO Una vez concluido el reconocimiento, se ejecuta la aplicacin de destino y el documento reconocido se visualiza en un nuevo archivo de texto o en un libro de trabajo. chapter2.pmd 3/04/2006, 15:41 47 2 - 48 No olvide que la funcin "Enviar a" tambin permite enviar el texto reconocido al portapapeles portapapeles portapapeles portapapeles portapapeles de Windows, de forma que no es absolutamente imprescindible exportar el resultado de la lectura, ni guardarlo en un archivo externo... G GG GGUARDAR UARDAR UARDAR UARDAR UARDAR LOS LOS LOS LOS LOS RESUL RESUL RESUL RESUL RESULT TT TTADOS ADOS ADOS ADOS ADOS EN EN EN EN EN UN UN UN UN UN ARCHIVO ARCHIVO ARCHIVO ARCHIVO ARCHIVO DE DE DE DE DE TEXT TEXT TEXT TEXT TEXTO OO OO Es posible guardar el resultado del OCR en un archivo externo. Readiris reconoce una gran variedad de los formatos de archivo ofrecidos por los procesadores de texto, hojas de clculo y aplicaciones web ms conocidos. (En- tre otros, Readiris es compatible con WordML y SpreadsheetML, los nuevos formatos de texto de Microsoft Office 2003.) La opcin "Guardar y Abrir" es muy parecida a la funcin "Enviar a", puesto que le permite abrir el documento reconocido cuando ya se ha guardado. chapter2.pmd 3/04/2006, 15:42 48 2 - 49 MANUAL DEL USUARIO Sin embargo, el mtodo usado para dirigir la aplicacin deseada es distinto. En esta ocasin, los tipos de archivo de tipos de archivo de tipos de archivo de tipos de archivo de tipos de archivo de W WW WWindows indows indows indows indows determinan qu aplicacin se iniciar. Es como si hiciera doble clic sobre el archivo de salida desde el Explorador de Windows... (Con la opcin "Enviar a", Readiris dirige directamente las aplicaciones especficas deseadas.) chapter2.pmd 3/04/2006, 15:42 49 2 - 50 La opcin "Enviar por E-mail" crea un nuevo mensaje de correo electrnico correo electrnico correo electrnico correo electrnico correo electrnico y aade el documento reconocido como archivo adjunto del mensaje. Conoce un mtodo ms rpido para distribuir un documento en papel...? chapter2.pmd 3/04/2006, 15:42 50 2 - 51 MANUAL DEL USUARIO C CC CCREACIN REACIN REACIN REACIN REACIN DE DE DE DE DE DOCUMENT DOCUMENT DOCUMENT DOCUMENT DOCUMENTOS OS OS OS OS POR POR POR POR PORTTILES TTILES TTILES TTILES TTILES Veamos con ms atencin uno de los formatos reconocidos: el formato PDF formato PDF formato PDF formato PDF formato PDF de de de de de Adobe Adobe Adobe Adobe Adobe Acrobat Acrobat Acrobat Acrobat Acrobat. Readiris le permite crear documentos PDF basados en texto y basados en imgenes. chapter2.pmd 3/04/2006, 15:42 51 2 - 52 Cal es la diferencia entre los dos? Cuando selecciona el formato "PDF Texto", Readiris crea un archivo PDF que contiene el resultado del texto. (Es chapter2.pmd 3/04/2006, 15:42 52 2 - 53 MANUAL DEL USUARIO posible que haya grficos, pero slo cuando aparecen zonas grficas en la pgina - fotografas, ilustractiones, etc.) En otras palabras, la imagen de la pgina no forma parte del documento PDF, compuesto de una sola capa. Por contra, el formato "PDF Imagen", que es tambin de una sola capa, slo contiene la imagen escaneada, sin incluir los resultados del OCR! chapter2.pmd 3/04/2006, 15:42 53 2 - 54 Los formatos "PDF Texto-Imagen" y "PDF Imagen-Texto" ofrecen otros resultados: Readiris crea un archivo PDF en el que se pueden hacer bsquedas y chapter2.pmd 3/04/2006, 15:42 54 2 - 55 MANUAL DEL USUARIO que contiene el texto reconocido y la imagen de la pgina. En los archivos PDF texto-imagen, el texto se coloca encima de la imagen de la pgina en el archivo PDF de doble capa; por contra, en los archivos del tipo imagen-texto, el texto se coloca debajo de la imagen de la pgina. Utilice la opcin "Buscar" de Adobe Reader y lo comprobar rpidamente! Los archivos PDF del tipo texo-imagen son de hecho bastante sofisticados: los pxeles del texto reconocido se borran para crear un documento legible. Y es que, por ejemplo, mostrar el texto reconocido en color negro encima de mapas de bits de caracteres negros dara como resultado un texto con una fuerte sombra... chapter2.pmd 3/04/2006, 15:42 55 2 - 56 Si desea comprobarlo usted mismo, le invitamos a reconocer la imagen de muestra BACKGROUND.JPG. Todos los archivos PDF basados en texto codifican las URL de pginas web y las direcciones de correo electrnico como enlaces visibles: haga clic en ellos para visitar la pgina web en cuestin o para enviar un mensaje de correo chapter2.pmd 3/04/2006, 15:42 56 2 - 57 MANUAL DEL USUARIO electrnico al contacto. (De hecho, el resto de formatos de texto enriquecido de Readiris - Word, WordML, HTML, etc. - recrean tambin los hipervnculos.) Haga clic en el botn "Formato" para ver algunas opciones relacionadas con el formato PDF: "Crear Marcadores" e "Incrustar Fuentes". (En cuanto se haya seleccionado el formato PDF, se aplica el formato automtico - y no se puede desactivar.) La opcin "Crear Marcadores" permite crear marcadores marcadores marcadores marcadores marcadores por pgina para cada elemento del documento, tanto los grficos como las zonas de texto y tablas. Para las zonas de texto, Readiris aplica un algoritmo inteligente que crea un ttulo, un externo para cada zona; las tablas y grficos llevan simplemente un nmero. (Otro elemento de navegacin de los documentos PDF, las miniaturas miniaturas miniaturas miniaturas miniaturas de pgina, se pueden crear de manera dinmica con el programa Adobe Reader.) chapter2.pmd 3/04/2006, 15:42 57 2 - 58
La opcin "Incrustar Fuentes" inserta fuentes en los archivos PDF. Al incrustar fuentes, se evita la sustitucin de las mismas cuando el lector examina e imprime el documento reconocido. Asegura que el lector - cualquiera que sea la configuracin de su ordenador - vea el texto con las fuentes originales. Sin em- bargo, al insertar fuentes se aumenta (un poco) el tamao de los documentos reconocidos. Otra funcin de Readiris con un inters especial a la hora de generar documentos PDF es la utilizacin de propiedades del documento propiedades del documento propiedades del documento propiedades del documento propiedades del documento. Las propiedades del documento contienen el ttulo del documento, el nombre y la organizacin de su autor, el asunto, algunas palabras clave y comentarios, etc. Las propiedades del documento se utilizan obviamente para clasificar y buscar archivos. chapter2.pmd 3/04/2006, 15:42 58 2 - 59 MANUAL DEL USUARIO
El mando "Propiedades del Documento" del men "Archivo" permitir editar estas propiedades. Tenga tambin en cuenta que puede definir las propiedades del documento a generar ms tarde, cuando guarde los resultados del reconocimiento... chapter2.pmd 3/04/2006, 15:42 59 2 - 60 Recuerde que las propiedades del documento no slo se pueden definir para documentos PDF: los documentos en los formatos Word (*.doc), RTF (Rich Text Format), WordML (*.xml), SpreadsheetML (*.xml) y HTML tambin disponen de propiedades del documento - aunque menos completas que las de los documentos en formato PDF. (Y, como es de suponer, los formatos de texto pobres como los documentos de texto con codificacin Texto (ANSI) o Texto MS-DOS (ASCII) no permiten definir propiedades.) ... ... ... ... ... O OO OO RECONOCIMIENTO RECONOCIMIENTO RECONOCIMIENTO RECONOCIMIENTO RECONOCIMIENTO DE DE DE DE DE DICHOS DICHOS DICHOS DICHOS DICHOS DOCUMENTOS DOCUMENTOS DOCUMENTOS DOCUMENTOS DOCUMENTOS Vemoslo en el otro sentido. Dado que Readiris ofrece un reconocimiento completo del formato PDF Adobe Acrobat, no slo le permite generar archivos PDF, sino que tambin puede leerlos! Puede que la conversin de los documentos PDF conversin de los documentos PDF conversin de los documentos PDF conversin de los documentos PDF conversin de los documentos PDF sea una de las principales aplicaciones de Readiris. Existen diversas razones que lo justifican. En primer lugar, es una manera de convertir imgenes en texto: ya que los documentos PDF con imgenes abiertos ejecutan el reconocimiento y guardan el resultado del OCR en un documento de texto (en cualquier formato de texto reconocido). Los archivos de texto se pueden editar, mientras que los archivos con imgenes no son editables. En segundo lugar, le permite convertir archivos PDF con imgenes en archivos PDF de texto. Para ello debe ejecutar el reconocimiento de archivos PDF con slo imgenes y guardar los resultados del OCR... como documentos PDF de texto! Los archivos PDF de texto se pueden buscar y editar, mientras que con los archivos PDF con slo imgenes esto no es posible. Finalmente, la conversin de archivos PDF es una manera de desbloquear el contenido del PDF. Piense en los documentos PDF de slo lectura, cuyo texto normalmente es inaccesible. Con los archivos PDF desprotegidos, se puede recuperar el contenido (copiar y guardar en un archivo texto), mientras que el contenido de los archivos slo lectura no se puede extraer. Dichos documentos slo se pueden ver e imprimir. Deben tenerse en cuenta dos detalles importantes: Readiris no abre documentos PDF protegidos con contrasea, ni siquiera en el caso de que Readiris haya roto chapter2.pmd 3/04/2006, 15:42 60 2 - 61 MANUAL DEL USUARIO el resto de barreras de seguridad del documento. (Para ser ms especficos, las contraseas maestras que definen los permisos de los documentos PDF no suponen ningn problema para Readiris, pero las contraseas del usuario necesarias para abrir ciertos documentos PDF s que suponen un problema.) Por otra parte, Readiris no puede convertir documentos PDF que contengan imgenes comprimidas en formato JPEG 2000. Proceda del modo habitual: cargue los archivos PDF en la memoria al tiempo que abre imgenes previamente escaneadas - faxes, instantneas realizadas con su cmara digital, etc. Haga clic en el botn de parada o pulse la tecla Esc para interrumpir el proceso de carga entre dos pginas. (Esto tambin es vlido para imgenes en formato TIFF con mltiples pginas y faxes en formato DCX.) Sin embargo, existe una opcin especfica relacionada con los archivos PDF, que permite abrirlos como documentos en color o en blanco y negro. Se ofrece esta opcin porque explorar documentos en color es mucho ms lento! chapter2.pmd 3/04/2006, 15:42 61 2 - 62 En segundo lugar, es posible que desee indicar qu pginas desea convertir Si su objetivo es, por ejemplo, capturar slo un captulo de una publicacin en formato PDF muy extensa, no tendra demasiado sentido cargar todo el libro en Readiris Indicar el intervalo de pginas intervalo de pginas intervalo de pginas intervalo de pginas intervalo de pginas adecuado puede ahorrarle mucho tiempo. (Esto, una vez ms, tambin es vlido para imgenes en formato TIFF con mltiples pginas y faxes en formato DCX.) Los documentos PDF basados en texto, en general, ofrecen una calidad excelente; el modo de reconocimiento rpido es suficiente para realizar la conversin con xito. Sin embargo, la calidad de los archivos PDF basados en chapter2.pmd 3/04/2006, 15:42 62 2 - 63 MANUAL DEL USUARIO imgenes depende de las caractersticas de los documentos originales en papel, del brillo y la resolucin del escaneado, etc. Si le interesa, puede probar con el archive SAMPLE.PDF, que encontrar en la carpeta de imgenes de Readiris. R RR RRECONOCIMIENT ECONOCIMIENT ECONOCIMIENT ECONOCIMIENT ECONOCIMIENTO OO OO DE DE DE DE DE V VV VVARIAS ARIAS ARIAS ARIAS ARIAS PGINAS PGINAS PGINAS PGINAS PGINAS Despus del OCR, el documento escaneado se visualiza de nuevo con la divisin en zonas para su posterior procesamiento. A partir de este momento, puede abrir el texto reconocido con su procesador o editor de textos, importarlo a un programa de maquetacin (DTP - desktop publishing) o a cualquier otra aplicacin de tratamiento de texto, archivarlo y compartirlo, colocarlo en un servidor de Intranet, etc. Comprelo con la imagen que hay en el interior de la ventana de Readiris. Pero cmo se guarda el texto de las pginas adicionales? En otras palabras, cmo se procesan los documentos compuestos de varias pginas? Es muy sencillo: vaya ejecutando las pginas reconocidas y guarde los resultados en el mismo archivo. (Asegrese de que el documento no est abierto para poder escribir en l.) No olvide tampoco activar el modo aadir en el diccionario de fuentes, de forma que pueda continuar cmodamente con el aprendizaje de fuentes. Conforme vaya escaneando pginas (o abriendo archivos grficos), tendr que decidir si quiere iniciar un nuevo documento o completar el que est abierto en ese momento. chapter2.pmd 3/04/2006, 15:43 63 2 - 64 Si responde "no", seguir aadiendo pginas al documento abierto; si responde "s", crear un nuevo documento. Esta ltima respuesta corresponde a la funcin "Nuevo Documento" del men "Archivo". Pero existe un sistema ms eficaz para reconocer varias pginas sin tener que escanearlas ni realizar su OCR una por una: se trata del procesamiento directo de documentos de mltiples pginas documentos de mltiples pginas documentos de mltiples pginas documentos de mltiples pginas documentos de mltiples pginas! Para escanear de una sola vez un documento de varias pginas, deber activar el alimentador de documentos del escner, mediante la opcin "ADF" (alimentador automtico de documentos) bajo el botn "Escner".
Site todas las pginas en el alimentador automtico de documentos y empiece a escanear: se escanearn de la primera a la ltima pgina. Si su escner plano no dispone de alimentador de documentos, el escaneado escaneado escaneado escaneado escaneado a intervalos a intervalos a intervalos a intervalos a intervalos le permite escanear documentos de mltiples pginas de manera eficiente. El escner digitaliza automticamente otra pgina transcurrida una cantidad de segundos definida por el usuario. El intervalo permite reemplazar la pgina que haba en la pantalla por otra nueva. (El escaneado a intervalos resulta muy til al escanear un libro (de grandes dimensiones): sus manos estarn demasiado ocupadas colocando adecuadamente el libro en la plataforma del escner plano para poder utilizar el ratn...) Indique, en la configuracin del escner, el intervalo de tiempo que necesita para colocar otra pgina en la pantalla del escner. Haga clic en el botn "Escner" chapter2.pmd 3/04/2006, 15:43 64 2 - 65 MANUAL DEL USUARIO y defina un valor adecuado para la opcin "Escanear Otra Pgina a Continuacin x Segundo(s)". Haga clic en el botn "Escanear" parar iniciar la digitalizacin. Haga clic en el botn "Detener" del cuadro de dilogo de escaneado a intervalos para detener el proceso de escaneado automtico.
Readiris le ofrece la mxima flexibilidad: puede omitir el intervalo de escaneado para escanear inmediatamente un documento, o congelar el proceso para hacer o chapter2.pmd 3/04/2006, 15:43 65 2 - 66 atender una llamada telefnica. Haga clic en el botn "Pausa" del cuadro de dilogo de escaneado a intervalos para detener temporalmente el proceso de escaneado a intervalos. Haga clic en "Reanudar" cuando desee seguir con el escaneado automtico, o haga clic en "Escanear Ahora", en el cuadro de dilogo de escaneado a intervalos, para poder escanear inmediatamente: el intervalo de tiempo se reduce! Tambin puede abrir mltiples imgenes previamente escaneadas. Para ello, seleccione primero una de ellas y, mientras mantiene pulsada la tecla Ctrl, vaya escogiendo las restantes. Para seleccionar un rango continuo de imgenes, seleccione la primera de ellas y, mientras mantiene pulsada la tecla Mays, escoja la ltima.
Puede hacer lo mismo desde el Explorador de Windows: seleccione varios archivos de imgenes, haga clic con el botn derecho del ratn y seleccione la opcin "Reconocer" del men contextual. Si repite esta misma operacin, todas las imgenes que enve a Readiris se aadirn al documento en uso hasta que seleccione el mando "Nuevo Documento". chapter2.pmd 3/04/2006, 15:43 66 2 - 67 MANUAL DEL USUARIO Puede, incluso, abrir imgenes previamente escaneadas arrastrndolas desde el Explorador de Windows hasta el rea de trabajo de Readiris. Tambin aqu ocurre como citamos anteriormente: puede repetir esta operacin cuanto quiera, y todas las imgenes que enve a Readiris se aadirn al documento en uso hasta que seleccione el mando "Nuevo Documento". Readiris ordena las imgenes automticamente: la imagen 001.tif precede a la 002.tif que precede a la 003.tif, etc. El panel de documentos panel de documentos panel de documentos panel de documentos panel de documentos muestra estadsticas estadsticas estadsticas estadsticas estadsticas e informacin acerca de todas las pginas escaneadas - la imagen original y su resolucin, el tiempo empleado en los procesos de escaneado y reconocimiento, etc. El panel de documentos se puede ocultar y volver a mostrar utilizando la opcin pertinente del men "Ver". chapter2.pmd 3/04/2006, 15:43 67 2 - 68 Con el panel de documentos tambin podr saber qu imagen se encuetra cargada en la memoria. Si se abri una imagen de mltiples pginas, est claro que habr un slo archivo para todas las imgenes. Si se digitalizan documentos, el panel de documentos simplemente menciona el modelo de escner. Para cambiar el tamao de una columna, arrastre el cursor de redimensionamiento de columnas. (No es posible cambiar el orden de las columnas.) Tambin puede situar el cursor encima de una columna demasiado estrecha para visualizar los datos: un mensaje emergente mostrar toda la informacin!
Puede ver la misma informacin para todas las pginas con el mando "Informacin", situada en el men "Archivo", o de manera independiente para cada pgina situando el cursor encima de la miniatura de la pgina que desee en la barra de herramientas de pgina barra de herramientas de pgina barra de herramientas de pgina barra de herramientas de pgina barra de herramientas de pgina, situdada en la parte izquierda de la pantalla. Esta barra de herramientas aparece en el momento que empiezan a procesarse pginas y da acceso a las diversas opciones de pgina (utilizando el botn derecho del ratn). chapter2.pmd 3/04/2006, 15:43 68 2 - 69 MANUAL DEL USUARIO
La pgina activa en un determinado momento queda resaltada en el panel de documentos y en la barra de herramientas de pgina, y su nombre aparece en la barra de ttulo de Readiris. Para eliminar una pgina, coloque el cursor del ratn encima de la misma en el panel de documentos y pulse la tecla Supr. O coloque el cursor del ratn encima de su miniatura de la barra de herramientas de pgina y pulse la tecla Supr. (O tambin puede seleccionarla en la barra de herramientas de pgina, hacer clic con el botn derecho del ratn y seleccionar la opcin "Eliminar Pgina" del men contextual.) Puede imprimir imprimir imprimir imprimir imprimir rpidamente las imagnes imagnes imagnes imagnes imagnes escaneadas utilizando el mando "Imprimir" de la barra de herramientas de imagen (o con el mando "Imprimir las Imgenes" del men "Archivo") si necesita hacerse una idea general de su documento.
Puede imprimir la pgina actual o todas las pginas. Selecciones el nmero de pginas o miniaturas que quiera imprimir. chapter2.pmd 3/04/2006, 15:43 69 2 - 70 Pero tampoco tiene por qu imprimir todas las pginas: el panel de documentos (y los mandos pertinentes del men "Edicin" (y los mandos contextuales de pgina de la barra de herramientas de pgina) le permite excluir pginas (temporalmente). Haga clic en el nmero de pgina en cuestin en el panel de documentos para excluirla del proceso de impresin (y reconocimiento). Vuelva a hacer clic sobre ella para volverla a incluir. Para conseguir una mayor flexibilidad, el men "Edicin" ofrece opciones equivalentes que se aplican a todas las pginas.
Las miniaturas de las pginas excluidas sern tachadas. Tenga en cuenta que siempre funciona la impresin de la pgina actual, incluso si esta opcin est desactivada en ese momento. chapter2.pmd 3/04/2006, 15:43 70 2 - 71 MANUAL DEL USUARIO (La exclusin de pginas tambin se aplica al reconocimiento: cuando ponga en marcha el proceso de OCR, las pginas excluidas (temporalmente) no se reconocern.) Abra la imagen de prueba MULTIPAGE.TIF e inicie el reconocimiento. Las pginas van apareciendo unas tras otras. En la barra de ttulo de Readiris se indica el nmero de la pgina activa. chapter2.pmd 3/04/2006, 15:43 71 2 - 72 Si el aprendizaje interactivo est en funcionamiento, ste ir reconociendo y aprendiendo pgina por pgina. Para la primera de ellas se iniciar un diccionario "nuevo", y en las sucesivas ir completndose este ltimo. A partir del momento en que pulse el botn "Terminar", el sistema ir tomando decisiones sin que el usuario tenga que validarlas. En otras palabras, se interrumpe el aprendizaje interactivo para todas las pginas y el reconocimiento del documento continuar en modo automtico. El resultado del reconocimiento efectuado en documentos con varias pginas queda guardado en un nico archivo de salida. (Si se enva el resultado del reconocimiento a una aplicacin de salida, se crearn varias pginas dentro de un nico documento.) Al menos, ese es el caso cuando la opcin "Crear Un Archivo por Pgina" est desactivada al guardar el documento reconocido. Esta opcin tratar el documento como si cada pgina estuviera guardada en un archivo diferente. Si el usuario pone el nombre texto.doc al archivo, los archivos se denominarn texto- 1.doc, texto-2.doc, etc. (Esta opcin slo se encuentra disponible cuando se crea un archivo externo, y no cuando se envan los resultados del OCR a una aplicacin destino.) chapter2.pmd 3/04/2006, 15:43 72 2 - 73 MANUAL DEL USUARIO E EE EEDICIN DICIN DICIN DICIN DICIN DE DE DE DE DE DOCUMENT DOCUMENT DOCUMENT DOCUMENT DOCUMENTOS OS OS OS OS DE DE DE DE DE ML ML ML ML MLTIPLES TIPLES TIPLES TIPLES TIPLES PGINAS PGINAS PGINAS PGINAS PGINAS El usuario puede editar documentos de mltiples pginas para corregir, principalmente, errores ocurridos en la fase de escaneado. Podr eliminar pginas del documento o moverlas a otra posicin. En primer lugar, veamos cmo desplazarnos. Para ir a una pgina, haga clic en la misma en el panel de documentos o en la barra de herramientas de pgina. (O bien lleve el cursor a la miniatura, haga clic con el botn derecho del ratn para que aparezca el men contextual y seleccione la opcin "Seleccionar Pgina".) Para ir a la pgina anterior, utilice la tecla RePg; para avanzar hasta la pgina siguiente emplee AvPg. Pulse Inicio para ir a la primera pgina, y Fin para ir a la ltima pgina. O utilice las funciones correspondientes en el men "Ver". Vamos ahora a editar el documento. Para eliminar una pgina, coloque el cursor del ratn encima de la misma en el panel de documentos y pulse la tecla Supr, o coloque el cursor del ratn encima de su miniatura de la barra de herramientas de pgina y pulse la tecla Supr. (O tambin puede seleccionarla en la barra de herramientas de pgina, hacer clic con el botn derecho del ratn y seleccionar la opcin "Eliminar Pgina" del men contextual.) chapter2.pmd 3/04/2006, 15:43 73 2 - 74 Y le recordamos que podr excluir pginas temporalmente, pero no borrarlas, del proceso de reconocimiento (y de impresin de imgenes): el panel de documentos, la barra de herramientas de pgina y el men "Edicin" incluyen los mandos necesarios.
Para subir una pgina dentro de un documento, utilice el mando "Subir la Pgina". Si, por el contrario, desea bajarla, seleccione el mando "Bajar la Pgina". Para mover una pgina a una ubicacin completamente distinta en el documento, arrastre su icono a esa nueva ubicacin. chapter2.pmd 3/04/2006, 15:43 74 2 - 75 MANUAL DEL USUARIO A AA AABRIR BRIR BRIR BRIR BRIR UN UN UN UN UN NUEVO NUEVO NUEVO NUEVO NUEVO DOCUMENTO DOCUMENTO DOCUMENTO DOCUMENTO DOCUMENTO Para cerrar el documento activo, puede utilizar el mando "Nuevo Documento" del men "Archivo". Esta funcin limpia completamente la pizarra. Cualquier documento cargado en memoria - ya tenga una o mltiples pginas - se eliminar completamente. A partir de entonces, podr crear uno nuevo. Sin embargo, tambin puede crear un nuevo documento directamente desde el documento activo. Mientras no haya ejecutado el OCR, el sistema entiende chapter2.pmd 3/04/2006, 15:43 75 2 - 76 que usted desea aadir pginas al documento. Por ejemplo, puede escanear todas las pginas que se encuentren en el alimentador del escner, colocar ms pginas en el alimentador y continuar con el procedimiento. Todas las pginas escaneadas compondrn un nico documento. O bien, podr escanear varias pginas y aadir algunos archivos grficos, como por ejemplo, faxes. Estas pginas siguen formando un solo documento; todo lo que tiene que hacer es cambiar el origen de la imagen segn vaya siendo necesario. Para ello utilice el botn "Fuente". Una vez realizado el OCR, si reinicia el proceso de escaneado (o la carga de imgenes), empezar un nuevo documento o completar el que est en ese momento en uso. R RR RRECONOCIMIENTO ECONOCIMIENTO ECONOCIMIENTO ECONOCIMIENTO ECONOCIMIENTO DE DE DE DE DE ZONAS ZONAS ZONAS ZONAS ZONAS DE DE DE DE DE TEXTO TEXTO TEXTO TEXTO TEXTO Una vez que sabemos cmo reconocer pginas y procesar documentos de mltiples pginas, tenemos que preguntarnos si se puede reconocer menos de una pgina con la misma facilidad. La respuesta es s. Para ello, haga clic con el botn derecho del ratn y elija la opcin "Copiar como Texto" del men contex- tual: la ventana del texto bajo el cursor del ratn ser reconocida y enviada al portapapeles. chapter2.pmd 3/04/2006, 15:43 76 2 - 77 MANUAL DEL USUARIO Se aplicar la configuracin del sistema actual - idioma, modo de reconocimiento, tipo de fuente, etc. El resultado del OCR se colocar en el portapapeles como texto en corpo, no formateado. O OO OORGANIZACIN RGANIZACIN RGANIZACIN RGANIZACIN RGANIZACIN DEL DEL DEL DEL DEL TEXT TEXT TEXT TEXT TEXTO OO OO RESUL RESUL RESUL RESUL RESULT TT TTANTE ANTE ANTE ANTE ANTE Guardar o exportar el texto requiere algo ms que indicar simplemente un mtodo de exportacin o un nombre para el archivo resultante. Tambin debe chapter2.pmd 3/04/2006, 15:43 77 2 - 78 seleccionarse un formato de archivo y determinarse la apariencia del texto reconocido. Es decir, tiene que elegir lo que quiere hacer con el texto antes de iniciar el programa correspondiente. Algunas opciones del botn "Formato" le permitirn determinar la apariencia del texto resultante. El flujo de texto flujo de texto flujo de texto flujo de texto flujo de texto del documento resultante es determinado directamente por la opcin "Fusionar Lneas en los Prrafos". Mantenga activada esta opcin para que Readiris detecte los prrafos. De esta forma, Readiris aplicar el ajuste de lnea ajuste de lnea ajuste de lnea ajuste de lnea ajuste de lnea tpico de los tratamientos de texto; de lo contrario se aade un retorno de carro (cdigo CR o EOL) tras cada lnea y las palabras separadas por guiones quedan tal cual. Por defecto, la deteccin de prrafos est activada. Para explicar esto, he aqu un ejemplo. Si las primeras tres lneas de una columna son "El nuevo presi-", "dente salud desde el balcn." y "Su esposa vino a acompaarlo.", la deteccin de prrafos le ofrece el siguiente resultado: "El nuevo presidente salud desde el balcn. Su esposa vino a acompaarlo." Las partes separadas por el guin de la palabra "presidente" fueron unidas y se aadi un espacio al final de la frase, creando as un flujo natural de texto. Si la deteccin de prrafos no estuviese activada, se habra mantenido el diseo original con un retorno de carro aadido al final de cada lnea. Esta opcin no est disponible cuando el formato PDF est seleccionado: siempre se almacenan los archivos PDF Adobe Acrobat lnea por lnea. (El botn "Formato" contiene algunas opciones que an no hemos explicado; lo haremos pronto.) chapter2.pmd 3/04/2006, 15:43 78 2 - 79 MANUAL DEL USUARIO C CC CCONFIGURACIN ONFIGURACIN ONFIGURACIN ONFIGURACIN ONFIGURACIN DEL DEL DEL DEL DEL ESCNER ESCNER ESCNER ESCNER ESCNER Ahora debe configurar su escner. Se supone que el escner y los controladores necesarios han sido instalados correctamente. Si la licencia de su software Readiris va unida a un modelo de escner, probablemente este paso resulte innecesario, ya que su escner puede estar configurado para Readiris. Haga clic en el botn "Escner" de la barra principal de herramientas. Haga clic en el botn "Tipo de Escner" para determinar el modelo de modelo de modelo de modelo de modelo de escner escner escner escner escner. .. .. (No dude en ponerse en contacto con el fabricante del equipo o con su distribuidor si siguiera teniendo problemas con los controladores del escner. La chapter2.pmd 3/04/2006, 15:44 79 2 - 80 mayora de fabricantes permiten descargar las ltimas versiones de los controladores directamente desde su pgina web.) Si selecciona la opcin "<Image>" (imagen) como escner - las imgenes ya escaneadas funcionan como origen de las imgenes en todo momento - no tiene que seleccionar el disco como origen de imagen con el botn "Fuente" de la barra principal de herramientas. El botn "Configurar" slo est disponible si su escner lo permite. Para acceder a algunos parmetros avanzados de escaneado con escaners Twain, haga clic en el botn "Configurar" y seleccione el origen Twain. (Tambin puede utilizar la opcin "Seleccionar Fuente" del men "Archivo".) Una vez seleccionado el escner, la misma ventana le permitir establecer la resolucin de escaneado, el formato y la orientacin de la pgina y el brillo y el contraste. Asimismo, tendr ocasin de indicar si va a utilizar el alimentador del escner. Con escaners Twain, todos los parmetros de escaneado a menudo se establecen dentro del interfaz Twain. Establezca el brillo brillo brillo brillo brillo y, si dispone de l, el contraste contraste contraste contraste contraste. Si activa la opcin "Apaisado" indicar que la pgina tiene dicha orientacin y no la vertical. En realidad, la orientacin de la pgina se aplica a los formatos reducidos de pgina: en un escner plano de formato A4, se pueden escanear pginas de formato A5 (la mitad del tamao del A4) en orientacin vertical y horizontal, pero obviamente slo puede escanear la superficie completa de una pgina A4 en una nica direccin. chapter2.pmd 3/04/2006, 15:44 80 2 - 81 MANUAL DEL USUARIO Por ltimo, la opcin "Invertir" le permitir generar imgenes invertidas imgenes invertidas imgenes invertidas imgenes invertidas imgenes invertidas en la modalidad de escaneado en blanco y negro - puede activar esta opcin para procesar pginas enteras en las que aparezca texto blanco sobre fondo negro. Ya hemos hablado del escaneado a intervalos. Solamente recordar que es una forma muy eficaz de escanear documentos de mltiples pginas cuando se utiliza un escner plano sin alimentador de documentos. P PP PPONGA ONGA ONGA ONGA ONGA COLORES COLORES COLORES COLORES COLORES EN EN EN EN EN SUS SUS SUS SUS SUS TEXT TEXT TEXT TEXT TEXTOS OS OS OS OS DIGIT DIGIT DIGIT DIGIT DIGITALIZADOS ALIZADOS ALIZADOS ALIZADOS ALIZADOS! !! !! Readiris suporta sin ningn problema imgenes en blanco y negro, en escala de grises y en color. Escoja, pues, la modalidad de color modalidad de color modalidad de color modalidad de color modalidad de color que mejor se adapte a sus necesidades. Si va a incluir en los documentos dibujos, escanee en blanco y negro, si desea incorporar fotografas en blanco y negro, escanee en escala de grises y para insertar fotografas en color, escanee en color. Pero cul es la razn para reducir la profundidad de las imgenes en la fase de escaneado? Ni que decir tiene que las imgenes en escala de grises y en color se escanean con ms lentitud y requieren ms memoria RAM que las imgenes en blanco y negro. Escanear en escala de grises y en color no es slo til para guardar imgenes con suficiente calidad, y para conservar los colores del texto escaneado durante el proceso de reconocimiento. A veces, tambin puede ser til - o incluso necesario - para obtener buenos resultados con el OCR! Cuando el texto est impreso sobre un fondo coloreado, el hecho de escanear en color puede generar esos matices tonales de los que carecen las imgenes en blanco y negro. Cuando el contraste entre el texto y el fondo es reducido, este ltimo puede crear cierto ruido; lo que dificultar enormemente el reconocimiento, o lo har imposible! chapter2.pmd 3/04/2006, 15:44 81 2 - 82 Piense, por ejemplo, en un texto negro impreso sobre fondo oscuro. Si escanea un texto as en blanco y negro, por mucho que intente ajustar el brillo del escner, no podr deshacerse del color de fondo sin perder tambin la informacin del texto...
Readiris genera una versin en blanco y negro de cada imagen en escala de grises o en color. Sus rutinas inteligentes resuelven incluso casos muy problemticos. As es como se digitalizan las imgenes difciles. chapter2.pmd 3/04/2006, 15:44 82 2 - 83 MANUAL DEL USUARIO Para visualizar una imagen escaneada en blanco y negro, deshabilite la opcin "Visualizar Documento en Color" del men "Ver". Aunque, en realidad, usted no ver ninguna imagen en blanco y negro en la pantalla de su ordenador, incluso si se escanean imgenes binivel! Esto se debe a que Readiris optimiza las imgenes para una perfecta legibilidad en pantalla. La tcnica especializada de visualizacin de alta resolucin visualizacin de alta resolucin visualizacin de alta resolucin visualizacin de alta resolucin visualizacin de alta resolucin de I.R.I.S. convierte las imgenes en blanco y negro en imgenes en escala de grises. Se suavizan y difuminan las imgenes en escala de grises y en color. chapter2.pmd 3/04/2006, 15:44 83 2 - 84 Como consecuencia, no ser necesario ampliarlas, incluso en porttiles con pantallas de cristal lquido u PC de escritorio con pantallas de gama baja. Aumente la imagen a tamao real (o ms) para ver la imagen pura, tal como e escane. A AA AAP PP PPARA ARA ARA ARA ARAT TT TTOS OS OS OS OS DISTINT DISTINT DISTINT DISTINT DISTINTOS OS OS OS OS, , , , , RESOLUCIN RESOLUCIN RESOLUCIN RESOLUCIN RESOLUCIN DISTINT DISTINT DISTINT DISTINT DISTINTA AA AA Sea como sea su modo de digitalizacin, utilice una resolucin resolucin resolucin resolucin resolucin de escaneado de 300 ppp para aplicaciones normales. Cuando el documento que vaya a escanear tenga un tipo de letra pequeo (menos de 10 puntos), o sea de mala calidad, utilice mejor una resolucin ms alta, de 400 ppp. Readiris lee tamaos de punto tamaos de punto tamaos de punto tamaos de punto tamaos de punto entre 6 y 72 puntos (0,21 y 2,54 cm.). Readiris reconoce asimismo letras descendentes letras descendentes letras descendentes letras descendentes letras descendentes (drop letters), maysculas de gran tamao que cubren varias lneas. (Desde luego, stas no pueden ser superiores a 72 puntos.) Incluso se reconocen las maysculas descendentes invertidas... chapter2.pmd 3/04/2006, 15:44 84 2 - 85 MANUAL DEL USUARIO
Dado que el OCR ptimo requiere una resolucin de entre 300 y 400 ppp, Readiris le avisa cuando escanea imgenes con una resolucin inferior a 200 ppp o superior a 800 ppp. Entre otras cosas, la resolucin de imagen de estos archivos se marca en color rojo en el panel de documentos. Readiris puede corregir los imgenes escaneadas con demasiados detalles. Para llevar a cabo la correccin, active la opcin "Optimizar la Resolucin para el OCR" en la configuracin del escaneado. Siempre que la resolucin de la imagen de los escaneados supere los 600 ppp, la resolucin se reduce para el proceso del OCR. Existen otras maneras de evitar este aviso: cuando lee faxes faxes faxes faxes faxes (que presentan una resolucin de 100 o 200 ppp), cuando genera imgenes con una cmara digital (cuya resolucin se desconoce) y cuando abre imgenes en las que el encabezamiento del archivo contiene una resolucin incorrecta. Para procesar este tipo de imgenes sin ningun problema, active la opcin "Procesar como 300 ppp". Este parmetro sirve para digitalizar directamente y abrir imgenes previamente escaneadas. chapter2.pmd 3/04/2006, 15:44 85 2 - 86
Cuando digitaliza imgenes con una cmara digital cmara digital cmara digital cmara digital cmara digital en lugar de un escner, es imprescindible activar una opcin especfica. (Este parmetro sirve otra vez para digitalizar directamente y abrir imgenes previamente escaneadas.)
As, optimiza la imagen antes de reconocerla. Existen varias dificultades en el momento de digitalizar con cmaras digitales: generan imgenes con baja resolucin - incluso cuando dispone la cmara muy cerca al documento - y en todo caso no se conoce la resolucin de la imagen. Incluso as, le recomendamos que active el modo de reconocimiento preciso, mediante el botn "Idioma", para reconocer correctamente estas imgenes con xito. Tendr que tener en cuenta algunos elementos delicados a la hora de digitalizar correctamente imgenes escaneadas con una cmara digital. Antes de todo, seleccione la resolucin de imagen ms alta posible. Genere, por ejemplo, imgenes con una resolucin de 2.600 x 2.000 con una cmara de 5 MP que tambin pueda hacer fotos con resoluciones de 2.100 x 1.550 y 1.600 x chapter2.pmd 3/04/2006, 15:44 86 2 - 87 MANUAL DEL USUARIO 1.200. Luego, active el modo macro de su cmara para los primeros planos - siempre es as cuando fotografia documentos. (Este modo ha sido diseado para capturar flores, insectos, etc.) En el caso contrario las imgenes seran imprecisas e ilegibles.
Utilice el zoom ptico e ignore el digital. Cuando se utiliza el zoom ptico, la lente amplia la imagen. Como resultado, la calidad de la imagen aumenta. Por contra, el zoom digital reduce la resolucin y la calidad de la imagen: las tcnicas de interpolacin se aplican para aadir falsos pxeles de manera artificial a la instantnea. Tendr que limitarse a pequeas compresiones o a ninguna: una compresin importante reduce la nitidez del texto digitalizado. Puede agrandecer para poder recortar sus documentos - algunas cmaras vienen includas con un programa para restablecer la fotografa orginal (photo stitching), pero no es til para capturar un documento. Mantenga la cmara directamente encima del documento para evitar capturar el documento bajo un cierto ngulo. Sin embargo, evite que la sombra del aparato o de su mano sea proyectada en el documento. Genere imgenes estables. Piense tambin en colocar su cmara en un trpode cuando sea necesario. Desactive el flash cuando fotografia papel brillante, o sino puede ser que la imagen sea demasiado plida. Generalmente, mejor vale adaptar el brillo y contraste chapter2.pmd 3/04/2006, 15:44 87 2 - 88 al entorno - luz del da, luz de una lmpara, luz de nen, etc. (Algunas cmaras puede ser calibradas filmando un documento blanco.) Para comprobarlo, abra la imagen DIGITAL.JPG en la carpeta de imgenes de Readiris y ejecute el reconocimiento. chapter2.pmd 3/04/2006, 15:44 88 2 - 89 MANUAL DEL USUARIO G GG GGUARDAR UARDAR UARDAR UARDAR UARDAR LA LA LA LA LA CONFIGURACIN CONFIGURACIN CONFIGURACIN CONFIGURACIN CONFIGURACIN PREDETERMINADA PREDETERMINADA PREDETERMINADA PREDETERMINADA PREDETERMINADA Defina correctamente todos los parmetros de escaneado y haga clic en la opcin "Guardar la Configuracin por Defecto" del men "Archivo" para sobrescribir la configuracin por defecto por la configuracin actual. (En caso que esta configuracin no fuese tampoco la adecuada, siempre podr restablecer la configuracin inicial con la opcin correspondiente...) chapter2.pmd 3/04/2006, 15:44 89 2 - 90 Los archivos de configuracin no slo contienen la configuracin configuracin configuracin configuracin configuracin del escner, sino que tambin determinan si desea utilizar el aprendizaje interactivo, el idioma y las propiedades de los documentos, qu modos de reconocimiento y de salida se utilizarn - por ejemplo, enviar el texto a la aplicacin WordPad -, etc. En pocas palabras, todos los ajustes operativos de Readiris se almacenan en los archivos de configuracin. G GG GGUARDAR UARDAR UARDAR UARDAR UARDAR PROPIEDADES PROPIEDADES PROPIEDADES PROPIEDADES PROPIEDADES ESPECFICAS ESPECFICAS ESPECFICAS ESPECFICAS ESPECFICAS Obviamente, la configuracin predeterminada se utilizar cada vez que se inicie el programa, pero puede guardar propiedades especficas para no tener que redefinir estos parmetros de funcionamiento. Las opciones "Guardar Configuracin" y "Cargar Configuracin" del men "Archivo" se encargan de ello. He aqu un ejemplo: si peridicamente debe reconocer documentos en espaol con un diseo especfico, le recomendamos que cree un archivo de configuracin para dicho tipo de documento. A continuacin seleccione "Espaol" como idioma del documento, cargue una divisin en zonas concreta para no tener que trazar las mismas ventanas a cada pgina, desactive el aprendizaje, pero active un diccionario de fuentes en modo de lectura porque algunas tipos de fuentes se usan de forma sistemtica, etc. Si no est seguro de la configuracin actual, no necesita pasar revista a todos los mens y opciones para descubrirlas. Utilice la opcin "Informacin" del men "Archivo" para obtener una sinopsis de las mismas. chapter2.pmd 3/04/2006, 15:44 90 2 - 91 MANUAL DEL USUARIO Este mando tambin muestra la inoformacin que se puede encontrar en el panel de documentos para todas las pginas. E EE EESCANEAR SCANEAR SCANEAR SCANEAR SCANEAR DOCUMENTOS DOCUMENTOS DOCUMENTOS DOCUMENTOS DOCUMENTOS Ahora que el escner est correctamente configurado, vamos a empezar a escanear documentos. Hay algunos aspectos de los que debe estar informado. En primer lugar, tenga cuidado con la inclinacin de las lneas. Aunque el anlisis de pgina y el reconocimiento admiten cierto grado de inclinacin, la divisin en ventanas y el OCR de una pgina pueden verse dificultados si la inclinacin de las lneas es excesiva. Una pequea inclinacin (menos de 0,5) no tiene ninguna importancia: la fidelidad del OCR no se ve afectada. El mando "Restablecimiento de Pginas" del botn "Opciones" (y del men "Configuracin") determina si las pginas escaneadas con alguna inclinacin van chapter2.pmd 3/04/2006, 15:44 91 2 - 92 a restablecerse restablecerse restablecerse restablecerse restablecerse, se arreglarn automticamente. (Las pequeas inclinaciones no se tendrn en cuenta.) Esta opcin se encuentra desactivada por defecto.
Si ha olvidado activar esta opcin, utilice el botn "Restablecer la Pgina" de la barra de herramientas de imagen (o la opcin del mismo nombre del men "Accin") para rectificar las pginas escaneadas con alguna desviacin.
Este restablecimiento de lneas tarda algunos segundos, dado que, en primer lugar, se analiza la imagen para detectar el posible ngulo de inclinacin. Seguidamente se recompone la imagen en color o en escala de grises (as como su versin en blanco y negro) y, por ltimo, vuelve a ejecutarse el anlisis de pgina. Cada vez que necesite ajustar la orientacin de la pgina, puede usar las herramientas de rotacin rotacin rotacin rotacin rotacin de la barra de herramientas de imagen. (Los mandos correspondientes se encuentran en el men "Ver".) Existen tres direcciones de rotacin: a la izquierda, a la derecha e inversin. La rotacin tarda algunos segundos en actualizar la imagen en s y no slo lo que se muestra en pantalla.
Sin embargo, Readiris puede corregir por usted las pginas mal orientadas. Active la opcin "Detectar la Orientacin de las Pginas" bajo el botn "Opciones" (o en el men "Configuracin") y Readiris orientar la pgina cuando sea necesario. chapter2.pmd 3/04/2006, 15:44 92 2 - 93 MANUAL DEL USUARIO
Si desea comprobar cmo funciona esta opcin, utilice la imagen DESKEW.JPG que se encuentra en la carpeta de imgenes de Readiris. Desactive los opciones "Restablecemiento de Pginas" y "Detectar Orientacin de las Pginas" antes de abrir la imagen y deje que Readiris restablezca la Torre de Pisa... tal como la conocemos. chapter2.pmd 3/04/2006, 15:44 93 2 - 94 Recuerde tambin que el panel de documentos indica qu ngulo de inclinacin se corrigi y qu rotaciones se llevaron a cabo. chapter2.pmd 3/04/2006, 15:45 94 2 - 95 MANUAL DEL USUARIO A AA AAJUSTE JUSTE JUSTE JUSTE JUSTE DE DE DE DE DE LAS LAS LAS LAS LAS IMGENES IMGENES IMGENES IMGENES IMGENES ESCANEADAS ESCANEADAS ESCANEADAS ESCANEADAS ESCANEADAS Como ya hemos indicado, las imgenes en color o escala de grises se transforman automticamente en imgenes en blanco y negro mediante avanzadas rutinas inteligentes. En caso de que siguiera siendo necesario, el usuario puede afinar an ms la imagen, con vistas a un mejor OCR. Seleccione para ello la opcin "Ajustar Imagen" del men "Accin". Cuando seleccione esta opcin, se visualizar automticamente la versin en blanco y negro de la imagen - es como si desactivara la opcin "Visualizar Documento en Color". Hay algunos conceptos de cierta complejidad, que pasamos a desarrollar con detalle seguidamente. chapter2.pmd 3/04/2006, 15:45 95 2 - 96 La opcin "Alisar Imagen de Color" da a las imgenes en color o escala de grises un aspecto ms homogneo y para ello rasea, es decir, suaviza las diferencias relativas de intensidad, con lo que el contraste queda ms afinado entre el primer plano - texto - y el fondo - un color, ilustraciones, etc. Puede que este dispositivo de preprocesamiento preprocesamiento preprocesamiento preprocesamiento preprocesamiento le parezca muy tcnico y difcil de entender, pero es realmente funcional, ya que con algunos modelos de escner se necesita esta reduccin de nitidez para reconocer imgenes en color y escala de grises. A veces, el nico modo de separar el texto del fondo de color chapter2.pmd 3/04/2006, 15:45 96 2 - 97 MANUAL DEL USUARIO consiste en suavizar las diferencias. Abajo tiene un ejemplo de imagen que es ilegible si no se suaviza la imagen. Se puede tambin suavizar las imgenes previamente escaneadas cuando se cargan en la memoria. Ocupmonos ahora del brillo brillo brillo brillo brillo. Este ajuste determina el brillo general de la imagen: cualquier oscurecimiento o aumento en el brillo de la imagen se aplica a todos los pxeles. El objetivo es deshacerse del fondo de pgina. Le daremos dos ejemplos. En el primero, todas las zonas de la imagen son oscuras. En consecuencia, hacemos ms clara la imagen para elimar el fondo de pgina; el primer plano (el texto) sigue siendo lo suficientemente oscuro como para que el proceso de binarizacin lo detecte. En el segundo ejemplo, tenemos una imagen tan clara que chapter2.pmd 3/04/2006, 15:45 97 2 - 98 en la imagen escaneada ni se ve el texto que est en primer plano, por lo que oscurecemos la imagen para que el texto sea legible.
El contraste contraste contraste contraste contraste determina la diferencia relativa entre las zonas ms claras y las ms oscuras de la imagen. (El texto generalmente es ms oscuro que el fondo, siendo el caso contrario cuando se trata con texto invertido.) El objetivo es hacer que las formas de los caracteres se distingan claramente de los fondos (de color). He aqu un ejemplo en el que se debe aumentar el contraste, dado que la configuracin por defecto resulta en caracteres rotos. Observe que no se ejecuta ningn ajuste de imagen hasta que no haga clic en el botn "Aplicar". Al pulsar "Aceptar" se ejecutar el ajuste y se cerrar la ventana. ste es un ejemplo en el que se ha aclarado drsticamente una imagen chapter2.pmd 3/04/2006, 15:45 98 2 - 99 MANUAL DEL USUARIO en blanco y negro. Naturalmente, sin pretender en ningn momento que el OCR sea de calidad! Estas opciones conciernen a las imgenes en color y en escala de grises, mientras que la ltima de ellas, "Limpiar", concierne exclusivamente a las imgenes en blanco y negro. Por limpieza entendemos la eliminacin de esa suciedad (motas) que ocasionan algunos pxeles innecesarios. chapter2.pmd 3/04/2006, 15:45 99 2 - 100 Asegrese de no borrar motas demasiado grandes, pues si no podra eliminar tambin los puntos de las "i", o partes de letras obtenidas mediante impresoras matriciales, etc. Para conseguir la mejor calidad de imagen con vistas a un buen OCR, coloque la ventana de ajuste de imagen donde no moleste para apreciar los arreglos que vaya haciendo. Seguidamente, ajuste los parametros y vaya pulsando "Aplicar" hasta conseguir una imagen clara y ntida. D DD DDEJE EJE EJE EJE EJE QUE QUE QUE QUE QUE EL EL EL EL EL ASISTENTE ASISTENTE ASISTENTE ASISTENTE ASISTENTE TRABAJE TRABAJE TRABAJE TRABAJE TRABAJE POR POR POR POR POR USTED USTED USTED USTED USTED Pasemos ahora a capturar documentos. En lugar de configurar uno a uno los parmetros, utilizaremos el asistente de OCR asistente de OCR asistente de OCR asistente de OCR asistente de OCR. ste es un sistema muy sencillo para reconocer pginas. Haga clic en el botn "Asistente OCR" de la barra de herramientas principal (o seleccione la opcin "Asistente OCR" del men "Accin").
El asistente lo ayudar durante el proceso de reconocimiento. Bastar con responder a unas simples preguntas para obtener rpidos resultados. chapter2.pmd 3/04/2006, 15:45 100 2 - 101 MANUAL DEL USUARIO Observe que el asistente de OCR se ejecuta cada vez que inicia Readiris; para que esto no ocurra, desactive la opcin "Activar el Asistente al Iniciar", que aparece en la primera pantalla del asistente. (Tambin puede desactivarlo usando la misma opcin del men "Configuracin".) R RR RREADIRIS EADIRIS EADIRIS EADIRIS EADIRIS REPRODUCE REPRODUCE REPRODUCE REPRODUCE REPRODUCE EL EL EL EL EL DISEO DISEO DISEO DISEO DISEO DE DE DE DE DE SUS SUS SUS SUS SUS DOCUMENTOS DOCUMENTOS DOCUMENTOS DOCUMENTOS DOCUMENTOS El asistente de OCR realiza el proceso de reconocimiento de forma prcticamente automtica, pero el reconocimiento automtico no debe confundirse con el formato automtico! Formato automtico significa que Readiris reproduce una copia facsmil copia facsmil copia facsmil copia facsmil copia facsmil del documento escaneado, aplicando el formato de las palabras, prrafos y pginas del documento original. chapter2.pmd 3/04/2006, 15:45 101 2 - 102 Se utilizan tipos de letra iguales a los del documento original (serif y sans serif, proporcionales y fijos, normales y condensados, superndice y subndice). Se mantienen los tamaos y estilos (negrita, cursiva, subrayado, superndice y subndice) durante el reconocimiento. Se reproducen las tabulaciones y la justificacin (izquierda, centrada, derecha o justificada) de cada bloque de texto. Lo mismo ocurre con las vietas y la numeracin. Todas las direcciones de correo electrnico y de pginas web sern detectadas y se establecern como hipervnculos en el texto creado. La colocacin de columnas, bloques de texto y grficos ser la misma del documento original. En otras palabras, Readiris le permite archivar una copia fiel de sus documentos, pero ahora en forma de archivo de texto digital, modificable y compacto, en lugar de una imagen escaneada! As pues, la clasificacin de ventanas slo se aplica parcialmente al realizar el formato automtico. Es decir, puede incluir y excluir zonas, pero cualquier reclasificacin no ser tenida en cuenta! Para familiarizarse con esta funcin, abra el archivo de imagen AUTOFORMAT.JPG, que se encuentra en la carpeta de imgenes de Readiris. chapter2.pmd 3/04/2006, 15:45 102 2 - 103 MANUAL DEL USUARIO Haga clic en el botn "Formato" de la barra de herramientas principal y enve el resultado del reconocimiento a Microsoft Word o bien seleccione el formato Word (*.doc), WordML (*.xml) o RTF (Rich Text Format). En segundo lugar, seleccione "Volver a Crear el Documento Original" como opcin de formato. (La opcin "Fusionar Lneas en los Prrafos" est activada por defecto para realizar chapter2.pmd 3/04/2006, 15:45 103 2 - 104 el ajuste de lneas dentro de los prrafos.) (El mensaje emergente del botn "Formato" indica el modo de salida y el formato de texto seleccionados.) Que la reconstruccin del formato sea posible o no depende del modo de salida. Algunos formatos pobres que generan texto simple, como Texto (ANSI), Texto formato MS-DOS (ASCII), etc., no pueden utilizar los cdigos avanzados de formato y, por consiguiente, no pueden ofrecer un formato automtico. Por otro lado, el formato PDF Adobe Acrobat se dise para copiar el aspecto de los documentos. As pues, los documentos PDF implican, por naturaleza, el formato automtico. Al abrir el texto reconocido con un tratamiento de textos, el texto tiene esta apariencia, sin intervencin alguna del usuario. (Para ver este efecto correctamente, el modo WYSIWIG del procesador de textos, denominado generalmente diseo de pgina, se activa automticamente.) chapter2.pmd 3/04/2006, 15:45 104 2 - 105 MANUAL DEL USUARIO En pocas palabras, Readiris no slo reconoce sus textos, sino que puede tambin formatearlos. Ahora, el OCR ya no es un simple reconocimiento de textos, sino que tambin es un autntico reconocimiento de documentos reconocimiento de documentos reconocimiento de documentos reconocimiento de documentos reconocimiento de documentos! chapter2.pmd 3/04/2006, 15:45 105 2 - 106 U UU UUTILICE TILICE TILICE TILICE TILICE COLUMNAS COLUMNAS COLUMNAS COLUMNAS COLUMNAS EN EN EN EN EN LUGAR LUGAR LUGAR LUGAR LUGAR DE DE DE DE DE CUADROS CUADROS CUADROS CUADROS CUADROS La opcin de formato "Utilizar Columnas y No Cuadros" determina cmo se realiza el formato automtico: los bloques de texto, las tablas y los grficos pueden almacenarse en cuadros o en columnas columnas columnas columnas columnas que pueden editarse. Los cuadros son contenedores de texto separados que sirven para colocar varios bloques de texto, de grficos y de tablas en una pgina. El texto en columnas pasa de forma natural de una columna a la siguiente y es mucho ms fcil de editar. Imaginemos ahora que en el documento escaneado hay columnas reales. Cuando el sistema es incapaz de detectar columnas en el documento original, este modo de formato utiliza igualmente cuadros por defecto! Si quiere probarlo, puede utilizar la imagen COLUMNS.TIF de la carpeta de imgenes de Readiris. chapter2.pmd 3/04/2006, 15:45 106 2 - 107 MANUAL DEL USUARIO La opcin "Insertar Saltos de Columna" mejora la recreacin de columnas: dermina si desea o no insertar un cdigo de fin de columna entre ellas. Con los cdigos de fin entre columnas, cualquier texto que se edite, aada o borre permanecer dentro de su columna; ningn texto fluir de forma automtica a la chapter2.pmd 3/04/2006, 15:45 107 2 - 108 siguiente columna. Aquellos textos que vayan despus de un espacio entre columnas sern colocados al principio de la columna siguiente. Active esta opcin si quiere conservar los fino de columnas en el mismo lugar en el que se hayan detectado en el documento reconocido - independientemente de la edicin de texto que se realice despus del OCR. En peridicos y revistas, las columnas de una pgina se corresponden casi siempre a distintos artculos. Por lo tanto, no es buena idea permitir que el texto fluya automticamente de una columna a la siguiente. Desactive esta opcin cuando haya dividido el texto en columnas: as se asegurar la fluidez natural del texto de una columna a la siguiente. Hay un aspecto en el que puede decidir no recrear el formato del documento original: el tamao de pgina de los documentos que se producirn. Qu queremos decir con esto? Veamos algunos ejemplos: usted escanea pginas de tamao Carta pero genera documentos de tamao A4 porque considera que este formato resulta ms fcil de imprimir, ya que la impresin de documentos de tamao Carta requiere alimentacin manual. O, por ejemplo, usted es abogado y escanea documentos de tamao Carta que guarda en formato Legal. Esta es la razn por la cual Readiris le permite definir el tamao de pgina que prefiera para los documentos que produce. Haga clic en el botn "Tamao del Papel" en el cuadro de dilogo "Formato". chapter2.pmd 3/04/2006, 15:45 108 2 - 109 MANUAL DEL USUARIO Seleccione los tamaos de papel aplicables y excluidos: los tamaos de papel preferidos se pueden utilizar para dar formato a los documentos reconocidos, mientras que los formatos excluidos no se utilizarn. Ordene los tamaos de papel aceptados: Readiris pasa por los diferentes tamaos de papel en el orden indicado, y utiliza el primer tamao de papel en el que pueda caber el documento escaneado. El botn "Por Defecto" vuelve a aplicar la configuracin por defecto. (Esto incluye su configuracin de Windows!) Recuerde que esta opcin no se puede utilizar con los archivos en formato HTML, un formato de texto pensado para Internet que no tiene formatos de pgina. Tampoco es compatible con los archivos PDF, que utilizan tamaos de pgina propioas para recrear con precisin el documento original. F FF FFORMA ORMA ORMA ORMA ORMAT TT TTO OO OO DE DE DE DE DE TEXT TEXT TEXT TEXT TEXTOS OS OS OS OS, 2 , 2 , 2 , 2 , 2 P PP PPAR AR AR AR ARTE TE TE TE TE Las otras opciones de diseo son "Crear Texto Continuo" y "Conservar el Formato de Palabras y Prrafos". chapter2.pmd 3/04/2006, 15:46 109 2 - 110 Como ilustra el icono de la derecha, crear texto de cuerpo texto de cuerpo texto de cuerpo texto de cuerpo texto de cuerpo significa crear un texto continuo, sin formato. El texto ser capturado, pero se ignorar totalmente el formato. Utilice esta opcin cuando necesite capturar un texto pero no su diseo. El cuerpo del texto es tambin lo que usted selecciona cuando reconoce rpidamente una zona del texto haciendo clic con el botn derecho, y seleccionar la opcin "Copiar como Texto": una vez realizado el reconocimiento, pegar usted el cuerpo del texto en su aplicacin de texto. La opcin "Conservar el Formato de Palabras y Prrafos" representa un camino intermedio: durante el reconocimiento se mantiene el formato de palabras formato de palabras formato de palabras formato de palabras formato de palabras - tipo de letra, el tamao de letra y el estilo. Asimismo, tambin se mantiene el formato de prrafo formato de prrafo formato de prrafo formato de prrafo formato de prrafo - tabulaciones y justificacin. Pero no hay que confundir este formato con el formato automtico completo: la primera opcin coloca los prrafos uno tras otro y no reproduce columnas, ni copia la posicin relativa de las diferentes zonas. E EE EEXPOR XPOR XPOR XPOR XPORT TT TTAR AR AR AR AR EL EL EL EL EL TEXT TEXT TEXT TEXT TEXTO OO OO V VV VVARIAS ARIAS ARIAS ARIAS ARIAS VECES VECES VECES VECES VECES En realidad, podr exportar los resultados del OCR varias veces sin tener que repetir el reconocimiento. Cambie el formato del texto y las opciones de formato con el botn "Formato" y haga de nuevo clic en el botn "Reconocer-Guardar". En este caso, no se ejecutar OCR, a menos que haya usted definido nuevas chapter2.pmd 3/04/2006, 15:46 110 2 - 111 MANUAL DEL USUARIO ventanas o haya modificado las existentes. De lo contrario, Readiris slo cambiar el formato de los resultados OCR y los guardar en el nuevo formato del texto o los enviar a la aplicacin de llegada que usted haya seleccionado.
Lo mismo se aplicar para cualquier otro elemento que usted cambie: cuando aada una pgina a su trabajo OCR, slo se reconocer esa pgina. Si crea una nueva zona de texto en una pgina, slo ser reconocida esa zona antes de que los resultados se exporten. Por ejemplo, usted podra reconocer un documento de 10 pginas y guardarlo en un archivo de Word, escanear el resumen de la primera pgina y enviarlo por correo electrnico a un compaero impaciente, escanear el anexo - una tabla - y guardar todos los resultados en un archivo HTML para colgarlo en la pgina web de su empresa. G GG GGUARDAR UARDAR UARDAR UARDAR UARDAR GRFICOS GRFICOS GRFICOS GRFICOS GRFICOS POR POR POR POR POR SEP SEP SEP SEP SEPARADO ARADO ARADO ARADO ARADO En nuestro ejemplo, el grfico se inclua en el documento reconocido; que esto sea as o no, depender de la opcin de formato "Incluir Grficos". Los grficos que hay en el texto se podrn volver a guardar dependiendo del modo de salida. Los formatos de texto pobres como Texto (ANSI), etc. no almacenan grficos. An as, con Readiris puede guardar grficos sin llevar a cabo el reconocimiento de texto. Dado que el programa Readiris genera imgenes en blanco y negro, ,, ,, en escala de grises o en color, con l pueden capturarse dibujos y fotografas muy fcilmente. chapter2.pmd 3/04/2006, 15:46 111 2 - 112 Cmo? Trace una zona de grfico alrededor de las ilustraciones, caricaturas, etc. que desee capturar. Hgalo de la misma forma que traza una ventana de texto o de tabla, pero en este caso seleccione la herramienta "Ventana de Grfico". A continuacin elija la opcin "Guardar Grficos" en el men "Archivo". Se le pedir que especifique un nombre de archivo. Determine el formato grfico que desee usar. Seleccione un formato que pueda utilizar con su software de retoque. Dispone de los formatos JPEG, TIFF y Zsoft Paintbrush (*.pcx). Active la opcin "Escala de Grises/Color" que permite guardar las imgenes bien en color, bien en escala de grises. Al guardar grficos en blanco y negro en el formato TIFF, se utiliza la compresin de Grupo 4. Al guardar grficos en escala de grises o en color en el formato TIFF, se utiliza la compresin JPEG y el usuario puede definir la calidad JPEG (nivel de compresin). chapter2.pmd 3/04/2006, 15:46 112 2 - 113 MANUAL DEL USUARIO Para enviar un grfico al portapapeles mejor que guardar un archivo de imagen, haga clic con el ratn sobre una ventana de grfico y seleccione la opcin "Copiar como Grfico": la zona del grfico que se haya seleccionado con el ratn est lista para ser pegada. chapter2.pmd 3/04/2006, 15:46 113 2 - 114 R RR RRECREAR ECREAR ECREAR ECREAR ECREAR COLUMNAS COLUMNAS COLUMNAS COLUMNAS COLUMNAS, , , , , CUADROS CUADROS CUADROS CUADROS CUADROS, , , , , ETC ETC ETC ETC ETC. . . . . DE DE DE DE DE COLOR COLOR COLOR COLOR COLOR Readiris tambin ofrece otra forma de aadir color a los documentos que genere: la opcin "Conservar los Colores del Fondo" conserva los colores del fondo de pgina durante el proceso de reconocimiento. (Esta opcin implica que se conserven tambin los colores del texto.) chapter2.pmd 3/04/2006, 15:46 114 2 - 115 MANUAL DEL USUARIO Siempre que el documento original tuviese algn color de fondo, el resultado ser un color de fondo uniforme en cada prrafo. Esta funcin es compatible con los formatos de salida Word (*.doc), RTF (Rich Text Format), WordML (*.xml) y HTML. Sin embargo, recuerde que, con esta funcin, no se conservarn los detalles de, por ejemplo, una fotografa a pgina completa ubicada en el fondo de un documento. (Reconozca la imagen de muestra COLORS.JPG para hacer una prueba...) chapter2.pmd 3/04/2006, 15:46 115 2 - 116 C CC CCONSER ONSER ONSER ONSER ONSERV VV VVAR AR AR AR AR LOS LOS LOS LOS LOS COLORES COLORES COLORES COLORES COLORES DEL DEL DEL DEL DEL TEXT TEXT TEXT TEXT TEXTO OO OO Y hay an otra forma de aadir color a los documentos que genere: puede conserver los colores del texto colores del texto colores del texto colores del texto colores del texto. La opcin de formato "Conservar los Colores del Texto" para preservar los colores originales del texto durante todo el proceso de reconocimiento: aparecer un ttulo de color rojo en el documento generado, etc. chapter2.pmd 3/04/2006, 15:46 116 2 - 117 MANUAL DEL USUARIO chapter2.pmd 3/04/2006, 15:46 117 2 - 118 L LL LLECTURA ECTURA ECTURA ECTURA ECTURA DE DE DE DE DE F FF FFAXES AXES AXES AXES AXES Y YY YY RECONOCIMIENT RECONOCIMIENT RECONOCIMIENT RECONOCIMIENT RECONOCIMIENTO OO OO DIFERIDO DIFERIDO DIFERIDO DIFERIDO DIFERIDO Al guardar imgenes en archivos graficos se abre otra posibilidad: puede guardar la pgina completa y realizar un reconocimiento diferido reconocimiento diferido reconocimiento diferido reconocimiento diferido reconocimiento diferido ms adelante. Eso fue lo que hicimos con las imgenes escaneadas para nuestro curso. Escanee simplemente el documento y seleccione la opcin "Guardar Toda la Pgina como Imagen" del men "Archivo" para guardar una nica pgina. El programa le pedir en qu formato desea guardar la pgina: PDF, JPEG, TIFF o ZSoft Paintbrush (*.pcx). Seleccione la opcin "Guardar todas las pginas como imagen" para guardar un documento de mltiples pginas. Dispondr de dos formatos de archivo: PDF y TIFF de mltiples pginas. Pero tambin puede seleccionar los formatos de salida PDF Imagen o TIFF con el botn "Formato". chapter2.pmd 3/04/2006, 15:46 118 2 - 119 MANUAL DEL USUARIO (La exclusin de pginas tambin se aplica al reconocimiento: cuando ponga en marcha el proceso de OCR, las pginas excluidas (temporalmente) no se incluirn en el archivo de imagen de multiples pginas.) Ahora puede seleccionar el disco como origen de la imagen y abrir el archivo grfico con el botn "Abrir" (o con la opcin equivalente del men "Accin"). (Si utiliza la opcin "Abrir" del men "Archivo", ni siquiera tiene que actualizar el origen de la imagen.) Como el programa reconoce imgenes en color, en escala de grises y en blanco y negro, Readiris le permite abrir documentos PDF de Adobe Acrobat y archivos de imagen con los formatos fax DCX (una versin multipgina del formato Paintbrush), DjVu (*.djv, *.djvu), JPEG, JPEG 2000 (*.j2c, *.jp2), PNG, TIFF (no comprimidos o comprimidos con los mtodos LZW, PackBits, Grupo 3, Grupo 4 o JPEG), TIFF de mltiples pginas, mapas de bits de Windows (*.bmp) y ZSoft Paintbrush (*.pcx). Esta capacidad resulta especialmente til para convertir sus faxes faxes faxes faxes faxes en archivos de texto editables. Readiris usa su mxima capacidad para reconocer faxes. El programa detecta las resoluciones tpicas de fax - 100 x 200 ppp (calidad nor- mal), 200 x 200 ppp (calidad fina) y 200 x 400 ppp (calidad superfina) - y chapter2.pmd 3/04/2006, 15:46 119 2 - 120 preprocesa automticamente estas imgenes para asegurar unos resultados de OCR ptimos. Sin embargo, de ser posible, pida a sus corresponsales que enven sus faxes con calidad fina, puesto que dichos faxes darn mejores resultados de OCR. Nuestro secundo consejo ya le resultar familiar: active el modo de reconocimiento preciso, que encontrar haciendo clic en el botn "Idioma", y podr reconocer los faxes con xito. No olvide que puede abrir imgenes directamente desde el Explorador de Windows haciendo clic con el botn derecho del ratn en un archivo grfico y seleccionando la opcin "Reconocer" del men contextual. Tambin puede arrastrarlos con el ratn desde el Explorador de Windows hasta la zona de imgenes o sobre el icono de Readiris, y se abrirn automticamente. R RR RRECONOCIMIENT ECONOCIMIENT ECONOCIMIENT ECONOCIMIENT ECONOCIMIENTO OO OO DE DE DE DE DE T TT TTABLAS ABLAS ABLAS ABLAS ABLAS Hasta ahora hemos reconocido textos y faxes y hemos guardado grficos. Ahora procesaremos una tabla. Coja una tabla con cifras y escanela, o bien abra la imagen de muestra TABLES.JPG que se encuentra en la carpeta de imgenes de Readiris. En realidad, la imagen TABLES.JPG contiene dos tablas y no es una coincidencia! El anlisis de pgina las divide en ventanas de tabla y Readiris las reconstruir reproducindolas celda a celda en un programa de hoja de clculo o insertando una tabla en el archivo del procesador de textos que usted prefiera. Daremos algunos ejemplos. Empezaremos con la tabla con cuadrcula o enmarcada; es decir, la que tiene bordes alrededor de las celdas. chapter2.pmd 3/04/2006, 15:46 120 2 - 121 MANUAL DEL USUARIO Utilice el botn "Ordenar" para seleccionar la tabla y ejecute el reconocimiento con cualquier nivel de formato. Da igual que cree cuerpo de texto, que conserve el formato de las palabras y los prrafos o que recree el documento fuente: la tabla se recrear. Abra un procesador de textos y ver el resultado: las clulas y los bordes han sido creados por Readiris uno a uno! (Naturalmente, tambin puede incluir prrafos de texto normales en este archivo.) chapter2.pmd 3/04/2006, 15:46 121 2 - 122 Pasemos ahora al ejemplo de las tablas sin cuadrcula - o sea, las que no tienen bordes alrededor de las celdas. Observe que, pese a todo, el anlisis de pgina la detecta! Otro aspecto muy interesante de esta tabla es que su contenido es totalmente numrico. chapter2.pmd 3/04/2006, 15:46 122 2 - 123 MANUAL DEL USUARIO Para una precisin ptima de reconocimiento, limite el reconocimiento a los smbolos numricos smbolos numricos smbolos numricos smbolos numricos smbolos numricos con el botn "Idioma". (El modo numrico no es estrictamente numrico, incluye los smbolos 0 a 9, +, *, /, %, , (coma), . (punto), (, ), -, =, $, , y el smbolo .) chapter2.pmd 3/04/2006, 15:47 123 2 - 124
Dado que esto slo puede hacerlo cuando la tabla no contiene ningn carcter alfabtico - de lo contrario, las porciones de texto no se reconoceran correctamente - , podemos activar el modo numrico solamente para reconocer esta tabla, pero no el resto del documento. (En consecuencia, utilice el botn "Ordenar" para seleccionar la tabla.) En esta ocasin, enviaremos directamente el resultado del reconocimiento al programa de hoja de clculo Microsoft Excel. Seleccionaremos, pues, Excel como aplicacin de salida mediante el botn "Formato". La hoja de clculo se inicia automticamente y el resultado es idntico al de la tpica estructura de tabla con filas y columnas, en la que podr procesar datos inmediatamente. chapter2.pmd 3/04/2006, 15:47 124 2 - 125 MANUAL DEL USUARIO Puede ocurrir que el anlisis de pgina a veces no detecte como tal alguna tabla sin cuadrcula y por tanto no la site en una zona de tabla. Esto se debe a que el espacio entre columnas es muy amplio. Readiris pretende de esta manera evitar la posible confusin con bloques de texto en los que haya columnas y no tablas. Para trazar una ventana de tablas manualmente, haga clic en la herramienta "Ventana de Tabla" de la barra de herramientas de imagen y siga el procedimiento habitual. Una vez ms, la etiqueta emergente del botn le indicar el nmero de ventanas de tabla. En los dos ejemplos anteriores, seleccionamos la primera tabla y, a continuacin, la segunda, con el botn "Ordenar" para limitar el reconocimiento a los datos requeridos. Tuvimos que excluir la otra tabla y cualquier texto que est alrededor de las tablas. De hecho, este paso manual no es necesario cuando generamos resultados en formato SpreadsheetML, el nuevo formato de tabla basado en XML de Microsoft Office 2003. (Podemos hacerlo enviando los resultados del reconocimiento a Microsoft Excel 2003 y generando archivos SpreadsheetML.) chapter2.pmd 3/04/2006, 15:47 125 2 - 126 Algunas opciones slo son aplicables a este formato de tabla. La opcin "Ignorar Todo Texto Fuera de Tablas" guarda las tablas e ignora el resto de resultados del reconocimiento. Todos los datos del interior de las tablas se capturan, mientras que los datos situados fuera de la(s) tabla(s) - bloques de texto, grficos, cdigos de barras, etc. - se ignoran con este modo de salida. Siempre que las zonas de tabla estn correctamente definidas, no importa qu ventanas detecta el anlisis de pgina.
Con esta opcin, puede deshacerse del texto situado alrededor de las tablas de manera instantnea, sin necesidad de realizar operaciones manuales. Pero, incluso chapter2.pmd 3/04/2006, 15:47 126 2 - 127 MANUAL DEL USUARIO as, an tenemos dos tablas en la misma pgina. Podemos guardarlas por separado sin realizar ms operaciones adicionales? Claro que s! Active la opcin de SpreadsheetML "Crear una Hoja de Clculo por Tabla" para colocar cada tabla en una hoja independiente. Cuando el texto reconocido en el exterior de las tablas se incluye, lo encontrar en otra hoja; los hipervnculos le permitirn saltar del texto a las tablas y viceversa de manera instantnea. Si el documento reconocido contiene varias pginas, ver que esta estructura se repite en cada pgina. La opcin alternativa es "Crear una Hoja de Clculo por Pgina", que hace que se cree una sola hoja por cada pgina escaneada. Si una pgina contiene tablas y texto, todo se colocar en la misma hoja de clculo. Tenga en cuenta que slo las cifras situadas dentro de las tablas se codificarn como nmeros, y siempre que la opcin "Convertir Cifras en Nmeros" est activada. El texto situado dentro y fuera de las tablas sigue siendo... texto. chapter2.pmd 3/04/2006, 15:47 127 2 - 128 La opcin "Convertir Cifras en Nmeros" codifica las cifras reconocidas como nmeros. Como consecuencia, es posible ejecutar operaciones aritmticas en estas celdas. Las celdas de texto (en cualquier tabla) siguen siendo lo que eran - texto. (Excel ejecuta operaciones matemticas - calcular sumas, promedios, etc. - exclusivamente en datos codificados como nmeros. Dentro de Excel, slo se aade texto para aumentar la claridad de los datos y para imprimir.) Asimismo, Readiris sustituye las comas por puntos y viceversa. Vamos a ver un ejemplo: usted exporta una tabla en ingls (o ingls de EE.UU.) a un PC en el que la configuracin internacional es espaol. Readiris reconoce "1. .. ..25" y "1, ,, ,,000, ,, ,,000" correctamente, pero recodifica los nmeros como "1, ,, ,,25" y "1. .. ..000. .. ..000" en la hoja de clculo. (En caso que tenga dudas acerca de la configuracin de su sistema, compruebe la configuracin regional de Windows (en el "Panel de Con- trol") para ver cmo representarn los idiomas, las fechas, las horas y los nmeros sus programas compatibles con datos internacionales.) Tenga tambin en cuenta que la opcin "Conservar los Colores del Texto" es aplicable al formato SpreadsheetML, del mismo modo que la opcin de formato "Conservar los Colores del Fondo". En otras palabras, puede recrear los colores del texto y el color de fondo de cada celda. R RR RRECONOCIMIENT ECONOCIMIENT ECONOCIMIENT ECONOCIMIENT ECONOCIMIENTO OO OO DE DE DE DE DE TEXT TEXT TEXT TEXT TEXTOS OS OS OS OS ESCRIT ESCRIT ESCRIT ESCRIT ESCRITOS OS OS OS OS A AA AA MANO MANO MANO MANO MANO Hasta ahora hemos reconocido documentos escaneados, tablas, faxes, instantneas tomadas con una cmara digital, hemos guardado grficos y hemos chapter2.pmd 3/04/2006, 15:47 128 2 - 129 MANUAL DEL USUARIO convertido documentos PDF. Sin embargo, Readiris tiene an otra funcionalidad: el reconocimiento de textos escritos a mano. En realidad, deberamos hablar de textos manuscritos y no escritos a mano. El trmino escritura a mano se utiliza para describir un texto continuo escrito a mano, en cursiva. Los smbolos que forman una palabra o una cadena de caracteres se tocan, por lo que es imposible saber dnde termina un smbolo y dnde empieza otro. En los manuscritos, las letras de palo seco (block let- ters) estn separadas entre ellas, por lo que el programa de reconocimiento puede aislar ms fcilmente los caracteres individuales. Es necesario utilizar software muy especializado - software de ICR (Intel- ligent Character Recognition, reconocimiento inteligente de caracteres) - para reconocer los smbolos manuscritos. Esta potente tecnologa de ICR de I.R.I.S. se basa en ms de un milln de muestras de escritura! Readiris es compatible con todos los estilos de escritura naturales, ya sean americanos o europeos. No requiere ningn estilo impuesto. El reconocimiento de textos manuscritos se limita a los numerales (0-9), las maysculas (A-Z) y los signos de puntuacin , (coma), . (punto) y - (guin). Significa esto que slo puede tomar notas en ingls? No, tambin puede escribir notas en espaol, francs, alemn, italiano, etc. siempre que no escriba acentos ni diresis en los caracteres en mayscula. Por ejemplo, Readiris no reconocer TLCOPIE 4H, PNKTLICH IN STERREICH o PI QUALIT, pero s que reconocer TELECOPIE A 4H., PUENKTLICH IN OESTERREICH y PIU QUALITA. Aun as, no puede tomar notas en griego, ruso, etc.: slo se reconoce el alfabeto latino! Si los resultados obtenidos distan de ser ptimos puede utilizar el patrn de escritura optimizado de I.R.I.S. y adaptar su estilo de escritura. Consulte la ayuda en lnea de Readiris para descubrir las reglas de escritura. Escriba las maysculas chapter2.pmd 3/04/2006, 15:47 129 2 - 130 con claridad, con trazos regulares, de modo que su escritura manual se parezca lo mximo posible a los caracteres impresos. (Tenga especial cuidado al escribir las letras A, G y Q!) Unos pocos y sencillos consejos pueden ensearle por qu se producen las sustituciones y cmo evitarlas. El patrn de escritura en blanco de I.R.I.S. puede utilizarse como plantilla a pgina completa en la que escribir las letras de palo seco con un espaciado regular y con el tamao adecuado. Puede encontrar el patrn en blanco para reimprimir y editar en el CD-ROM de Readiris. chapter2.pmd 3/04/2006, 15:47 130 2 - 131 MANUAL DEL USUARIO Ahora ya sabemos cmo podemos tomar notas en una reunin de modo que despus las pueda leer nuestro ordenador. Qu dedemos hacer para poder reconocerlas despus con Readiris? Trace una ventana de manuscrito alrededor del texto manuscrito en cuestin y ejecute el reconocimiento. (Puede probarlo con la imagen de muestra HANDPRINTING.TIF.) chapter2.pmd 3/04/2006, 15:47 131 2 - 132 Las caractersticas del documento - idioma, tipo de fuente, ancho de los caracteres - no se tienen en cuenta en los textos manuscritos. El usuario est limitado al juego de caracteres ingls - o, mejor dicho, latino! - bsico de letras (maysculas) de palo seco. Tampoco se utiliza el aprendizaje interactivo: el aprendizaje no tiene demasiado sentido en un contexto en el que todo el mundo tiene su propio estilo de escribir. (Tal como hemos indicado anteriormente, la tecnologa de ICR de I.R.I.S. se basa en ms de un milln de muestras de escritura...) chapter2.pmd 3/04/2006, 15:47 132 2 - 133 MANUAL DEL USUARIO L LL LLECTURA ECTURA ECTURA ECTURA ECTURA DE DE DE DE DE BARRAS BARRAS BARRAS BARRAS BARRAS Y YY YY ESP ESP ESP ESP ESPACIOS ACIOS ACIOS ACIOS ACIOS Y es que Readiris tambin lee cdigos de barras! Los cdigos de barras que aparecen en las imgenes escaneadas se pueden leer e incluir como datos reconocidos en el interior de los documentos generados. chapter2.pmd 3/04/2006, 15:47 133 2 - 134 Los cdigos de barras estn formados por barras paralelas con espacios entre ellas. Combinaciones predefinidas de barras y espacios representan caracteres especficos. Hay varios estndares o simbologas de cdigos de barras. Readiris es compatible con todas las simbologas de cdigos de barras ms utilizadas.
Slo tienen suficiente calidad los cdigos de barras imprimidos con impresoras lser o de inyeccin de tinta. Excluya los cdigos de barras imprimidos con impresoras matriciales: no tienen suficiente contraste y su resolucin acostumbra a ser como mximo de 60 ppp. Readiris reconoce mejor los cdigos de barras con un buen contraste; las barras negras sobre un fondo blanco dan los mejores resultados. La mayora de tipos de cdigos de barras requieren una zona tranquila alrededor del cdigo. Los cdigos de barras no dan nunca resultados parciales: la falta de una barra, la falta de un carcter de inicio o de final o un dgito de control incorrecto siempre dar un error de lectura, un resultado nulo. Trace una ventana de cdigo de barras alrededor de los cdigos de barras - el anlisis de pgina no los detecta - y ejecute el reconocimiento. Readiris leer los cdigos de barras y los incluir en el texto resultante. Tambin puede hacer clic con el botn derecho del ratn sobre una zona de cdigo de barras y seleccionar el mando "Copiar como Datos" del men contextual; Readiris leer el cdigo de barras y lo enviar al portapapeles... (Los caracteres de control de algunos estndares se verifican pero no se incluyen en el resultado de la lectura.) La imagen de muestra BARCODE.TIF puede servirle para hacerse una idea ms clara de esta funcin. chapter2.pmd 3/04/2006, 15:47 134 2 - 135 MANUAL DEL USUARIO
La opcin "Cdigos de Barras" del men "Configuracin" determina qu tipos de cdigo de barras - el trmino exacto es simbologas - se reconocern y si los caracteres de control de algunos cdigos de barras se verificarn y eliminarn de los resultados del reconocimiento. Utilice el botn "Por Defecto" para restablecer la configuracin por defecto. chapter2.pmd 3/04/2006, 15:48 135 2 - 136 C CC CCMO MO MO MO MO OBTENER OBTENER OBTENER OBTENER OBTENER A AA AAYUDA YUDA YUDA YUDA YUDA EN EN EN EN EN LNEA LNEA LNEA LNEA LNEA Con esto concluimos nuestra sinopsis general de Readiris. Es posible que este manual no contenga informacin de ltimo minuto. Por ello le recomendamos que consulte el sistema de ayuda en lnea para ms informacin sobre Readiris. Para ello vaya el men "Ayuda". La opcin "Temas de Ayuda" y su macro, la tecla F1, le permiten navegar a travs de los numerosos temas de ayuda. chapter2.pmd 3/04/2006, 15:48 136 2 - 137 MANUAL DEL USUARIO El resto de opciones del men "Ayuda" le indican cmo obtener asistencia tcnica para el producto, cmo ponerse en contacto con I.R.I.S., cmo acceder directamente a la pgina web de I.R.I.S., etc. chapter2.pmd 3/04/2006, 15:48 137 2 - 138 chapter2.pmd 3/04/2006, 15:48 138