Professional Documents
Culture Documents
En general, un formato de archivo implicado en la localizacin se puede definir como el diseo y la organizacin de los datos de un archivo usado para la localizacin de componentes de software. Al usar herramientas de TAO y de software en un proyecto de localizacin, los formatos de archivo implicados en la localizacin se importan como achivos de origen al principio del proyecto. Con el fin de trabajar con los formatos de archivo de localizacin para localizar componentes de software, primero es necesario distinguir entre texto traducible y no traducible contenido en los archivos. Para ello, es importante considerar que segn qu componentes del software se deban localizar (interfaz de usuario, sitios web, archivo de ayuda o documentacin impresa), los formatos de archivo implicados en la localizacin pueden variar.
2. Tipos de formato de archivo implicados en la localizacin 2.1 Segn los componentes de software
Los componentes de software (el software y la documentacin) se crean usando distintas aplicaciones informticas basadas en distintos lenguajes de programacin. Como resultado, tienen formatos de archivo distintos. Por ejemplo, con las interfaces de usuario de software, los datos pueden comprender no slo texto (datos localizables), sino tambin cdigo de programa, cdigo fuente o cdigo de recursos, una secuencia de instrucciones escritas en un lenguaje de programacin legible por el ser humano. En el caso de la documentacin, como los sitios web y los archivos de ayuda, el texto traducibles puede estar enmarcado entre etiquetas de diseo. Algunos de los formatos posibles para los distintos componentes de software son: Software:
Archivos de programa: Archivos RC files y .exe procedentes de distintos entornos de programacin, como Borland Delphi, Java, XML, .NET, Visual Basic o archivos en formatos de metalocalizacin como .po, XLIFF, etc. Archivos grficos: .gif, .jpg, .tiff, .psd, .bmp, etc.
Documentacin:
Documentacin impresa: .fm, .indd, .doc, .rtf, etc. Archivos de ayuda: .chm, .hlp, .rtf, .html, etc. Pginas web: .xml, .html, .php, .js, .pl, etc.
Respecto a los datos, las diferencias entre los formatos de archivo de la localizacin para los componentes de software dependen de:
Qu datos se consideran relevantes para la localizacin Cmo se distinguen los datos relevantes para la localizacin de otros datos Cmo se almacenan los datos Cmo se usan los "transferibles" y las secuencias de escape
2.2 Segn el desarrollo de software 2.2.1 Archivos de cdigo fuente y archivos binarios Al desarrollar aplicaciones de software, hay ms tipos de formatos de archivo implicados en la localizacin: archivos de cdigo fuente y archivos binarios. Al escribir aplicaciones de software, los programadores usan conjuntos de archivos de cdigo fuente (que contienen cdigo de programacin, cdigo fuente y cdigo de recursos, que se compilan a continuacin para crear archivos de programa. Tanto los archivos de cdigo fuente como los binarios son tipos de formatos de archivo implicados en la localizacin que contienen texto traducible. Archivos de cdigo fuente: Estos archivos, tambin llamados archivos de cdigo de recursos (archivos RC), contienen componentes de la interfaz de usuario (como mens y cuadros de dilogo) y podran ser:
Basados en texto: En estos archivos de formato de texto sin formato, el texto traducible suele estar rodeado por cdigo del programa (como especificaciones de cuadros de dilogo, etc.), que no deben cambiarse durante la traduccin. Con el fin de traducir archivos de cdigo fuente que consisten en texto sin formato, pueden usarse editores de texto, herramientas de memorias de traduccin o una herramienta especficamente creada para la localizacin de software. Basados en HTML/XML: Estos archivos de cdigo fuente basados en HTML o XML pueden editarse o traducirse con un editor de cdigo fuente (herramienta de desarrollo de software utilizado para crear y editar archivos de cdigo fuente), un editor de texto o una herramienta de memorias de traduccin, usando un filtro que permita extraer texto traducible y proteger los elementos de cdigo, p.ej. en la mayora de los editores de los sistemas de MT y herramientas de localizacin.
Archivos binarios: Se trata de archivos ejecutables que contienen datos "codificados en formato binario (en secuencias de bytes) con fines de almacenamiento y procesamiento informticos" (trad. de Wikipedia, 2007). Los archivos binarios se utilizan en los programas de ordenador para "ejecutar" las instrucciones de programa contenidas en ellos. Esto quiere decir que son archivos de programa compilados, y, al contrario que los archivos de cdigo fuente, no pueden ser ledos por los seres humanos. Los archivos binarios slo pueden traducirse con herramientas de localizacin de software o de memorias de traduccin, que son capaces de extraer elementos localizables del cdigo binario. Son ejemplos de archivos binarios los ejecutables (p.ej. .exe, .dll), los grficos, los de audio y los comprimidos en formato .zip. 2.2.2 Diferencias estructurales
Respecto a su estructura, los archivos de cdigo fuente y los binarios tambin se distinguen por su:
Estructura externa: Hay diferentes posibilidades para identificar y editar la informacin localizable sin destruir/corromper el formato, p.ej. para extraer los 2
elementos localizables, de forma que el traductor no manipula el cdigo del programa Contexto, alcance, conceptos de programacin: La informacin contextual que falte, la informacin incompleta o las reglas a seguir por los archivos de destino en los archivos de cdigo fuente pueden ser distintos de los de los archivos binarios. Comunicacin interna: Los elementos como los transferibles, las secuencias de escape y las etiquetas pueden ser distintos en los archivos de cdigo fuente y los binarios.
2.2.3 Archivos de cdigo fuente o binarios implicados en la localizacin El uso de archivos de cdigo fuente o binarios en la localizacin tiene ventajas y desventajas que merece la pena mencionar: Archivos de cdigo fuente Ventajas:
No hace falta ningn editor en especial -- casi cualquier editor puede editar este tipo de archivos No hacen falta herramientas caras (de localizacin de software) (estos archivos pueden traducirse usando herramientas de localizacin de software o de memorias de traduccin). Despus de la traduccin, hay que compilar los archivos de cdigo fuente, y quizs enlazarlos entre s para formar una aplicacin completa creada para el aseguramiento de la calidad.
Desventajas:
No es fcil mantener la visin de conjunto al traducir este tipo de archivos. Si no se usan herramientas, los traductores tienen que buscar todas las cadenas de texto traducibles. Sin herramientas especficamente concebidas para ello, los traductores no pueden ver el aspecto de la interfaz traducida. Si no se usan herramientas especficamente creadas para ello, hay un alto riesgo de que el traductore sobreescriba partes del programa. La informacin contextual (en particular, la relativa a la estructura) puede perderse si se presenta al traductor en forma de lista texto traducible extrado de los archivos de cdigo, en particular si se hace en orden alfabtico. Sin herramientas especficamente pensadas para ello, puede ser difcil (o incluso imposible) reconstruir esta informacin contextual del archivo original.
Como la mayora de las herramientas de localizacin incluyen una opcin WYSIWYG, los traductores pueden ver inmediatamente el aspecto de su traduccin en la interfaz del software. Los archivos binarios contienen informacin contextual Es la mejor opcin para prevenir hacer cambios por error en los archivos de cdigo fuente en formato de texto (Esselink, 2000:59, Sachse, 2005:147).
Desventajas:
Hacen falta editores o herramientas especiales (como las herramientas de localizacin de software) para editar estos archivos.
3. Elementos localizables Aunque ya hemos dado una visin general de los tipos de formatos de archivo implicados en la localizacin que existen, ahora nos concentraremos en dichos formatos de archivo, concretamente en los elementos localizables contenidos en tales formatos. Los elementos localizables en los formatos de archivo implicados en la localizacin de software (archivos de cdigo fuente o archivos binarios) son los datos que forman la interfaz de usuario. Los siguientes son ejemplos de elementos de la interfaz de usuario que deben ser localizados:
Mens Cuadros de dilogo Teclas de acceso y atajos de teclado (teclas rpidas) Tablas de cadenas de caracteres Elementos grficos
3.1 Mens
Mens 4
Se trata de listas de opciones que se muestran en la pantalla (en forma de mens emergentes o desplegables) en los que los usuarios pueden tomar decisiones. Son:
Se trata de pequeas ventanas que se superponen al programa, en las que hay campos en los que el usuario puede introducir datos. Pueden contener pestaas, casillas de opciones, texto esttico, listas, etc.
3.3 Teclas de acceso y atajos de teclado Tambin llamadas teclas rpidas, las teclas de acceso son combinaciones de teclas que permiten al usuario acceder a funciones en mens y submens. Las teclas de acceso suelen ser fciles de recorder, al incluir normalmente la primera letra de la funcin correspondiente. Esta aparece subrayada en la lnea de mens, p.ej. la "S" en "Save" 5
("guardar"). Los atajos de teclado tambin son combinaciones de teclado usadas para acceder funciones en mens y submens. La combinacin de teclas es una abreviatura de la instruccin de la opcin de men. En nuestro ejemplo, se usa Ctrl+S como atajo de teclado de la instruccin Save ("guardar"). Cuando se localiza una aplicacin de software, no suelen cambiarse los atajos de teclado, especialmente porque a menudo son comunes a otras aplicaciones. Sin embargo, las teclas de acceso s que deben adaptarse a los nombres de las opciones respectivas en la lengua de destino.
Tablas de cadenas de caracteres Se trata de secuencias de smbolos, normalmente ordenadas en forma de tabla.
Mensajes del sistema Tooltips Texto de la barra de estado Opciones en los campos de listas Valores de las variables en los mensajes del sistema
Mapas de bits: Es el tipo de formato que suelen tener los grficos en una interfaz de usuario. Los cursores y los iconos, por ejemplo, pueden estar en este formato. Las imgenes de mapas de bits tienen que localizarse, y esto puede hacerse con un editor grfico convencional, como Adobe Photoshop o JASC Paint Shop Pro. Iconos: Se trata de pequeas imgenes en la pantalla del ordenador que representan objetos o funciones para que las vea el usuario. Su finalidad es hacer el uso de los ordenadores ms fcil, y son una de las caractersticas de los sistemas basados en interfaces grficas de usuario. Cursores: Un cursor es el smbolo en la pantalla del ordenador que indica la posicin de la entrada actual o el lugar en el que aparecer el prximo carcter.
En la seccin siguiente, se describen tres tipos de formatos de archivo propios de la localizacin, de acuerdo con sus caractersticas tcnicas y los retos que suponen en el proceso de localizacin de software. Cubriremos:
Archivos RC
Definicin Los archivos RC (archivos de Resource Script) son archivos de cdigo fuente estndar en Windows. Normalmente, las aplicaciones de Windows se construyen de tal forma que un compilador de recursos crea un archivo de recursos binario (.res), enlazando un archivo de recursos ASCII (.rc) con un archivo compilado o ejecutable. Caractersticas Los archivos RC normalmente estn escritos en ASCII y por lneas, porque contienen lneas que terminan en un carcter de lnea nueva (que indica el final de una lnea de texto) o par de retorno de carro.
Entorno de desarrollo
Los archivos RC se usan en las aplicaciones Windows, que, a su vez, suelen haber sido desarrolladas en entornos de programacin orientados a objetos como Visual C++, Visual Basic o un entorno de desarrollo basado en web como Java.
Retos Los archivos RC contienen informacin localizable que normalmente procede de cuadros de dilogo, mens y tablas de cadenas de caracteres. Ahora examinaremos una serie de caractersticas de los archivos RC que plantean un reto a la localizacin. Elementos localizables Entre los elementos que pueden encontrarse en los archivos RC que pueden o deben ser localizados, estn el texto, los botones, las cuestiones de tamao, las fuentes y el tamao de las mismas. 9
Ejemplo de elementos que pueden o deben ser localizados en los archivos RC: texto y botones (en rojo), cuestiones de tamao, fuentes y el tamao de las mismas (en azul)
Identificadores Los identificadores o IDs son marcas usadas para distinguir elementos del programa especficos en todo el paquete de software. Los identificadores permiten realizar "conexiones" entre el cdigo del programa y los recursos. Aunque los identificadores se usan muy frecuentemente en los archivos RC, su uso no es muy intuitivo. Realizar cambios en el formato de origen sin el asesoramiento tcnico adecuado puede llegar a errores. Por tanto, los identificadores no debern cambiarse durante la localizacin.
10
11
Transferibles
Los transferibles se utilizan, por ejemplo, cuando hay que generar un mensaje en pantalla de forma dinmica durante la ejecucin. Un ejemplo puede ser el siguiente mensaje: "El documento %s contiene %d palabras", en el que, durante la ejecucin del programa, se inserta el nombre del documento en lugar de %s y el nmero de palabras en lugar de %d. Los transferibles representan los parmetros o valores actuales que hay que insertar. En particular, los caracteres "%s" son transferibles sensibles a la ubicacin, utilizados en C y C++. Esto significa que tambin "%" necesita una secuencia de escape, por ejemplo: "%%" en la cadena "%d %%" donde %d es el nmero porcentual (p.ej. 50) y %% representa el carcter "%" en un mensaje como "50 %".
Uno de los retos al localizar tablas de caracteres en archivos RC es que la localizacin se realiza sin informacin contextual. Las nicas pistas son los identificadores (IDs), que no deben modificarse. Para reducir este problema, se pueden insertar comentarios para los traductores o localizadores en las tablas de cadenas.
Espacio Respecto al espacio en la interfaz de usuario de un programa, podra suponer un gasto de tiempo enorme ajustarlo en los archivos RC si no se dispone de una herramienta de localizacin de software. Muy a menudo, los traductores/localizadores tienen que ajustar manualmente el tamao del texto traducido que aparece en botones y cuadros de
12
dilogo usando un editor grfico. Las herramientas de localizacin de software permiten acelerar este proceso.
Al localizar las interfaces de usuario a idiomas como el ruso, el griego o el chino, el texto traducido no se muestra siempre en la pantalla en la manera que debera. Esto a menudo tiene que ver con los juegos de caracteres y fuentes utilizados. Los recursos binarios siempre se guardan en formato UNICODE. Sin embargo, los programas pueden estar escritos tanto en UNICODE como en una pgina de cdigo concreta, porque, dependiendo del sistema operativo, las aplicaciones podran no funcionar, p.ej. en MS Windows 9x/ME slo funcionan las aplicaciones basadas en una pgina de cdigo determinada. Si los juegos de caracteres y las fuentes no se muestran correctamente en la pantalla, esto no significa necesariamente que haya errores de localizacin. Siempre es buena idea probar el software en un sistema operativo localizado. Finalmente, para simplificar el flujo de trabajo, los localizadores deberan intentar usar las fuentes predeterminadas.
Archivos HTML
Se trata de archivos de texto escritos en HTML (HyperText Markup Language), un lenguaje de formateado por etiquetas (un lenguaje de marcado) que tiene finalidades especficas y usa un conjunto de etiquetas predefinidas. En su origen, HTML fue desarrollado a partir de SGML (Standard Generalized Markup Language). El trmino hypertext en HyperText Markup Language se refiere al mtodo de organizar texto o contenidos, de forma que ciertos elementos estn vinculados a otros, como sitios web, formularios interactivos, imgenes incrustadas y otros objetos (hipervnculos). Por tanto, el contenido no slo puede leerse de forma lineal, sino tambin navegando por 13
diversos documentos y sitios yendo de un hipervnculo a otro. El trmino marcado se refiere al proceso de aadir informacin estructural y de formateado al texto mediante etiquetas predefinidas. Por ejemplo, estas etiquetas permiten la descripcin de elementos estructurales en las pginas web como encabezados, tablas, grficos, hipervnculos, etc. Las etiquetas HTML se usan para el formateado, indicando al navegador web cmo mostrar el texto o contenido. (cf. Zerfa, 2005).
Entorno de desarrollo HTML es el lenguaje de marcado ms extendido para la creacin de pginas web. Hoy en da, cuatro millones de pginas web activas estn escritas en HTML, y este formato es comnmente aceptado como formato estndar para escribir pginas web. En el mbito de la localizacin de software, el HTML se ha convertido en el formato de archivo estndar para las pginas web y los archivos de ayuda. Al localizar, los formatos de archivo en HTML suelen ser traducidos con una memoria de traduccin o una herramienta de localizacin de software. Para editar archivos HTML sin usar herramientas, debera usarse un editor apropiado, preferiblemente el mismo que se us para crear los archivos originales (cf. Esselink 2000:175).
Caractersticas Los formatos de archivo HTML consisten en etiquetas, encerradas por signos de "menor que" (<) y "mayor que" (>). Todos los archivos HTML comienzan con una etiqueta de apertura, <HTML>, y una de cierre, </HTML>. Estas etiquetas permiten la definicin de la estructura del contenido, del diseo de pgina, del formato del texto, de la insercin de imgenes, etc. Etiquetas externas frente a internas En el formato de archivo HTML hay dos tipos de etiquetas: internas y externas. Las etiquetas internas estn dentro de los segmentos traducibles (p.ej. en frases). Un ejemplo de etiquetas internas son las de apertura <b> y cierre </b> de texto en negrita. Las etiquetas externas se encuentran fuera de los segmentos traducibles, y permiten el marcado del contenido y el formateado de los prrafos (cf. Esselink, 2000:2007). Es importante para los 14
traductores/localizadores distinguir entre ambos tipos de etiquetas, ya que puede que hay que modificar las internas al traducir, mientras que las externas deben mantenerse tal cual. DTD En los formatos de archivo HTML, todas las etiquetas estn predefinidas. Esto significa que hay un nmero concreto de etiquetas que pueden usarse en un documento dado. La especificacin de las etiquetas que se pueden usar est contenida en la definicin de tipo de documento (DTD), en la que tambin se especifican las reglas que debe seguir la estructura del documento (cf. Esselink, 2000:2007). Los documentos HTML tambin incluyen una declaracin que especifica la versin de HTML y el tipo de documento. En la declaracin, un documento HTML dado se "declara" vlido de acuerdo con la DTD de HTML. Casi todas las ediciones actuales de herramientas de MT incluyen un archivo de ajustes para archivos HTML (p.ej. el archivo HTML4.ini de SDL TRADOS), que contiene reglas de segmentacin predefinidas. Validacin Con el fin de validar la conformidad de los documentos HTML con la norma, hay varias herramientas en Internet (analizadores sintcticos o "parsers") que comprueban la sintaxis del documento respecto a la DTD. Los documentos deberan validarse tras la localizacin, para verificar que todos los enlaces internos y externos funcionan y que no hay etiquetas corruptas. Algunos ejemplos de herramientas de validacin en lnea son www.htmlvalidator.com y www.linkbot.com (cf. Esselink, 2000:268). Ejemplos de DTD
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<?xml version="1.0" encoding="utf-8"?> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <!-- the XHTML document body starts here--> <html> ... </html>
Entidades: Las entidades HTML son cadenas de caracteres especficos que pueden tener funciones especiales. Por ejemplo, pueden utilizarse como "secuencias de escape" para representar caracteres extendidos que no estn en el juego de caracteres estndar ASCII. El carcter que las introduce indica que los caracteres que siguen hay que interpretarlos de forma alternativa. Algunos ejemplos de caracteres extendidos y las secuencias de escape correspondientes son:
15
La entidad HTML utilizada para transcribir umlauts alemanes como "" es ä El carcter alemn "" se transcribe ß El carcter alemn "" se transcribe ç
Otros caracteres, como '&', '<' y '>' son parte de la sintaxis HTML. Cuando se desea utilizar estos caracteres de otra forma, por ejemplo, como parte del texto, hay que utilizar el mismo sistema. Por ejemplo:
"Ampersand" ('&') se transcribe & "Menor que" '<' se transcribe < "Mayor que" '>' se transcribe >
Ejemplo de caracteres extendidos alemanes con las correspondientes "secuencias de escape" en HTML Retos
Los archivos HTML contienen cdigo de programa, texto e informacin metatextual (formateado etc.) Distinguir estos elementos unos de otros plantea un autntico reto a la localizacin. En general, los retos al localizar HTML estn relacionados con los mismos elementos sintticos de HTML mencionados en la seccin anterior. Por ejemplo, en un documento HTML es posible encontrar documentos hipertextuales; texto, grficos, archivos de sonido y vdeo; hojas de estilo, formularios, diseos y scripts que tienen que ser localizados o actualizados segn cul sea el mercado de destino. Algunas de estas particularidades de los documentos HTML que pueden suponer un reto para los traductores o localizadores son: Formularios: En HTML puede haber formularios, reas de entrada de texto o listas de opciones. En este caso, el reto para los traductores y localizadores supone distinguir el texto de los formularios que debe ser traducido. El siguiente grfico muestra la representacin en HTML de un formulario con reas de entrada de texto y listas para seleccionar opciones:
16
Formularios
Formato: En HTML, formatear se refiere a las especificaciones que definen cmo el texto va a aparecer. Por ejemplo, el tamao, la familia y el color de la fuente, las indicaciones sobre tamaos y listas son elementos de formateado en HTML. Para los traductores y localizadores, es importante distinguir elementos de formateado, con el fin de modificarlas o adaptarlas segn los requisitos del mercado de destino.
Elementos de formateado como la familia, el tamao, el color y el tamao de la fuente en el texto HTML Scripts incrustados: Los scripts son "instrucciones para otros ordenadores", dicho de otra manera: lenguajes de programacin que pueden ser interpretados por un ordenador e introducidos por un ser humano usando un teclado. Un script muy extendido en la creacin de websites es el JavaScript. Este tipo de script suele estar incrustado y permite el acceso a los objetos de otras aplicaciones. Uno de los retos que plantean los scripts incrustados a los traductores/localizadores es distinguir el subconjunto de datos incrustados: los lugares en los que los datos incrustados comienzan y terminarn, y dnde se encuentra el texto traducible. Por ejemplo, dada la siguiente aplicacin JavaScript y su correspondiente cdigo fuente:
17
Alerta en JavaScript
Cdigo fuente en JavaScript El script incrustado contiene, obviamente, informacin traducible (en verde).
Archivos XML
Definicin Se trata de archivos escritos en XML (eXtensible Markup Language). El XML es un lenguaje d emarcadao que combina texto e informacin relacionada. Una de sus finalidades principales es facilitar el intercambio de datos entre distintos sistemas de informacin, en particular a travs de Internet. Como el HTML, el XML fue desarrollado originalmente a partir de SGML (Standard Generalized Markup Language). Fue diseado para ser ms fcil de analizar sintcticamente y de procesar que el SGML, y se considera una simplificacin del SGML, destinado a aplicaciones de uso general, como el web. Entorno de desarrollo Hoy en da, el XML juega un papel creciente en la gestin de datos, al ser "una de las formas ms seguras, ms potentes y flexibles de almacenar, manipular, localizar y presentar datos en distintos idiomas" (Savourel, 2005). Es por ello que se ha convertido en un compnente importante en mbitos tales como la internacionalizacin y la 18
localizacin. En la localizacin, por ejemplo, se usa el XML a menudo, independientemente de si el proyecto de localizacin hay implicados componentes en XML o no. Los archivos XML pueden usarse como archivos de recurso para la localizacin, y casi todas las herramientas de localizacin de software trabajan con formatos XML.
Al localizar, los formatos de archivo en XML suelen ser traducidos con una memoria de traduccin o una herramienta de localizacin de software. Para editar formatos de archivo XML sin herramienta, deber usarse un editor adecuado. Aunque los mbitos de uso del XML ms comunes son la documentacin y los sitios web, tambin puede encontrarse XML en las interfaces de usuario, las capas de transferencia de datos, los mecanismos de exportacin/importacin de bases de datos y los grficos. Tambin se usa el XML como formato de intercambio, p.ej. entre distintas aplicaciones como bases de datos, procesadores de textos, hojas de clculo, etc. Caractersticas El XML permite la representacin estructurada de contenidos y relaciones, separando contenido y forma.
19
Ejemplo de visin de la estructura de un documento XML Como en HTML, la estructura XML consiste en etiquetas (encerradas entre signos < >) y texto. Cada elemento XML viene marcado por una etiqueta de apertura y otra de cierre, y puede contener texto u otros elementos. Las etiquetas tienen nombres de atributos y pueden contener adems atributos, que, a su vez, estn compuestos de nombres de atributo y valores, pudindose definir ambos libremente. En un documento XML bien escrito, las etiquetas no se solapan, y todas las etiquetas estn cerradas. Al contrario que ocurre en HTML, en que los nombres de todas las etiquetas estn predefinidos, en XML se pueden definir etiquetas a placer. UNICODE Una de las razones que hacen que XML est tan extendido en la industria de la localizacin y la internacionalizacin es que el juego de caracteres Unicode de los documentos XML puede incluir caracterers en la mayora de las lenguas utilizadas hoy en da (cf. Savourel, 2005). Entidades Como en HTML, en XML algunos de los caracteres que corresponden a la sintaxis XML tienen que ser representados con "secuencias de escape", es decir, ser sustituidos por entidades. Por ejemplo, el signo "menor que" "<" debe representarse "<" y el de "mayor que" ">" con ">". Los caracteres extendidos pueden ser tratados de la misma forma en XML. De esta forma, los documentos XML pueden contener caracteres de cualquier tipo, aun cuando la codificacin del documento no sea compatible con ellos. Como ejemplo, la letra griega Omega () puede sustituirse por Ω o Ω, si el documento usa una codificacin incompatible con el alfabeto griego (cf. Savourel, 2005). DTD Como en el caso de los archivos HTML, los archivos XML tambin tienen una definicin del tipo de documento (DTD) que contiene informacin sobre las funciones y las interdependencias jerrquicas de las etiquetas, la estructura, etc. Sin embargo, en 20
contraste con lo que ocurre con las etiquetas HTML, las de XML no estn predefinidas. Por tanto, la DTD describe el archivo XML mediante restricciones de la estructura. Contiene las etiquetas y los atributos permitidos en el documento XML y describe algunas construcciones que no son imprescindibles para establecer la estructura, pero que pueden afectar la interpretacin de algunos documentos. Cuando la estructura de un documento XML se corresponde con el esquema DTD definido previamente, el documento XML se considera "vlido".
Retos Los retos que plantea la localizacin de archivos XML estn relacionados con la complejidad natural de los archivos XML. DTD: Para los localizadores y los traductores, puede ser difcil obtener el archivo DTD de los clientes. Algunas de las versiones de los sistemas de memorias de traduccin (p.ej. en el caso de SLD TRADOS, todas las versiones anteriores a SDL TRADOS 7) necesitan, para traducir archivos XML, el archivo que contiene la DTD, para poder crear el archivo de configuracin (en TRADOS, el archivo *.ini), que especifica las reglas de segmentacin que se utilizar en el documento XML en particular. De otro modo, hay que crear el archivo de configuracin haciendo una lista de las etiquetas y sus funciones manualmente.Algunas versiones recientes de herramientas de memorias de traduccin o localizacin no necesitan forzosamente el archivo DTD, pero tienen sus propios mecanismos para analizar y extraer las etiquetas XML del documento XML, creando as el archivo de configuracin de manera semiautomtica (el usuario an puede hacer ajustes). Estructura cambiante: A menudo, la localizacin de archivos en XML puede ser muy compleja, porque las estructuras cambian, y puede ser difcil determinar qu elementos son localizables.
Distintas estructuras para los mismos datos en XML Hay distintas posibilidades de estructurar XML como formato de recursos. En estos dos ejemplos, la misma informacin se presenta con dos estructuras distintas. Por ejemplo, en el primero, todos los valores de los identificadores y los datos traducibles estn incrustados directamente entre la etiqueta de apertura y la de cierre correspondiente. En el segundo, los valores de los identificadores estn incrustados en la subentidad XML, y los datos traducibles en la subentidad XML, ambas subordinadas a la entidad.
21
Situacin 1
Situacin 2
Situacin 3
HTML consiste en un catlogo fijo de etiquetas y slo describr documentos de un tipo en concreto Los datos en HTML son difciles de procesar para los navegadores Los documentos HTML utilizados como aplicaciones acaban creando cuellos de botella aumentando el trfico entre cliente y servidor
Sin embargo, no es realista pensar que el HTML se convertir en relevante de pronto, especialmente si se tiene en cuenta el nmero de pginas tiles en activo que hay en Internet hoy en da. Hay algunas propuestas para conservar el HTML y encontrar una forma de integrarlo con el XML. La idea es apoyar la inclusin y el proceso de datos en XML, bien delimitados y definidos, en documentos HTML. Esta estrategia permitir:
que el contenido suministrado al web se enriquezca y apoyar futuras mejoras en los modelos de contenido basados en XML que los desarrolladores de contenido puedan confiar en las capacidades probadas y conocidas de HTML mientras experimentan con XML en sus entornos
Los formatos de metalocalizacin fueron diseados especialmente para ayudar en el proceso de localizacin. Son formatos de recursos que pueden contener informacin sobre diversos formatos de recursos, as como informacin adicional. Algunas de las razones de mezclar formatos de recursos son:
23
Uso paralelo de distintos entornos de desarrollo, por ejemplo, recursos en diferentes formatos de recurso (p.ej. el caso del formato de archivo .po) Minimizacin del nmero de formatos de localizacin en el flujo de trabajo, por lo que se usan metaformatos (p.ej. XLIFF)
Definicin XLIFF (XML Localization Interchange File Format) es un formato estndar basado en XML diseado para guardar texto extrado de archivos similares al software y documentos con etiquetas. XLIFF fue desarrollado a finales de 2000 por un grupo de compaas, entre las cuales estaban Oracle, Novell, Sun e IBM/Lotus, con el objetivo de definir una especificacin extensible para el intercambio de informacin de localizacin. Como los formatos de localizacin pueden variar en su estructura, el uso de juegos de caracteres, las marcas sustitutivas, las secuencias de escape, el formateado, etc., se cre XLIFF para unificarlas todas en un solo formato, independientemente de herramientas de localizacin especficas.
El contenido se describe en forma de esquema, atendiendo a los elementos, sus atributos y su uso. El grfico siguiente muestra un ejemplo de un esquema XLIFF:
24
Esquema XLIFF
El elemento ms importante en la estructura XLIFF es la <trans-unit>, que contiene los datos localizables en <source> y la traduccin en <target>. XLIFF sigue un enfoque bilinge, porque se prev un elemento especfico para la traduccin <target>, y no hace falta sobreescribir el texto en <source>.
Traducciones alternativas. En nuestro ejemplo, los trmions en alemn Extras y Optionen equivalen al ingls Options.
26
Leyendas 27
Flujos de trabajo Flujo de trabajo tpico en la localizacin sin XLIFF En un flujo de localizacin tpico sin XLIFF, habiendo aplicaciones del desarrollador en varios archivos, cada uno en un formato distinto, la localizacin puede resultar compleja. Con el fin de preparar todos estos archivos para la localizacin, los gestores de proyecto o localizadores tendrn que usar los filtros de recurso de la herramienta para convertir los archivos a un formato apropiado, de forma que los archivos puedan ser editados y traducidos por traductores usando la herramienta especificada por el cliente (si la indica).
Flujo de trabajo tpico en la localizacin sin XLIFF (Fuente: OASIS) Flujo de trabajo en la localizacin con XLIFF En un flujo de trabajo tpico en la localizacin con XLIFF, el proceso de localizacin se simplifica, porque hay menos pasos en el proceso de localizacin. Por una parte, las aplicaciones del desarrollador que se van a localizar podran estar disponibles en el formato XLIFF. En este caso, no hace falta pre-proceso, y los recursos traducibles pueden editarse directamente y ser traducidos utilizando un editor compatible con XLIFF o las herramientas apropiadas de memoria de traduccin o localizacin. Si, por otra parte, las aplicaciones del desarrollador que se van a localizar son proporcionadas en un formato distinto a XLIFF los archivos (p.ej. HTML, RC, Java, etc.) deben ser preprocesados y convertidos al formato XLIFF. Una vez que estn en XLIFF, los recursos traducibles pueden editarse directamente y ser traducidos utilizando un editor compatible con XLIFF o las herramientas apropiadas de memoria de traduccin o localizacin. (Grficos tomados de Oasis) 28
Hoy en da, las herramientas de localizacin de software han ampliado la cantidad de formatos de archivo con los que son compatibles. Son compatibles con formatos tales como:
Archivos binarios de recursos estndar de Windows (de 16 y 32 bits) (archivos EXE, DLL, SYS) y RC) Archivos binarios de Microsoft Visual Basic 6 Archivos XML, incluido XLIFF HTML Archivos de Microsoft Installer (MSI) Archivos de texto monolinges
Algunas herramientas son compatibles con otros formatos de archivo, a travs de addins. Se trata de pequeos programas escritos para extender ciertas caractersticas a las herramientas de localizacin de software. Algunos add-ins opcionales para otros formatos de archivo son:
Archivos binarios de recursos de Microsoft .NET (EXE, DLLs satlite y ensamblados), archivos de recursos (RESX y RESOURCE), compatibilidad con cuadros de dilogo heredados (WYSIWYG), compatibilidad con controles y propiedades personalizados, compatibilidad de todos los marcos .NET Archivos binarios de recursos de Borland Delphi / C++ Builder (EXE, DLL, BPL)
29
Java (todas las plataformas: Archivos J2EE, J2SE y J2ME), archivos de propiedades (PROPERTIES), archivos de cdigo fuente (JAVA), archivos binarios (CLASS), archivos de proyecto Java (JAR)
Analizador sintctico de bases de datos ODBC o MS Access, MS Excel o MS SQL Server o Oracle o IBM DB2 Palm OS Parser .Analizador sintctico po
30
Introduccin.
HTML significa HyperText Markup Language. Es el lenguaje en que se escriben los millones de documentos que hoy existen en el World Wide Web. Cuando accedemos a uno de estos documentos, el cliente (Netscape, IE, Mosaic, Lynx, IBrowse) los interpreta y los despliega. Existen clientes grficos como Netscape, y otros como el Lynx que solo despliegan texto. Es muy importante no olvidar esto cuando se disea una pgina web. Crear una buena pgina tiene dos aspectos; por un lado el conocimiento tcnico para crear cdigo HTML correcto, por otro lado el claro diseo para presentar la informacin. El objetivo de este texto es proporcionar un conocimiento bsico acerca de la construccin y manejo de etiquetado para la ingeniera aplicada a la traduccin de pginas Web y dispositivos mviles, para un conocimiento ms profundo de este lenguaje posteriormente se desarrollarn ms versiones de este texto, por el momento esperamos que la informacin aqu proporcionada le sea de utilidad.
Etiquetas de muestra Los archivos con etiquetas son archivos en los que la disposicin o la estructura de la informacin aparece separada del texto o del contenido y almacenada en cdigos que rodean a los elementos de texto. Por ejemplo, las pginas web estn codificadas por medio de un sistema de etiquetas llamado HTML (HyperText Markup Language).
Este ejemplo muestra parte de un documento HTML con etiquetas que rodean a los elementos de texto. Las etiquetas contienen informacin estructural que identifica distintas partes del documento web (p.ej. el ttulo o los encabezamientos). Al traducir documentos como este, el traductor tiene que tener cuidado de no cambiar, sobreescribir
31
o eliminar estas etiquetas, porque los navegadores de Internet las necesitan para mostrar el documento web correctamente. Etiquetas de proteccin A travs de un proceso de traduccin mediante sistemas de MT, es una tarea importante del editor ser capaz de proteger todas las etiquetas para que no puedan ser eliminadas o modificadas por el(/los) traductor(es). Algunos sistemas lo hacen escondiendo totalmente las etiquetas en el editor, y proporcionando una vista previa del documento web en la lengua de destino, como se muestra en la captura de pantalla del programa across.
Etiquetas como marcas sustitutivas En otros sistemas, sin embargo, las etiquetas son reemplazadas por marcas sustitutivas en el editor. En DjVu, por ejemplo, se representan como nmeros entre corchetes (llamados "cdigos incrustados"), lo que significa que hay alguna etiqueta en el 32
documento original. El usuario puede elegir cmo desea que se muestre el significado de estos cdigos incrustados. Segn el sistema utilizado, el traductor puede mostrar todas las etiquetas e incluso modificarlas, aunque no fuera recomendable. En un sistema como DjVu, es imposible exportar el proyecto sin que todos los cdigos sean insertados en los segmentos correspondientes. En tales casos, el sistema alertar al usuario y mostrar el segmento exacto en el que falta un cdigo. El usuario tendr que volver e insertar los cdigos que faltan para poder realizar la exportacin.
Etiquetas en Trados En el TagEditor de Trados, las etiquetas se muestran bien en forma abreviada o completa, y pueden ser desplazadas, editadas o eliminadas durante la traduccin. Si es necesario, el traductor tambin puede aadir una etiqueta. Es importante saber que hay etiquetas externas e internas:
Las etiquetas externas tienen, de forma predeterminada, un borde negro; por ejemplo la etiqueta HTML Normalmente representan informacin estructural. Estas etiquetas se ignoran completamente junto con su contenido durante el proceso de traduccin y slo pueden aparecer fuera de las frases. Rara vez es necesario mover o borrar las etiquetas externas durante la traduccin. Las etiquetas internas presentan un borde rojo, de forma predeterminada; por ejemplo la etiqueta B. Estas etiquetas pueden representar informacin acerca del 33
formato (como el formato de fuente negrita), rodear hipervnculos u otras marcas, y pueden aparecer dentro del texto. La mayora de las etiquetas internas se pueden desplazar dentro de la frase para ajustarse a la traduccin. Dependiendo del formato de archivo, se pueden aadir o borrar etiquetas internas, si es necesario. De forma predeterminadad, el TagEditor considera las etiquetas desconocidas como internas. Cuando las etiquetas contienen texto que no sea informacin acerca de la estructura o el formato, TagEditor clasifica el contenido del texto bien como traducible o bien como no traducible.
Convertir formatos de archivos con etiquetas Con el fin de importar/convertir algunos formatos de archivo con etiquetas como HTML, o archivos con etiquetas creados por filtros de importacin desde formatos de autoedicin como FrameMaker, InDesign etc., las herramientas de MT suelen ser capaces de reconocer las etiquetas utilizadas en estos formatos. Sin embargo, para los archivos cuyo formato incluye etiquetas definibles por e autor del texto en la lengua de origen, p.ej. XML, el traductor tiene que configurar filtros l mismo, bien a partir de una Definicin de Tipo de Documento (DTD) provista por el cliente, o analizando los archivos y determinando la funcin de las etiquetas, p.ej. si se usan para delimitar segmentos o para hacer que ciertos elementos del texto no sean traducibles.
34
35
Mapa de los lenguajes de marcas Principales GML --> SGML --> XML --> Dialectos XML
Lenguajes ligeros
Tecnologas de internet World Wide Web HTML XHTML Wireless ML Handhelp ML RDF Meta Content Framework Interfaz de usuario GladeXML MXML (Macromedia) User Interface ML XAML and MyXaml XForms XUL / XBL Sindicacin
Servicios web
Lenguajes especializados
Grficos 2D: SVG, CGM, VML, InkML. Grficos 3D: VRML/X3D, STEP. Matemtica: MathML y OpenMath. Msica: LilyPond y MusicXML. Taxonoma: DITA Finanzas: eXtensible Bussiness Reporting Language, Financial products ML. Geomtica: Geography ML. Aeronutica: Spacecraft ML. Multimedia: Synchronized Multimedia Integration Language. Voz: VoiceXML. Mensajera instantnea: XMPP. Videojuegos: BulletML, COLLADA.
36
Las letras de la etiqueta pueden estar en maysculas o minsculas, indiferentemente. Por claridad, se usarn en este texto slamente las maysculas. Lo que haya entre ambas etiquetas estar influenciada por ellas. Por ejemplo, todo el documento HTML debe estar entre las etiquetas <HTML> y </HTML>: <HTML> [Todo el documento] </HTML> El documento en s est dividido en dos zonas principales: El encabezamiento, comprendido entre las etiquetas <HEAD> y </HEAD> El cuerpo, comprendido entre las etiquetas <BODY> y </BODY>
Dentro del encabezamiento hay informacin del documento, que no se ve en la pantalla principal, principalmente el ttulo del documento, comprendido entre las etiquetas <TITLE> y </TITLE>. El ttulo debe ser breve y descriptivo de su contenido, pues ser lo que vean los dems cuando aadan nuestra pgina a su bookmark (o agenda de direcciones). Dentro del cuerpo est todo lo que queremos que aparezca en la pantalla principal (texto, imgenes, etc.) Por tanto, la estructura queda de esta manera:
<HTML> <HEAD> <TITLE> Ttulo de la pgina </TITLE> </HEAD> <BODY>
37
Antes de crear nuestra primera pgina, unas consideraciones sobre el texto: Cuando escribimos en el documento el texto que queremos que aparezca en la pantalla, veremos que ste se acomoda a ella, sin que tengamos que pulsar el retorno del carro. Si queremos separar el texto en distintos prrafos debemos usar la etiqueta <P>, (que no tiene su correspondiente etiqueta de cierre </P>) .
El texto puede tener unas cabeceras, comprendidas entre las etiquetas <H1> y </H1>, <H2> y </H2>, etc. (hasta el nmero 6), siendo el nmero indicativo del tamao. El tamao mayor es el correspondiente al nmero 1. Puedes experimentar en el ejemplo que sigue, cambiando el nmero para comprobar el efecto que se logra.
Una etiqueta muy interesante es la de centrado <CENTER> y </CENTER> (no la soportan todos los navegadores, aunque s la mayora de ellos). Nos centra todo lo que est dentro de ella, ya sea texto, imgenes, etc. Tambin tenemos los separadores (horizontal rules), que se consiguen con la etiqueta <HR> (no existe la correspondiente de cierre). Con ella se obtiene una raya horizontal tan ancha como la pantalla, y con la apariencia de estar embutida sobre el fondo, como se puede observar a continuacin: Prctica 1. En el procesador de texto copiamos lo siguiente:
<HTML> <HEAD> <TITLE> Mi pagina del Web - 1 </TITLE> </HEAD> <BODY> <H1> <CENTER> Primera pagina </CENTER> </H1> <HR>
38
Esta es mi primera pagina, aunque todavia es muy sencilla. Como el lenguaje HTML no es dificil, pronto estare en condiciones de hacer cosas mas interesantes. <P> Aqui va un segundo parrafo. </BODY> </HTML>
Guardamos el fichero en el procesador de textos con el nombre de mipag1.html y lo cargamos en el navegador. Este ser el resultado.
Si queremos obtener mltiples lneas en blanco no basta con repetir la etiqueta <P>, sino que hay que combinarla con la etiqueta <BR>. As por ejemplo, si queremos obtener cuatro lneas en blanco, pondramos: 39
Al escribir el texto, si ponemos ms de un espacio en blanco entre dos palabras observamos que el navegador slo reconoce uno de ellos. Si queremos forzarle a que lo haga, debemos poner el cdigo " " (non-breaking space). Para destacar alguna parte del texto se pueden usar:
<B> y </B> para poner algo en negrita (bold). <I> y </I> para poner algo en cursiva (italic).
Otra etiqueta interesante es <PRE> y </PRE>. El texto que se encuentre entre ella estar preformateado, es decir que aparecer como si hubiera sido escrito con una mquina de escribir, con una fuente de espaciado fijo (tipo Courier). Adems se respetarn los espacios en blanco y retornos del carro, tal como estaban en nuestro documento HTML (lo cual no ocurre normalmente, como hemos visto anteriormente). Es muy apropiada para confeccionar tablas y otros documentos similares. Con la etiqueta <TT> y </TT> conseguimos tambin que el texto tenga un tamao menor y la apariencia de los caracteres de una mquina de escribir (typewriter). La diferencia con la anterior es que no preformatea el texto, sino que nicamente cambia su apariencia. La etiqueta <BLOCKQUOTE> y </BLOCKQUOTE> se utiliza para destacar una cita textual dentro del texto general. En las frmulas matemticas puede interesar poder escribir ndices y subndices, que se consiguen con las etiquetas <SUP> </SUP> y <SUB> </SUB> respectivamente. As, por ejemplo: m2 se consigue de la siguiente manera: m<SUP>2</SUP> vx se consigue con: v<SUB>x</SUB> A menudo nos interesar presentar las cosas en forma de listas. Podemos escoger entre tres tipos distintos: 1.Listas desordenadas (no numeradas) 2.Listas ordenadas (numeradas) 3.Listas de definicin. Las listas desordenadas (unordered lists) sirven para presentar cosas que, por no tener un orden determinado, no necesitan ir precedidas por un nmero. Su estructura es la siguiente:
<UL> <LI> Una cosa <LI> Otra cosa
40
Es decir, toda la lista est dentro de la etiqueta <UL> y </UL>, y luego cada cosa va precedida de la etiqueta <LI> (list item). El resultado de lo anterior es el siguiente:
Se puede anidar una lista dentro de otra. Por ejemplo: <UL> <LI> Mamferos <LI> Peces <UL> <LI> Sardina <LI> Bacalao </UL> <LI> Aves </UL>
Las listas ordenadas (ordered lists) sirven para presentar cosas en un orden determinado. Su estructura es muy similar a la anterior. La diferencia estriba en que en el resultado aparecer automticamente un nmero correlativo para cada cosa. <OL> <LI> Primera cosa <LI> Segunda cosa <LI> Tercera cosa <LI> Etc. </OL>
Al igual que las listas desordenadas, tambin se pueden anidar las listas ordenadas. El tercer tipo lo forman las listas de definicin. Como su nombre indica, son apropiadas para glosarios (o definiciones de trminos). Toda la lista debe ir englobada 41
entre las etiquetas <DL> y </DL>. Y a diferencia de las dos que hemos visto, cada rengln de la lista tiene dos partes: 1. El nombre de la cosa a definir , que se consigue con la etiqueta <DT> (definition term) 2. La definicin de dicha cosa, que se consigue con la etiqueta <DD> (definition definition).
<DL> <DT> Una cosa a definir <DD> La definicin de esta cosa <DT> Otra cosa a definir <DD> La definicin de esta otra cosa </DL>
</B>
son
las
42
<LI> El deporte <UL> <LI> Natacion <LI> Baloncesto </UL> <LI> La musica </UL> La musica que mas me gusta es </I> <OL> <LI> El rock <LI> El jazz <LI> La musica clasica </OL> </BODY> </HTML>
Guardamos el fichero de texto con un nombre cualquiera y la extensin .html y lo cargamos en el navegador. Este es el resultado.
Tipos de enlaces
Vamos a distinguir cuatro tipos de enlaces: a) b) c) d) Enlaces dentro de la misma pgina Enlaces con otra pgina nuestra Enlaces con una pgina fuera de nuestro sistema Enlaces con una direccin de email
a) Enlaces dentro de la misma pgina A veces, en el caso de documentos (o pginas) muy extensos, nos puede interesar dar un salto desde una posicin a otra determinada. En este caso, lo que antes hemos llamado XXX, es decir, el destino del enlace, en este caso el sitio dentro de la pgina a donde queremos saltar, se sustituye por #marca (la palabra marca puede ser cualquier palabra que queramos). Lo que hemos llamado antes YYY es la palabra (o palabras) que aparecern en la pantalla en color (en forma de hipertexto). Su estructura es, entonces:
<A HREF="#marca"> YYY </A>
Por ejemplo, si quiero saltar desde aqu a la pantalla final, pongo la siguiente etiqueta:
<A HREF="#final"> Pulsa para ir al final</A>
b) Enlaces con otra pgina nuestra Puede ser que tengamos una sola pgina. Pero lo ms frecuente es que tengamos varias pginas, una inicial (o principal) y otras conectadas a ella, e incluso entre ellas mismas. Supongamos que queremos enlazar con la pgina creada en el ejemplo del epgrafe anterior, que la hemos llamado mipag2.html. En este caso, simplemente sustituimos lo que hemos llamado XXX (el destino del enlace) por el nombre del fichero:
44
Si queremos que vaya a un sitio concreto de otra pgina nuestra en vez de ir al principio de la pgina, adonde va por defecto, en ese sitio tenemos que colocar una marca (vase la seccin anterior), y completar el enlace con la referencia a esa marca. Una observacin importante: Estoy suponiendo que la pgina en la que estoy escribiendo esta etiqueta y la otra pgina a la que quiero saltar estn en el mismo directorio. Porque pudiera ocurrir que he organizado mi sitio del Web con un directorio principal, y otros subdirectorios auxiliares. Si la pgina a la que quiero saltar est, p. ej. en el subdirectorio subdir, entonces en la etiqueta tendra que haber puesto "subdir/mipag2.html". Y a la inversa, si quiero saltar desde una pgina a otra que est en un directorio anterior, en la etiqueta tendra que haber puesto "../mipag2.html". Esos dos puntos hace que se dirija al directorio anterior. Obsrvese que se debe utilizar el smbolo / para indicar los subdirectorios, y no este otro \, que es propio nicamente de Windows. Si nos queremos evitar todas estas complicaciones, podemos tener todo junto en un nico directorio, pero esto tiene el inconveniente de que est todo ms desordenado, y sean ms difciles de hacer las futuras modificaciones.
c) Enlaces con una pgina fuera de nuestro sistema Si queremos enlazar con una pgina que est fuera de nuestro sistema (es decir, que est en un servidor distinto al que soporta nuestra pgina), es necesario conocer su direccin completa, o URL (Uniform Resource Locator). El URL podra ser, adems de la direccin de una pgina del Web, una direccin de ftp, gopher, etc. Una vez conocida la direccin (o URL), lo colocamos en vez de lo que hemos llamado anteriormente xxx (el destino del enlace). Si queremos enlazar con la pgina de Netscape (cuyo URL es: http://home.netscape.com/), la etiqueta sera:
<A HREF="http://home.netscape.com/"> Pgina inicial de Netscape </A>
Es muy importante copiar estas direcciones correctamente (respetando las maysculas y minsculas, pues los servidores UNIX s las distinguen) d) Enlaces con una direccin de email En este caso, sustituimos lo que se ha llamado antes xxx (el destino del enlace) por mailto: seguido de la direccin de email. La estructura de la etiqueta es:
<A HREF="mailto: direccin de email"> Texto del enlace </A>
Prctica 3.
45
Guardamos el fichero de texto con el nombre mipag3.html y lo cargamos en el navegador. Este es el resultado:
4. Imgenes
La etiqueta que nos sirve para incluir imgenes en nuestras pginas del Web es muy similar a la de enlaces a otras pginas, que hemos visto en el epgrafe anterior. La nica diferencia es que, en lugar de indicar al programa navegador el nombre y la localizacin de un documento de texto HTML para que lo cargue, se le indica el nombre y la localizacin de un fichero que contiene una imagen. La estructura de la etiqueta es:
<IMG SRC="imagen.gif">
Con el comando IMG SRC (image source, fuente de la imagen) se indica que se quiere cargar una imagen llamada imagen.gif (o el nombre que tenga). Dentro de la etiqueta se pueden aadir otros comandos, tal como ALT
<IMG SRC="imagen.gif" ALT="descripcin">
46
Con el comando ALT se introduce una descripcin (una palabra o una frase breve) indicativa de la imagen. Este comando, que en principio se puede omitir, es en beneficio de los que accedan a nuestra pgina con un programa navegador en forma de texto slo. Ya que no son capaces de ver la imagen, por lo menos pueden hacerse una idea sobre ella. Pero no es slo por esto. Hay casos, como veremos ms adelante, en los que se utiliza una imagen como enlace a otra pgina. Si se omitiera este comando, los que utilizan dichos navegadores no podran de ninguna manera acceder a esas pginas.
Con respecto a la localizacin del fichero de esa imagen, se puede decir aqu lo mismo que en el epgrafe anterior referente a los enlaces. Al igual que una pgina con la que queremos enlazar puede estar fuera de nuestro sistema, (en cuyo caso haba que indicar su URL o direccin completa), podemos cargar una imagen que no est en nuestro sistema siguiendo el mismo mtodo, es decir, indicar en la etiqueta el URL completo de la imagen. Aunque esto no es muy aconsejable, pues alargara innecesariamente el tiempo de carga de nuestra pgina. Las imgenes deben estar guardadas en un formato de fichero especial llamado GIF. (Hay tambin otro formato ms avanzado, del que se hablar ms adelante). Este formato GIF almacena las imgenes con un mximo de 256 colores, en forma comprimida. Hay programas grficos (como el Paint Shop Pro para el PC, o el Graphic Converter para el Mac) que nos permiten guardar las imgenes en este formato, adems de cumplir otras muchas tareas de manipulacin de las mismas. Un aspecto muy importante a tener en cuenta es el tamao de las imgenes, pues una imagen grande supone un fichero grande, y esto puede resultar en un tiempo excesivo de carga. Para elegir la posicin de la imagen con respecto al texto hay distintas posibilidades. La ms sencilla es colocarla entre dos prrafos, con un titular a un lado. Los navegadores ms actuales (como el Netscape Navigator y el Microsoft Internet Explorer) permiten que el texto pueda rodear a la imagen (como se ver ms adelante, en el Epgrafe 8). De momento nos vamos a limitar a escoger la posicin del titular con respecto a la imagen (si es que queremos ponerle un titular, claro est). Se puede poner arriba, en medio o abajo del lado de la imagen. Para ello se aade el comando ALIGN a la etiqueta, de la siguiente manera:
<IMG SRC="isla.gif" ALIGN=TOP> Titular alineado arriba <IMG SRC="isla.gif" ALIGN=MIDDLE> Titular alineado en medio <IMG SRC="isla.gif" ALIGN=BOTTOM> Titular alineado abajo
Otra posibilidad muy interesante es la de utilizar una imagen como enlace a otra pgina. Para estos casos se utilizan generalmente imgenes pequeas (iconos), aunque se puede usar cualquier tipo de imagen. Segn vimos en el epgrafe anterior, la estructura general de un enlace es: 47
En este caso sustituimos xxx por el nombre del fichero de la pgina a la que queremos acceder. Y en lugar de yyy ponemos la etiqueta completa de la imagen (que queda as englobada dentro de la etiqueta del enlace) Como ejemplo vamos a utilizar la imagen (hand.gif) para acceder al ejemplo prctico del epgrafe 2 (mipag2.html):
<A HREF="mipag2.html"><IMG SRC="hand.gif"></A>
que da como resultado: Pulsando la imagen comprobamos cmo efectivamente enlaza con la pgina deseada. Obsrvese adems que la imagen est rodeada de un rectgulo del color normal en los enlaces. Si no se desea que aparezca ese rectngulo, hay que incluir dentro de la etiqueta de la imagen el atributo BORDER=0, es decir:
<A HREF="mipag2.html"><IMG SRC="hombre.gif" BORDER=0></A>
Posicionando el cursor sobre esta ltima imagen, comprobamos que acta tambin como enlace aunque carezca del rectngulo de color. Esto puede resultar ms esttico.
Tambin podemos utilizar una imagen para enlazar con otra imagen. En este caso sustituimos xxx (el destino del enlace) con el nombre del fichero de la imagen a la que queremos acceder e yyy (lo que aparece en pantalla como el enlace) por la etiqueta completa de la imagen que queremos que aparezca en la pantalla como el enlace de la otra. Por ltimo, otra posibilidad es la de utilizar un texto para enlazar con una imagen. En este caso sustituimos xxx (el destino del enlace) con el nombre del fichero de la imagen a la que queremos acceder e yyy (lo que aparece en pantalla como el enlace) por el texto. 48
Supongamos que queremos enlazar con la imagen hand.gif por medio de un texto: <A HREF="hand.gif"> necesitas una mano? </A> Que da como resultado:
Un tipo de imgenes del que se hace abundante uso y que sirven para mejorar la presentacin de la pgina son los iconos, botones, barras separadoras, etc. A pesar de su tamao o forma, son imgenes como cualquier otra. Por ejemplo utilizamos un boton aceptar y escribimos en el sitio correspondiente:
<IMG SRC="b_aceptar.gif> Esta linea esta precedida por un boton aceptar.
Que resulta:
Prctica 4.
Primeramente es necesario obtener tres imgenes Gif, que puede capturar de alguna pgina en internet solo presionando el boton derecho del mouse, y guardarlas en el mismo directorio en el que se guardar el fichero de texto que se va a crear a continuacin, junto con los de los epgrafes anteriores. En el procesador de textos copiamos: <HTML> <HEAD> <TITLE> Mi pagina del Web - 4 </TITLE> </HEAD> <BODY> 49
<CENTER> <H1> Mi pagina del Web </H1> </CENTER> <HR> Esta es mi pagina del Web. No es muy extensa, pero tiene todos los elementos basicos. Espero que os guste. Poco a poco le ire anadiendo mas cosas interesantes. <P> <A HREF="mipag2.html"> <IMG SRC="imagen1.gif"> </A> Mis aficiones <P> <A HREF="mipag3.html"> <IMG SRC="imagen2.gif"> </A> Mis paginas favoritas <CENTER> <H3> Un lugar ideal para mis vacaciones </H3> <IMG SRC="imagen3.gif" ALT="isla"> </CENTER> </BODY> </HTML>
Guardamos el fichero de texto con el nombre mipag4.html y lo cargamos en el navegador. Este es el resultado.
5. Caracteres especiales
Existen algunas limitaciones para escribir el texto. Una de ellas es debido a que las etiquetas se forman como un comando escrito entre los smbolos "<" y ">". Por tanto, si se quisieran escribir estos caracteres como parte normal del texto, dara esto lugar a una ambigedad, ya que el programa navegador podra interpretarlos como el comienzo o final de una etiqueta, en vez de un carcter ms del texto. Para resolver este problema, existen unos cdigos para poder escribir estos caracteres y otros relacionados con las etiquetas. < para < (less than, menor que) 50
> para > (greater than, mayor que) & para & (ampersand) " para " (double quotation) Como se ve, estos cdigos empiezan siempre con el signo & y acaban siempre con ; De una manera similar, existen cdigos para escribir letras especficas de distintos idiomas. Hay muchos de ellos, pero, lgicamente, los que ms nos interesan son los propios del castellano (las vocales acentuadas, la y los signos y )
Los cdigos de las vocales acentuadas se forman comenzando con &, seguido de la vocal en cuestin, seguido de la palabra acute (aguda) y terminando con el signo ; á para la í para la ú para la É para la Ó para la El resto de los cdigos son: ñ para la ü para la ¿ para Ñ para la Ü para la ¡ para é para la ó para la Á para la Í para la Ú para la
Prctica 5.
Como ejercicio de este epgrafe vamos a sustituir en el ejemplo prctico del epgrafe anterior (mipag4.html) las vocales acentuadas por sus correspondientes cdigos. Quedar de esta manera:
<HTML> <HEAD> <TITLE> Mi página del Web - 4 </TITLE> </HEAD> <BODY> <CENTER> <H1> Mi página del Web </H1> </CENTER> <HR> Esta es mi página del Web. No es muy extensa, pero tiene todos los elementos básicos. Espero que os guste. Poco a poco le iré añadiendo más cosas interesantes. <P> <A HREF="mipag2.html"> <IMG SRC="hombre.gif"> </A> Mis aficiones <P> <A HREF="mipag3.html"> <IMG SRC="casa.gif"> </A> Mis páginas favoritas <CENTER>
51
<H3> Un lugar ideal para mis vacaciones </H3> <IMG SRC="isla.gif" ALT="isla"> </CENTER> </BODY> </HTML>
6. Fondos
Se puede cambiar el fondo de dos maneras distintas: a) Con un color uniforme b) Con una imagen
donde: XX es un nmero indicativo de la cantidad de color rojo YY es un nmero indicativo de la cantidad de color verde ZZ es un nmero indicativo de la cantidad de color azul Estos nmeros estn en numeracin hexadecimal. Esta numeracin se caracteriza por tener 16 dgitos (en lugar de los diez de la numeracin decimal habitual). Estos dgito son: 0123456789ABCDEF Es decir, que en nuestro caso, el nmero menor es el 00 y el mayor el FF. As, por ejemplo, el color rojo es el #FF0000, porque tiene el mximo de rojo y cero de los otro dos colores . Los colores primarios son: #FF0000 - Rojo #00FF00 - Verde #0000FF - Azul 52 Otros colores son: #FFFFFF - Blanco #000000 - Negro #FFFF00 - Amarillo
Para hacer un color ms oscuro, hay que reducir el nmero de su componente, dejando los otros dos invariables. As, el rojo #FF0000 se puede hacer ms oscuro con #AA0000, o an ms oscuro con #550000. Para hacer que un color tenga un tono ms suave (ms pastel), se deben variar los otros dos colores hacindolos ms claros (nmero ms alto), en una cantidad igual. As, podemos convertir el rojo en rosa con #FF7070.
Colores del texto y de los enlaces Si no se variasen los colores habituales del texto y de los enlaces (negro y azul, respectivamente), podra ocurrir que su lectura contra un fondo oscuro fuese muy dificultosa, o incluso imposible, si el fondo fuese precisamente negro o azul. Para evitar esto, se pueden escoger los colores del texto y de los enlaces, aadiendo a la etiqueta (si se desea) los siguientes comandos: TEXT - color del texto LINK - color de los enlaces VLINK - color de los enlaces visitados ALINK - color de los enlaces activos (el que adquieren en el momento de ser pulsados) Los cdigos de los colores son los mismos que los que se han visto anteriormente. La etiqueta, con todas sus posibilidades, sera:
< BODY BGCOLOR="#XXYYZZ" TEXT="#XXYYZZ" VLINK="#XXYYZZ" ALINK="#XXYYZZ"> LINK="#XXYYZZ"
Ejemplo. El comando TEXT explicado anteriormente (que va englobado dentro de la etiqueta <BODY>) cambia el color de la totalidad del texto de la pgina.
53
Tanto el Netscape Navigator 2, como el Microsoft Explorer soportan una etiqueta de color de la fuente con la que se puede cambiar slo una parte del texto:
<FONT COLOR="#FF0000"> Este texto es de color rojo </FONT>
o bien:
<BODY BACKGROUND="imagen.jpg">
Hay que prever la posibilidad de que quien acceda a nuestra pgina haya deshabilitado la carga automtica de imgenes, en cuyo caso tampoco cargara la imagen que sirve como fondo y slo vera el fondo estndar de color gris. Esto podra ser muy perjudicial si hemos escogido unos colores para el texto y los enlaces que no contrastan bien con ese fondogris. La solucin a este problema es poner dentro de la etiqueta <BODY> los dos comandos BACKGROUND y BGCOLOR (en este orden), teniendo cuidado en escoger un color uniforme de fondo parecido al de la imagen.
Prctica 6.
Vamos a poner como fondo la imagen nubes.jpg, junto con un fondo alternativo de color azul claro y hacer que el texto sea de color rojo oscuro. Para ello es necesario antes capturar la imagen y guardarla en el mismo directorio en donde vamos a guardar el fichero que vamos a crear. Cargamos en el editor de textos mipag3.html y sustituimos la etiqueta <BODY> por esta otra: <BODY BACKGROUND="nubes.jpg" TEXT="#AA0000"> BGCOLOR="#CCFFFF"
54
Guardamos este fichero como mipag7.html y lo cargamos en el navegador para visualizarlo. Este es el resultado :
7. Tablas
Hasta que no se empezaron a usar las tablas, la nica manera de tabular las cosas era utilizar la etiqueta de preformateado, con la que es necesario poner textomente los espacios en blanco para que quede todo alineado formando filas y columnas, con un resultado muy poco esttico.
Para que los datos vayan dentro de cajas formadas por un borde tenemos que aadir el atributo BORDER a la etiqueta, es decir: <TABLE BORDER> [resto de las etiquetas] </TABLE> 2. En el siguiente nivel, dentro de la anterior, estn las etiquetas para formar cada fila (row) de la tabla, que son <TR> y </TR>. Hay que repetirlas tantas veces como filas queremos que tenga la tabla. Es decir, para una tabla con dos filas, sera:
<TR> [etiquetas de las distintas celdas de la primera fila]
55
3. En el ltimo nivel (dentro de las anteriores) estn las etiquetas de cada celda, que son <TD> y </TD>, que engloban el contenido de cada celda concreta (texto, imgenes, etc.). Hay que repetirla tantas veces como celdas queremos que haya en esa fila. Veamos un ejemplo de una tabla con dos filas. Cada fila va a tener tres celdas. Dentro de cada celda vamos a poner un texto indicativo de la posicin de dicha celda: <TABLE BORDER> <TR> <TD>fila1-celda1</TD> <TD>fila1-celda2</TD> <TD>fila1-celda3</TD> </TR> <TR> <TD>fila2-celda1</TD> <TD>fila2-celda2</TD> <TD>fila2-celda3</TD> </TR> </TABLE> Que resulta:
Titular de la tabla
Se puede aadir un titular (caption) a la tabla, es decir un texto situado encima de la tabla que indica cul es su contenido. Se consigue con la etiqueta <CAPTION> y </CAPTION>.
56
El atributo BORDER (visto ms arriba) pone por defecto un borde de espesor igual a la unidad. Pero se puede hacer que este borde sea tan grueso como queramos, poniendo:
<TABLE BORDER=nmero deseado>
Celdas de cabecera
Adems de las celdas que contienen datos normales, podemos poner, si nos conviene, celdas de cabecera (header), que se distinguen por estar el texto de dichas celdas en negrita y centrado. Esto se consigue con la etiqueta <TH> y </TH> (en vez de la normal <TD> y </TD>) Vamos a aadir, en el ejemplo anterior, una fila de estas celdas de cabecera, antes de las otras dos que ya existan: <TR> <TH>Columna 1</TH> <TH>Columna 2</TH> <TH>Columna 3</TH> </TR> Que resulta:
57
</TABLE>
El alineamiento por defecto en el sentido vertical es en el medio. Tambin se puede cambiar,aadiendo dentro de la etiqueta de la celda los siguientes atributos:
<TD VALIGN=TOP> Arriba </TD> <TD VALIGN=BOTTOM> Abajo </TD>
O ponemos:
<TABLE HEIGHT=200>
58
para extenderse sobre un nmero determinado de columnas, o ROWSPAN=nmero para extenderse verticalmente sobre un nmero determinado de filas. Por ejemplo, en la tabla vamos a aadir una fila con una sola celda, que abarca a dos columnas:
<TR> <TD COLSPAN=2> Celda sobre 2 columnas </TD> <TR>
59
3.Que la generalidad de las celdas tenga un color, pero que alguna celda tenga uno particular. El atributo del color general se coloca en la etiqueta TABLE, y el del color particular en la etiqueta de la celda en cuestin (una combinacin de los dos casos anteriores). por ejemplo, vamos a hacer que la generalidad de la tabla sea de color rojo (#FF0000), pero que la celda 1 de la fila 1 sea de color verde (#00FF00):
<TABLE BORDER BGCOLOR="#FF0000"> <TR><TD BGCOLOR="#00FF00">fila1-celda1</TD><TD>fila1celda2</TD></TR> <TR> <TD>fila2-celda1</TD> <TD>fila2-celda2</TD> </TR> </TABLE>
60
Prctica 7.
Vamos a crear una tabla de dos filas, con una celda cada una. La primera, como cabecera, con el texto "Un lugar ideal para mis vacaciones", y la segunda con la imagen isla.gif. Adems vamos a alargar a lo ancho la tabla al 75% de la pantalla. Para ello:
<P> <TABLE BORDER=5 WIDTH=75%> <TR> <TH> Un lugar ideal para mis vacaciones </TH> </TR> <TR> <TD ALIGN=CENTER> <IMG SRC="isla.gif" ALT="isla"> </TD> </TR> </TABLE>
El resultado es:
8. Formularios
La manera general para que los lectores de nuestra pgina se puedan comunicar con nosotros es por medio de un enlace a nuestra direccin de email, con lo que recibiramos un email convencional. Pero puede ser que lo que necesitemos sea slamente una respuesta concreta a unas opciones que presentaremos nosotros mismos, o un comentario del usuario, para lo que le suministraremos un espacio en donde introducirlo. Se puede hacer todo esto, adems de otras cosas, utilizando los formularios, con los que se pueden confeccionar pginas que contengan los elementos necesarios para ello, tal como botones de radio, listas de seleccin, cajetines de introduccin de texto y de control, etc., como vamos a ver. Los formularios permiten que los dems nos enven la informacin directamente a nosotros o bien a nuestro servidor, en donde hemos instalado un programa que procese esta informacin.
61
Por ejemplo, vamos a suponer que queremos crear una lista de correo. Los usuarios pueden introducir sus nombres y direcciones de email y pulsar un botn de envo. Esos datos los podemos recibir "en bruto" en nuestro correo, con los que confeccionaramos textomente dicha lista de correo, sin necesitar ningn programa para ello. Este proceso es el que vamos a comentar en este epgrafe. La otra posibilidad, de la que nicamente se va a hacer esta mencin, es que hubiramos instalado en nuestro servidor un programa especial para procesar esos datos y aadirlos a la lista de correo, y que incluso pudiera devolver automticamente al usuario algn tipo de informacin. Para conseguir esto, los formularios necesitan ejecutar programas o scripts por medio del CGI (Common Gateway Interface). El CGI permite a los formularios ser procesados por programas escritos en cualquier lenguaje, aunque los ms usados en Internet son el Perl y el C. NOTA: El tipo de formulario que se describe a continuacin podr ser utilizado por la mayora de los navegadores, con la notable excepcin del Explorer (incluso la versin 3.0), por lo que es conveniente suministrar al final del formulario, como una alternativa para estos casos, un enlace de email ordinario (ver el Epgrafe 3)
Estructura de un formulario
La estructura general de un formulario es: 1. Etiqueta de inicio:
<FORM ACTION="mailto:direccin_de_email" METHOD="POST" ENCTYPE="TEXT/PLAIN">
2. Cuerpo del formulario, con los distintos elementos para poder introducir los datos. 3. Botones de envo y de borrado. 4. Etiqueta de cierre </FORM> Etiqueta de inicio El atributo ACTION indica la accin que se debe efectuar y que es que los datos sean enviados por email a la direccin indicada. (Si hiciramos uso del CGI, sera precisamente aqu donde indicaramos su localizacin en el servidor, que habitualmente es el directorio cgi-bin, para que procese los datos).
El atributo METHOD=POST indica que los datos sean inmediatamente enviados por correo a la direccin de email, nada ms pulsar el usuario el botn de envo. Con el atributo ENCTYPE="TEXT/PLAIN" se consigue que las respuestas las recibamos como un fichero de texto, perfectamente legible y sin codificar. Elementos para introducir los datos Los vamos a dividir en tres clases: a) Introduccin por medio de texto 62
b) Introduccin por medio de mens c) Introduccin por medio de botones La introduccin de los datos se consigue por medio de la etiqueta:
<INPUT TYPE="xxx" NAME="yyy" VALUE="zzz">
En donde: xxx es la palabra que indica el tipo de introduccin. yyy es el nombre que le asignamos nosotros a la variable de introduccin del dato. zzz es la palabra asociada a un elemento.
En este caso es xxx=text, es decir, INPUT TYPE="text". El atributo VALUE no procede en este caso. Vamos a poner un ejemplo: solicitamos el apellido del usuario.
<FORM ACTION="mailto:direccin_de_email" ENCTYPE="TEXT/PLAIN"> Escribe tu apellido: <BR><INPUT TYPE="text" NAME="Apellido"> </FORM> METHOD="POST"
Que resulta: Si el usuario introduce su apellido, p. ej. Ruiz, y pulsa el botn de envo (que veremos ms adelante), recibiremos un email suyo con el siguiente texto: Apellido=Ruiz
La longitud de este formulario es por defecto de 20 caracteres. Se puede variar incluyendo en la etiqueta el atributo SIZE="nmero". Por otra parte, sea cual sea la longitud del formulario, si no se indica nada, el usuario puede introducir el nmero de caracteres que quiera. Se puede limitar esto, incluyendo en la etiqueta el atributo MAXLENGTH="nmero". Tambin se puede hacer que el texto introducido no sea reconocible, es decir que todos los caracteres se representen por asteriscos. Basta con cambiar en la etiqueta INPUT TYPE="text" por INPUT TYPE="password". En el ltimo ejemplo, podemos cambiar la etiquea correspondiente por:
<INPUT TYPE="password" NAME="Apellido" SIZE="10" MAXLENGTH="12">
63
Cuando el texto a introducir puede alcanzar una gran longitud, por ejemplo un comentario, es conveniente utilizar un formulario de texto de mltiples lneas. Esto se consigue con la etiqueta de inicio:
<TEXTAREA NAME="yyy" ROWS="nmero" COLS="nmero">
(en donde no se utiliza INPUT TYPE y donde ROWS representa el nmero de filas, y COLS el de columnas). y la de cierre: </TEXTAREA> Ejemplo: un formulario solicitando los comentarios del usuario:
<FORM ACTION="mailto:direccin_de_email" METHOD="POST" ENCTYPE="TEXT/PLAIN"> Introduce tus comentarios: <BR><TEXTAREA NAME="Comentarios" ROWS="6" COLS="40"> </TEXTAREA> </FORM>
b) Introduccin por medio de mens
Si queremos que el usuario, en vez de introducir un texto, como hemos visto en los casos anteriores, escoja entre varias opciones que le presentamos nosotros, haremos uso de un formulario en forma de men. Se consigue con la etiqueta de inicio <SELECT NAME="yyy"> y la de cierre </SELECT>. Las distintas opciones a escoger se consiguen con la etiqueta <OPTION>. Ejemplo: Pedimos al usuario que elija su color preferido: <FORM ACTION="mailto:direccin_de_email" ENCTYPE="TEXT/PLAIN"> Cul es tu color preferido? <BR><SELECT NAME="ColorPreferido"> <OPTION>Rojo <OPTION>Verde <OPTION>Azul <OPTION>Amarillo </SELECT > </FORM> METHOD="POST"
En el ejemplo anterior, slo es visible en el formulario una opcin. Si queremos que sean visibles mltiples opciones a la vez, aadimos en la etiqueta los atributos MLTIPLE SIZE="nmero", donde especificamos el nmero de opciones visibles. 64
Obtenemos:
Si queremos que el usuario confirme una opcin determinada, podemos hacer uso de un formulario de confirmacin, o checkbox, que se consigue con la etiqueta:
<INPUT TYPE="checkbox" NAME="yyy">
Si queremos que el formulario aparezca inicialmente como marcado (el usuario no necesitar hacerlo), basta con aadir el atributo CHECKED dentro de la etiqueta. En el ejemplo anterior sustituimos la etiqueta equivalente por:
<INPUT TYPE="checkbox" NAME="Lista" CHECKED>
65
Cuando queremos que el usuario elija una nica opcin entre varias, podemos hace uso de los botones de radio, que se consiguen con la etiqueta:
<INPUT TYPE="radio" NAME="yyy" VALUE="zzz">
Donde yyy es el nombre que le ponemos a la variable que se trata de elegir, y zzz es el nombre de cada una de las opciones en concreto.
Cul es tu sistema operativo preferido? <BR> <INPUT TYPE="radio" NAME="SistemaOperativo" VALUE="Windows" CHECKED> Windows <INPUT TYPE="radio" NAME="SistemaOperativo" VALUE="Mac"> MacOs <INPUT TYPE="radio" NAME="SistemaOperativo" VALUE="Unix"> Unix </FORM>
Que resulta:
Obsrvese el atributo opcional CHECKED que se ha aadido en la primera etiqueta. Esa ser la opcin que aparece marcada por defecto. Obsrvese tambin que no es posible escoger ms de una opcin.
Hasta ahora, en todos los ejemplos que hemos visto, faltaba un elemento esencial en cualquier formulario, y es el botn de envo de los datos, que se consigue con la etiqueta:
<INPUT TYPE="submit" VALUE="zzz">
66
Otro botn interesante es el de borrado de los datos introducidos, muy conveniente en un formulario con muchos elementos. Es muy similar al de envo, pues se consigue con la etiqueta:
<INPUT TYPE="reset" VALUE="zzz">
En donde zzz es el texto que queremos que aparezca en el botn. Si aadimos al ejemplo anterior la etiqueta:
<P><INPUT TYPE="reset" VALUE="Borrar datos">
resulta:
Prctica 8.
Vamos a aadir un "libro de visitas". Para ello, aadimos lo siguiente, entre las etiquetas <HR> y </BODY> situadas al final, lo siguiente:
<P><CENTER> <H2>Libro de visitas</H2> <P><FORM ACTION="mailto:farocena@lander.es" METHOD="POST" ENCTYPE="TEXT/PLAIN">
67
Tu nombre: <BR><INPUT TYPE="text" NAME="Nombre"> <P>Escribe tus comentarios: <BR><TEXTAREA NAME="Comentarios" ROWS="6" COLS="40"> </TEXTAREA> <P><INPUT TYPE="submit" VALUE="Enviar datos"> <INPUT TYPE="reset" VALUE="Borrar datos"> </FORM> <P> <HR>
El resultado es:
9. Frames
Frames (en ingls, marcos o cuadros) es un procedimiento del lenguaje HTML para dividir la pantalla en diferentes zonas, o ventanas, que pueden actuar independientemente unas de otras, como si se trataran de pginas diferentes, pues incluso cada una de ellas pueden tener sus propias barras deslizadoras. Una de sus caractersticas ms importantes es que pulsando un enlace situado en un frame, se puede cargar en otro frame una pgina determinada. Esto se utiliza frecuentemente para tener un frame estrecho en la parte lateral (o superior) con un ndice del contenido en forma de diferentes enlaces, que, al ser pulsados cargan en la ventana principal las distintas pginas.
De esta manera se facilita la navegacin entre las pginas, pues aunque se vaya pasando de unas a otras, siempre estar a la vista el ndice del conjunto. Para comprender los distintos conceptos vamos a desarrollar un ejemplo, creando una pgina con dos frames. El de la izquierda va a servir de ndice de lo que veamos en el de la derecha, y en ste veremos inicialmente una pgina de presentacin. Se podr acceder tambin aqu a la pgina personal creada en los epgrafes anteriores , si se pulsa un enlace en el frame de la izquierda.
Lo primero que tenemos que hacer es crear un documento HTML en el que definiremos cuntas zonas va a haber, qu distribucin y tamao van a tener, y cul va ser el contenido de cada una de ellas. En el ejemplo que vamos a desarrollar, la pgina va a tener dos frames distribuidos en columnas (es decir, uno al lado del otro, en vez de uno encima del otro, lo que sera una distribucin en filas). Con respecto al tamao, haremos que el primero (el del izquierda) ocupe el 20% del ancho de la pantalla, y el otro, el 80% restante. Y con respecto al contenido, el frame de la izquierda va a contener un documento HTML que va a servir de ndice de lo que veamos en el otro (y que vamos a llamar mipagind.html), y el de la derecha otro documento HTML que va a servir de pgina de presentacin (al que llamaremos mipagpre.html). Todo lo anterior se refleja en el siguiente documento HTML:
<HTML> <HEAD> <TITLE>Mi pagina con frames</TITLE> </HEAD> <FRAMESET COLS="20%, 80%"> <FRAME SRC="mipagind.html"> <FRAME SRC="mipagpre.html" NAME="principal"> </FRAMESET> </HTML>
Ya se ha definido el nmero de frames, su distribucin y su tamao, pero falta por definir el contenido de cada frame. Esto se hace con las etiquetas:
<FRAME SRC="mipagind.html"> <FRAME SRC="mipagpre.html" NAME="principal">
Con esto se define que el contenido del primer frame (el de la izquierda) sea el documento HTML mipagind.html y el del segundo (el de la derecha) sea el documento HTML mipagpre.html. Obsrvese que en la etiqueta del segundo se ha incluido el atributo NAME="principal", pero no as en el primero. El motivo es que se necesita dar un nombre al segundo frame, pues, como veremos a continuacin, en el documento del primer frame va a haber unos enlaces que van a ir dirigidos hacia l. En este caso slo tenemos dos frames, pero podra haber ms, y es necesario distinguirlos unos de otros. Y el primero no necesita nombre, pues no va a haber enlaces en el segundo dirigidos hacia l.
69
Necesitamos ahora confeccionar el documento HTML de cada uno de los frames. Recurdese que son como pginas independientes, que pueden tener cada una su propio fondo, etc., y todo lo que queramos aadir en ellos y que hemos aprendido hasta ahora. Documento del frame de la izquierda Va a tener un fondo amarillo, y va a contener dos enlaces dirigidos al frame de la derecha. Adems, como muestra de que se puede aadir cualquier cosa en un frame.
<HTML> <HEAD> <TITLE> Indice </TITLE> </HEAD> <BODY BGCOLOR="#FFBB00"> <P><A HREF="mipagpre.html" TARGET="principal"> Presentacin </A> <P><A HREF="mipag13.html" TARGET="principal"> Mi pgina </A> <P><IMG SRC="imagen1.gif"> </BODY> </HTML>
Dentro de las etiquetas de los enlaces podemos observar algo nuevo, y es el atributo TARGET (en ingls: objetivo, blanco), que sirve para hacer que al ser activado el enlace no se cargue en el propio frame, sino en otro, precisamente en el que hayamos llamado con ese nombre en el documento de definicin de los frames. En nuestro caso, le hemos dado el nombre de "principal" al frame de la derecha, y es por tanto ah donde se van a cargar los documentos HTML. Guardamos este documento con el nombre de mipagind.html. Adems, capturamos la imagen y la guardamos junto con el documento. Documento del frame de la derecha Va a tener un fondo negro, y va a contener slamente un texto.
<HTML> <HEAD> <TITLE> Presentacion </TITLE> </HEAD> <BODY BGCOLOR="#000000" TEXT="#0000FF"> <CENTER> <FONT SIZE=+3><STRONG> <P>ESTA ES LA VERSION <BR><FONT COLOR="#FF0000">CON FRAMES</FONT> <BR>DE MI PAGINA </STRONG> </FONT> </CENTER> </BODY> </HTML>
Si lo cargamos, este es el resultado con frames (para los navegadores que los soportan). Se puede comprobar cmo cambiamos de pgina en el frame de la derecha, segn el enlace que pulsemos en el frame de la izquierda.
Define la distribucin de los frames en columnas o en filas, segn se use uno u otro atributo. Define el nmero de frames que habr, pues, por ejemplo:
<FRAMESET COLS="xx, yy"> (habr dos frames en columnas) <FRAMESET COLS="xx, yy, zz"> (habr tres frames en columnas)
Define el tamao de los frames, segn el valor que demos a xx, yy, zz.... Este valor se puede expresar en: Un porcentaje del ancho del pantalla (para las columnas), o del alto de la pantalla (para las filas). As, por ejemplo:
<FRAMESET COLS="%20, %80"> (la columna de la izquierda ocupar el 20% del ancho de la pantalla, y la de la derecha el 80% restante) <FRAMESET ROWS="%10, %70, %20"> (la fila superior ocupar el 10% del alto de la pantalla, la del medio el 70%, y la inferior el 20%)
71
Un nmero absoluto que representa el nmero de pixels que ocupar cada frame a lo ancho o a lo alto (segn sean filas o columnas). As, por ejemplo:
izquierda
<FRAMESET COLS="40, 600"> (la columna de la tendr 40 pixels de ancho y la de la derecha 600).
Es peligroso utilizar slo valores absolutos, pues el tamao de la pantalla vara de un usuario a otro. Si se va a usar algn valor absoluto para un frame, es mejor mezclarlo con alguno relativo, como los que vamos a ver a continuacin, para que se ajuste el total a la pantalla del usuario.
Un valor relativo que se consigue poniendo un asterisco (*), en vez de un nmero. Esto se interpreta como que ese frame debe tener el espacio restante. Por ejemplo:
<FRAMESET ROWS="100,*,100"> (Habr tres filas, la superior y la inferior de una altura fija de 100 pixels, y la del medio obtendr el espacio restante).
Si hay ms de un frame con asterisco, ese espacio restante se dividir por igual entre ellos. Si hay un nmero antes del asterisco, ese frame obtiene esa cantidad ms de espacio relativo. As "2*,*" dara dos tercios para el primer frame y un tercio para el otro.
como hemos utilizado en el ejemplo), o cualquier otro recurso del Web (o URL). Con este atributo se indica lo que se cargar inicialmente en el frame. Si no se le pone este atributo a la etiqueta <FRAME>, entonces dicho frame aparecer inicialmente vaco, aunque tendr las dimensiones asignadas.
72
un frame. El atributo NAME es opcional. Por defecto, todas las ventanas carecen de nombre. Los nombres que se escojan deben comenzar por un carcter alfanumrico (una letra o un nmero, pero no otro tipo de smbolo).
MARGINWIDTH="nmero". Se utiliza este atributo cuando se quiere controlar la el
ancho de los mrgenes dentro de un frame. El nmero que se ponga representa los pixels de los mrgenes. Este atributo es opcional.
MARGINHEIGHT="nmero". Igual que el anterior, pero referido a los mrgenes en
altura.
SCROLLING="yes|no|auto". Este atributo se utiliza para decidir si el frame tendr o no una barra deslizadora. Si se escoje "yes" tendr siempre una barra deslizadora. Si se escoje "no" no la tendr nunca, y si se escoje "auto", ser el navegador quien decida si la tendr o no. Este atributo es opcional. Su valor por defecto es "auto". NORESIZE. A este atributo no se le asigna un valor numrico, como a los dems. Es un indicador para que la ventana no se pueda re-dimensionar (en ingls, resize) por parte del usuario. Es un atributo opcional. Por defecto, todos los frames son redimensionables. FRAMEBORDER="no". Este atributo elimina el borde en un frame, pero si se
quiere que se elimine completamente, tambin hay que ponrselo al frame contiguo. Si se quiere eliminar los bordes de todos los frames, se debe colocar en la etiqueta FRAMESET, como hemos visto anteriormente.
El atributo TARGET
En el ejemplo hemos visto que, como queramos que los enlaces situados en el frame de la izquierda surtieran efecto no en l mismo, sino en otro frame, tenamos que poner dentro de cada enlace el atributo TARGET="principal", siendo "principal" el nombre que habamos dado al segundo frame, en el documento de definicin de frames. Es decir, hemos utilizado este atributo de esta manera:
TARGET="nombre_dado_a_otro_frame".
Estos nombres, que los escogemos nosotros, pueden ser cualquiera, pero con la condicin que el primer carcter sea alfanumrico (letra o nmero). Pero hay unos nombres reservados (es decir, que no se pueden usar para denominar a un frame), que hacen que este atributo efecte unas funciones especiales. Para que cumplan su cometido, es imprescindible escribir estas palabras reservadas (blank, self y top) en minsculas.
73
TARGET="_blank". Hace que se abra una nueva copia del navegador, y el enlace
activado se carga en ella, a pantalla completa. Es decir, tendramos dos copias del navegador (Netscape, Explorer, etc.) funcionando a la vez.
TARGET="_self". Hace que el enlace se cargue en el propio frame. TARGET="_top". Hace que el enlace se cargue a pantalla completa, suprimiendo
todos los frames, pero sin que se cargue una nueva copia del navegador. Este es particularmente til. Un error muy comn es olvidarse de poner este atributo en los enlaces que estn en un frame, con lo que resulta que al ser activados, la pgina llamada se carga dentro del propio frame, lo cual es muy molesto si esa pgina pertenece a otro sitio del Web, y an ms grave si esa pgina tiene a su vez frames. Este inconveniente se evita poniendo este atributo dentro de las etiquetas de los enlaces.
El documento de definicin de las dos filas (olvidmonos de momento que la de abajo est subdividida), sera:
<HTML> <HEAD> <TITLE>Pagina con dos filas</TITLE> </HEAD>
74
Como la fila inferior, en realidad, son dos columnas (con una distribucin del 20% y resto), sustituimos (anidando) la etiqueta <FRAME SRC="documento_fila_inferior"> por:
<FRAMESET COLS="20%, *"> <FRAME SRC="documento_columna_izqda"> <FRAME SRC="documento_columna_dcha"> </FRAMESET>
dos
columnas
La distribucin quedara as :
10. Sonidos.
Una pgina del Web puede tener sonidos incorporados, bien sea como un fondo sonoro que se ejecuta automticamente al cargar la pgina, o como una opcin para que la active el propio usuario.
El fichero de sonido puede estar en formato .mid o .wav. El atributo LOOP (en ingls, lazo) sirve para especificar el nmero (n) de veces que se debe ejecutar el fichero de sonido. Si se escoje el nmero n=-1 o se pone LOOP=infinite, el sonido se ejecutar indefinidamente. Se puede omitir este atributo, y entonces el fichero se ejecutar una sola vez. Ejemplo 1 La etiqueta para que se ejecute el fichero prv89.mid dos veces en el Explorer es:
<BGSOUND SRC="prv89.mid" LOOP=2>
donde WIDTH es la anchura y HEIGHT la altura de una consola que aparece, y que tiene diferentes teclas (play, stop, pausa, etc.). Ms adelante veremos los valores xxx e yy que debemos atribuirles. El fichero de sonido puede estar en formato .mid o .wav, pero recurdese la advertencia hecha anteriormente, de que estos formatos deben estar configurados como MIME por el servidor donde est alojada la pgina. Dentro de la etiqueta se pueden aadir los siguientes atributos opcionales:
AUTOSTART="true" (arranca automticamente) LOOP="true" (se ejecuta ininterrumpidamente)
76
Al pulsar el enlace se activa, en una ventana aparte, el programa que ejecuta el sonido. Esto es vlido para todos los navegadores, incluso las versiones ms antiguas, con la nica condicin de que se haya configurado un programa auxiliar capaz de ejecutar ficheros .mid o .wav.
77
78
El mismo texto presentado en formato de texto sencillo en un editor de texto estndar como el Notepad...:
79
... y el mismo texto en el editor de un sistema de Memoria de Traduccin (se ve tambin la traduccin al griego en proceso):
80
Mientras que el HMTL est formado por una serie de etiquetas muy precisas, que no pueden ser modificadas por el usuario, el XML es mucho ms flexible. Provee una serie de reglas para desarrollar variedades individuales del XML que se adecan a distintos documentos y a las necesidades del usuario. Mientras que es relativamente fcil para un programador de software desarrollar un programa que identifique las etiquetas del HMTL automticamente y las proteja de posibles modificaciones, hacer lo mismo con las etiquetas XML en un archivo de este tipo, puede requerir un poco ms de trabajo por parte del usuario. Todas las etiquetas de un archivo XML estn definidas en una definicin de tipo de documento (DTD). Para identificar correctamente y traducir documentos de XML, es importante obtener la DTD asociada al archivo de XML. El filtro XML que viene incorporado con el sistema de Memoria de Traduccin (MT) puede leer esta definicin DTD e intentar identificar las etiquetas en el texto de origen. Sin embargo, interpretar la DTD puede requerir la intervencin del usuario. Si no hay ninguna DTD disponible, el mecanismo de filtro tendr que crear una lista de etiquetas (analizando el texto de origen) o, en el peor de los casos, el usuario tendr que completar una lista con todas las etiquetas contenidas en el documento de origen. Cmo convertir otros formatos en un archivo con etiquetas. En algunas MT los editores usan un formato de XML personalizado. Esto quiere decir que los documentos de cualquier formato que sea (por ej. documentos de programas DTP del tipo FrameMaker o Interleaf) deben ser convertidos a este formato de 81
etiquetas, de modo tal que el procesador de texto o editor de marca registrada usado por la MT pueda leer los archivos. El sistema de MT debe ofrecer herramientas especiales de conversin o de filtros de formato. Habra que ejecutar la conversin o usar el filtro de formato en los archivos antes o mientras se los carga en la MT. Cuando se haya finalizado y revisado la traduccin, los nuevos archivos traducidos sern reconvertidos al formato original Segmentacin En qu consiste? La segmentacin es la subdivisin automtica de un texto en unidades ms cortas. Un segmento es un elemento del texto que la MT considera la unidad mnima traducible. En general, en el entorno de la MT dichas unidades son oraciones, pero tambin pueden ser encabezamientos o elementos de una enumeracin. Cuando traduce un texto, la MT busca, para cada segmento, una correspondencia en la base de datos de la MT a fin de recuperar posibles traducciones anteriores. Los siguientes elementos de un texto son caracteres tpicos que la MT reconoce como separadores de segmentos:
marcas de final de prrafo final de oracin (punto, signo de interrogacin o exclamacin seguido de un espacio) final de celda (en una planilla).
Qu hacer? 1. Controlar el texto de origen antes de segmentarlo Para lograr que un texto se divida correctamente en segmentos, controle que el texto no contenga ninguno de los siguientes elementos:
o
EJEMPLO: Ejemplo de formato incoherente entre el texto de partida y el texto de llegada. Problema: En este ejemplo, las diferencias entre los separadores de segmentos de ambos textos causan errores de alineacin. El ttulo del documento en ingls est dividido en cuatro segmentos debido al uso incorrecto del tabulador. Solucin: Para que la alineacin sea precisa es indispensable que los textos de partida y de llegada usen separadores de segmentos correctos e idnticos. Los textos de partida y de llegada deben ser revisados atentamente antes de comenzar la alineacin.
82
83
guiones mal ubicados planillas creadas con el tabulador signos de correccin sealadores o marcas en el medio de una oracin o palabra 2. Si los resultados de la segmentacin no son aceptables, modifique las reglas de segmentacin Los sistemas de memoria de traduccin por lo general permiten al usuario cambiar y adaptar estas reglas. Se pueden agregar separadores adicionales y crear archivos que contengan abreviaciones como "Sr." o "ej." en las que el punto no debe ser considerado un separador de segmentos. Nota: La segmentacin es un pre requisito para la alineacin de traducciones ya realizadas con sus correspondientes textos de origen para crear una base de datos de la MT. En este caso, ambos textos, el de origen y el traducido, sern divididos en segmentos y debern controlarse antes de proceder a la alineacin.
o o o o
Pre Traduccin En qu consiste? Pre-traduccin de segmentos del texto de origen La pre-traduccin (tambin llamada traduccin por lotes o batch translation) consiste en comparar un texto de origen completo con la base de datos de la Memoria de Traduccin (MT) e insertar automticamente las traducciones de todas las correspondencias exactas que se hayan encontrado en la base de datos. El resultado es 84
un hbrido que contiene segmentos pre-traducidos y segmentos sin traducir. Todos los segmentos para los cuales no se haya encontrado una correspondencia, debern ser traducidos por un traductor humano o -si se lo tiene a disposicin y se lo considera tilusando un sistema de traduccin automtica. Pre-traduccin de trminos Para aquellos casos en los que no se encuentre una equivalencia en la base de datos de la MT, algunos sistemas de MT permiten pre-traducir trminos. Los segmentos del texto de origen sern comparados con la base terminolgica y todas las correspondencias equivalentes que se encuentren en dicha base terminolgica sern incorporadas automticamente al texto de origen. El resultado son segmentos hbridos del texto de origen. Para qu sirve? Algunas compaas de localizacin prefieren pre-traducir los textos antes de envirselos a sus traductores. La pre-traduccin de segmentos del texto de origen suele ser necesaria para manejar la enorme cantidad de contenidos electrnicos en proyectos de localizacin. La pre-traduccin de trminos se podra usar para que los traductores externos que no estn utilizando el sistema de MT puedan acceder a la terminologa pertinente. Sin embargo, la pre-traduccin de trminos generalmente lleva a un exceso de trabajo de post-edicin. Lo que hay que tener en cuenta: En algunas aplicaciones de MT el usuario puede definir el parmetro de correspondencia de una pre-traduccin por debajo del 100%. Sin embargo, no es aconsejable usar correspondencias aproximadas en la etapa de pre-traduccin, porque esto har que la etapa de post-edicin sea ms difcil y lenta. Pero an restringiendo automticamente la pre-traduccin a las equivalencias exactas se pueden crear errores serios. En primer lugar, cualquier error de traduccin presente en las unidades de la base de datos de la MT se puede multiplicar y "repetir indefinidamente" a travs del proceso de pre-traduccin. En segundo lugar, inlcuso las traducciones de las correspondencias exactas podran no corresponder con contexto del nuevo texto de origen, ya que las bases de datos de la MT son slo una amalgama de unidades de traduccin aisladas de su contexto. Ejemplo de Pre-Traduccin El siguiente ejemplo corto demuestra las dificultades que se presentan durante la pretraduccin automtica. Mientras que en ingls, una frase como "It may be hot" puede ser reutilizada en la mayora de los casos, sin saber a qu hace referencia el pronombre it, no sucede lo mismo en las traducciones hacia otros idiomas que tienen distintos gneros gramaticales. Por lo tanto, las referencias pronominales entre oraciones pueden causar problemas graves en la pre-traduccin automtica.
85
Nuevo texto de origen: La traduccin al alemn de la correspondencia exacta no resulta adecuada en el nuevo contexto:
86
Aunque algunas aplicaciones de MT estn equipadas con funciones que permiten tener en cuenta el contexto, haciendo referencia a todo el documento traducido previamente como base para la pre-traduccin, cualquier texto pre-traducido debe ser controlado cuidadsamente por un traductor humano. Algunos sistemas tambin ofrecen la opcin de extraer de un texto solamente los segmentos que no pueden ser pre-traducidos. En este caso, se recibira un listado de oraciones que no constituye un texto completo. Sera conveniente pedir al cliente que le enve una copia del texto completo junto con las partes pre-traducidas. De no ser as, en la mayor parte de los casos, es muy difcil lograr una traduccin de buena calidad. La pre-traduccin de trminos para los traductores externos no tiene sentido si ellos cuentan con una herramienta de terminologa adecuada. En ese caso los traductores debern recibir la base de datos terminolgica en cuestin o una parte de esta que sea relevante al proyecto.
87
GLOSARIO DE TRMINOS
Glosario de trminos relacionados con la localizacin de contenidos electrnicos
Alineacin El proceso de alineacin consiste en comparar el texto de origen y su traduccin, haciendo coincidir los segmentos correspondientes y unindolos como unidades de traduccin de una MT. Autoedicin (en ingls DTP, de "Desktop Publishing") El diseo de textos y grficos por computadora para imprimir revistas, boletines, folletos, etc. Un buen sistema de autoedicin por lo general ofrece, entre otras cosas, la posibilidad de adaptar un texto a distintas medidas y formas. (FOLDOC (Free On-Line Dictionary Of Computing): Diccionario de computacin gratuito en lnea) Base de datos terminolgica Un conjunto de entradas terminolgicas en el cual se pueden efectuar bsquedas electrnicamente. (Adaptado de Bowker 2002, 154) Concordancia automtica Es un dispositivo de algunos sistemas de MT que busca automticamente fragmentos por debajo del nivel oracional. Se puede activar cuando no se encuentra una correspondencia exacta o aproximada en la base de datos de la MT. Esta funcin busca la correspondencia ms larga posible entre el segmento del texto de origen que ser traducido y los segmentos presentes en la MT y recupera en la base de datos todas las apariciones de las frases repetidas. Vase tambin: Herramienta de Concordancia. Configuracin Terminolgica Creacin de bases de datos terminolgicas durante la preparacin de un proyecto. Contenido Electrnico Informacin digital con una vida til electrnica, es decir, material creado, distribuido, utilizado y finalmente descartado en forma exclusivamente electrnica. El trmino es usado con un significado ms amplio e incluye material que se crea electrnicamente, aunque su distribucin o uso sea en forma impresa, como es el caso de muchos manuales de uso de productos de software. Correspondencia aproximada Cualquier correspondencia entre dos segmentos, uno de origen que debe ser traducido y un segmento que se encuentra almacenado en la MT, que no sea una correspondencia exacta.
88
Correspondencia Exacta Una correspondencia exacta, carcter por carcter, entre dos segmentos, uno de origen que debe ser traducido y un segmento que se encuentra almacenado en la Memoria de Traduccin. Entrada terminolgica Una entrada o anotacin que contiene toda la informacin terminolgica relativa a un nico concepto. Esto significa que toda la informacin relativa al mismo concepto (incluidos, por ejemplo los sinnimos) son recogidos en una nica entrada terminolgica. La informacin relativa a conceptos diferentes debe ser archivada bajo entradas distintas. Error de Concordancia Una penalidad aplicada al valor de concordancia de algunos tipos de unidades de traduccin recuperados de una memoria de traduccin. Podra tratarse de traducciones hechas por un sistema de traduccin automtica, unidades creadas por una herramienta de alineacin, traducciones de segmentos idnticos del texto de origen para distintos clientes, etc. En algunos sistemas de memoria de traduccin los valores de penalidad pueden ser definidos por el usuario, otros aplican automticamente valores predefinidos. Exportar Guardar una copia de un archivo bajo el formato requerido por una aplicacin distinta de la actual. Es posible que el proceso de conversin no sea siempre perfecto. Vase tambin: Importar (Bowker 2002, 146) Extraccin terminolgica Proceso asistido por ordenador para extraer una lista de trminos potenciales de una seleccin de textos electrnicos. El listado resultante (a veces llamados "tminos candidatos") debe ser revisado por un traductor o lingista. La extraccin de trminos puede ser bilinge o monolinge. Nota: a menudo este proceso se conoce tambin como reconocimiento de trminos. No obstante, la extraccin y el reconocimiento de trminos son dos tareas distintas que se llevan a cabo en diferentes fases del proceso de localizacin. Filtro de formato de archivo (tambin: filtro de formato, filtro, rutina o herramienta de conversin) Una funcin del software que cambia un formato de archivo por otro. Formato de un Archivo
89
La distribucin, diseo y organizacin de la informacin en un archivo. Existen cientos de formatos patentados y las aplicaciones especficas necesitan que un archivo est organizado de una cierta manera para poder leer la informacin que contiene. (Bowker 2002, 146) Gestin terminolgica Todas las actividades relacionadas con la preparacin, elaboracin, documentacin y uso de un lxico especializado. Estas actividades se llevan a cabo usando herramientas especializadas como los sistema de gestin de terminologa. (Portal terminolgico del alemn) Herramienta de concordancia de textos En los programas de Memoria de Traduccin (MT): Las herramientas de concordancia bilinges permiten recuperar todas las partes de una secuencia especfica de bsqueda (palabras sueltas, grupos de palabras, frases, etc.) de una base de datos de una Memoria de Traduccin (MT) y visualizar las veces que aparece o se repite, al igual que con su contexto. HMTL (Hypertext Markup Language) El lenguaje de marcas usado para definir el formato de presentacin del documento usado en el World Wide Web. Los sitios en la red se construyen con etiquetas de HMTL, o marcas, incrustados en el texto. El lenguaje HMTL define la disposicin de la pgina, el tipo de carcter y los elementos grficos as como tambin los enlaces de hipertexto a otros documentos de la red. (Bowker2002, 147) Importar Leer el archivo en un formato creado por una aplicacin dferente a la que se est usando. Vase tambin: exportar. (Bowker 2002, 147) Kit de traduccin o Kit de Localizacin. Conjunto de todo el material relacionado con un proyecto de traduccin que compila el Proveedor de Localizacin. Ademas de los documentos de origen, o sea, el material a ser traducido, el kit incluye todo tipo de informacin tcnica y lingstica, como las memorias de traduccin, las bases de datos terminolgicas o glosarios, los manuales de estilo, etc. Locale Trmino ingls que designa una combinacin de idioma y regin. En primer lugar esta combinacin reconoce que en un pas o regin tal vez se use ms de un idioma. En segundo lugar, tambin reconoce que aunque en distintas regiones o pases se hable oficialmente el mismo idioma, es muy probable que existan amplias diferencias, lingisticas o no lingisticas, que requieren un tratamiento especial. 90
Localizacin (L10N) Adaptacin de un producto para que cumpla los requisitos lingsticos, culturales, etc. de un mercado especfico (lo que se entiende como "locale") (FOLDOC: Free On-Line Dictionary of Computing). Vase tambin: Localizacin de contenidos electrnicos Localizacin de contenidos electrnicos Traduccin y adaptacin cultural de la informacin digital para los mercados locales. Memoria de traduccin La finalidad de una memoria de traduccin es guardar los originales y las traducciones de textos de eContent en un ordenador, divididos en unidades manejables, normalmente en frases. A lo largo del tiempo, se va recopilando en el sistema una enorme cantidad de oraciones con sus correspondientes traducciones. Los sistemas de memoria de traduccin permiten reciclar estos segmentos ya traducidos proponiendo automticamente una traduccin recuperada de la memoria siempre que aparece la misma frase (correspondencia exacta) o una frase similar (correspondencia aproximada) en el texto que se est traduciendo. Objeto incrustado Un objeto (por ejemplo, una imagen o un diagrama de flujo) creado mediante el software de una aplicacin que luego se incrusta en un documento creado con otra aplicacin. Incrustar el objeto, en lugar de simplemente insertarlo o pegarlo, garantiza el mantenimiento del formato original. De hecho, es posible modificar el objeto incrustado con la aplicacin original. (Adaptado de Webopedia). Post-edicin Correccin de un texto traducido mediante traduccin automtica por parte de un traductor o un revisor. Pre-traduccin (tambin llamada "batch translation" o traduccin por lotes) La pre-traduccin (tambin llamada traduccin por lotes o batch translation) consiste en comparar un texto de origen completo con la base de datos de la Memoria de Traduccin (MT) e insertar automticamente las traducciones de todas las correspondencias exactas que se hayan encontrado en la base de datos. El resultado es un hbrido que contiene segmentos pre-traducidos y segmentos sin traducir. Proveedor de Localizacin Empresa que ofrece servicios de localizacin de contenidos electrnicos.
91
Reconocimiento de trminos (tambin: bsqueda automtica de trminos) Proceso de bsqueda automtica, en una base de datos terminolgica, de todos los trminos que aparecen en el texto con el cual el traductor est trabajando. Nota: se trata de un proceso distinto del de extraccin de trminos. Repeticin Interna Son los segmentos que aparecen ms de una vez en el texto de origen pero que an no han sido traducidos, es decir, an no estn almacenadas como unidades de traduccin en una Memoria de Traduccin. Vase tambin: repeticiones internas, correspondencia exacta y anlisis estadstico del texto de origen. Repeticiones externas Segmentos que aparecen ms de una vez en dos o ms textos de origen pero que an no han sido traducidos, es decir, todava no han sido registrados como unidades de traduccin en una Memoria de Traduccin. Vase tambin: repeticiones internas, correspondencia exacta y anlisis estadstico del texto de origen. Revisin Todos los pasos llevados a cabo para verificar la precisin de una traduccin, con especial atencin puesta en el control de errores, omisiones, adiciones, nombres y ttulos, cifras y grficos, etc. Segmentacin El proceso de subdividir un texto en segmentos. Segmento Una unidad de texto predefinida que puede ser alineada con su traduccin correspondiente. Normalmente la unidad bsica de segmentacin es una frase, aunque otras unidades tambin se pueden definir como segmentos, por ejemplo titulares, elementos de una lista, celdas de una tabla o prrafos. (Bowker 2002, 152) Sistema de gestin de terminologa Aplicacin de software que permite crear, archivar y recuperar entradas terminolgicas. (Adaptado de Bowker 2002, 154) Sistema de memoria de traduccin Aplicacin que integra una serie de herramientas que ayudan durante el proceso de traduccin. Adems de la memoria de traduccin estos sistemas incluyen
92
herramientas de gestin terminolgica, procesadores de textos, herramientas de gestin de proyectos y de control de calidad. Tag o etiqueta. Una especie de etiqueta, adjunta a un elemento, que contiene informacin relacionada con dicho elemento (por ejemplo, informacin sobre la presentacin grfica). Un conjunto de etiquetas constituyen el marcado; en los lenguajes de marcado como el HMTL y el XML las etiquetas aparecen escritas entre signos de mayor y menor (por ejemplo, <CURSIVA>.) (Adaptado de Bowker 2002, 153) Trmino La designacin de un concepto definido en una lengua particular mediante una expresin lingustica. Un trmino puede estar compuesto por una sola palabra o por dos o ms palabras; la caracterstica que distingue al trmino es que designa un solo concepto, en contraposicin con la unidad fraseolgica, que combina ms de un concepto de manera lexicalizada para expresar situaciones complejas. (ISO 12620 (1999): Computer Applications in Terminology - Data Categories. Geneva: International Organization for Standardization) TMX (Formato de intercambio de memorias de traduccin) Formato estndar para memorias de traduccin desarrollado por LISA (Localization Industry Standards Association) con el objetivo de facilitar el intercambio de memorias de traduccin entre los distintos programas de software y/o entre los proveedores de servicios de localizacin. Para mayores detalles vase la pgina principal TMX. Traduccin Automtica Traduccin llevada a cabo mediante ordenador. En este proceso el ordenador tiene la responsabilidad principal en la traduccin de un texto. un traductor humano puede ayudar durante el proceso con tareas de pre- o post-edicin, pero es el ordenador, en lugar de la persona, quien produce la primera traduccin en borrador. (Bowker 2002, 147) Unidad de traduccin En una memoria de traduccin, segmento del texto de origen y su traduccin correspondiente. (adaptado de Bowker 2002, 155). Valor de Concordancia Se refiere al grado de similaridad entre el segmento del texto de origen a ser traducido y una unidad de traduccin recuperada por el sistema de una memoria de traduccin; en general se presenta como un porcentaje. XML (eXtensible Markup Language) 93
Lenguaje de marcado que sirve para mejorar la funcionalidad del Web, ya que ofrece una modalidad de identificacin de la informacin flexible y fcilmente adaptable. Se llama "extensible" ya que no es un formato fijo ni un lenguaje de marcado predefinido nico como lo es el HMTL. Al contrario, el XML es en realidad un "metalenguaje", es decir un lenguaje que se utiliza para describir otros lenguajes, y permite definir un marcado personalizado adaptable a un nmero infinito de tipos de documentos. (Adaptado de Peter Flynn "The XML FAQ".)
94