You are on page 1of 14

Colegio tcnico profesional regional de san Carlos Departamento de informtica Asignatura: sistemas operativos Profesor: Gilbert Rodrguez Guillen

Encargado: Dylana Sancho Vargas Seccin: 12-2 I trimestre Ao 2012

Contenido Metadatos ............................................................................................Error! Bookmark not defined. Objetivo general ............................................................................................................................ 3 Objetivos especficos ................................................................................................................... 3 Introduccin .........................................................................................Error! Bookmark not defined. El uso de los metadatos ...................................................................................................................... 4 Funciones bsicas ................................................................................................................................ 5 Clasificacin ......................................................................................................................................... 5 TIPOS DE METADATOS ........................................................................................................................ 6 Ciclo de vida ........................................................................................................................................ 7 Creacin ......................................................................................................................................... 7 Manipulacin ................................................................................................................................. 8 Destruccin.................................................................................................................................... 8 Almacenamiento de los metadatos ................................................................................................ 8 Codificacin ..................................................................................................................................... 8 Vocabularios controlados y Ontologas............................................................................................... 9 Beneficios de los metadatos ............................................................................................................... 9 Puntos en contra de los metadatos .................................................................................................. 10 Estndares en el uso de metadatos .................................................................................................. 10 Bibliografa ........................................................................................................................................ 14

Objetivo general

Investigar sobre que son los metadatos y como son utilizados en el almacenamiento y la bsqueda de datos abarcando las recomendaciones de uso de metadatos para intercambio de informacin.

Objetivos especficos 1. Identificar el concepto de metadatos. 2. Determinar cmo se usan los metadatos para intercambio de informacin.

Metadatos
Qu son los metadatos? De todas las definiciones existentes podemos extraer varios puntos cruciales (dato sobre el dato, concepto de objeto, recuperacin de informacin) que nos pueden ser tiles para la realizacin de una nueva definicin que junte a todas las publicadas hasta la fecha, de tal forma que resulte posible concluir que metadato es toda aquella informacin descriptiva sobre el contexto, calidad, condicin o caractersticas de un recurso, dato u objeto que tiene la finalidad de facilitar su recuperacin, autentificacin, evaluacin, preservacin y/o interoperabilidad.

Origen de la palabra metadato Prefijo meta que proviene del griego , meta, 'despus de, ms all de, La palabra dato proviene del latn datum y significa dato.

Esto no es nada nuevo el mtodo utilizado tradicionalmente en el mundo de las bibliotecas y de los archivos una ficha del catalogo es un conjunto de metadatos (el autor, el ttulo, el editor, la fecha de publicacin etc. sirve para bsqueda y recuperacin de la informacin) todas las bibliotecas comparten unas normativas internacionales.

Los metadatos tienen tres funciones bsicas: 1. Proporcionar una descripcin de una entidad u objeto de informacin a travs de otra informacin necesaria para su manejo y preservacin. 2. Proporcionar puntos de acceso a esa descripcin. 3. Codificar esa descripcin.

El uso de los metadatos


Los metadatos sirven para describir todo tipo de recursos, ya sean analgicos o digitales. Tampoco se limitan a un tipo de formato, p.ej. textos, sino que cubren una amplia gama de recursos: objetos, materiales visuales, iconografa, archivos sonoros, etctera. Pueden describir una coleccin en general, un recurso en particular o un solo elemento, por ejemplo un sonido dentro de una reproduccin multimedia.

De esta forma, son ejemplos de metadatos: El encabezamiento de un fichero multimedia (imagen, vdeo o audio). El resumen de un documento. El catlogo de una base de datos. Las fichas catalogrficas en cualquier formato (ISBD, MARC, etc.). Las pginas amarillas.

En Internet podemos encontrarlos tambin en multitud de formas: ndices de documentos contenidos en una Intranet. Direcciones IP o DNS. Encabezamiento de mensajes de correo electrnico. Descripcin de los archivos accesibles va FTP. Trminos extrados por los motores de indizacin/bsqueda.

Funciones bsicas
Los metadatos tienen tres funciones bsicas: 1. Proporcionar una descripcin de una entidad de informacin junto con otra informacin necesaria para su manejo y preservacin. 2. Proporcionar los puntos de acceso a esa descripcin. 3. Codificar esa descripcin.

Clasificacin
Los metadatos se pueden clasificar usando tres criterios:

Contenido: Subdividir metadatos por su contenido es lo ms comn. Se puede separar los metadatos que describen el recurso mismo de los que describen el contenido del recurso. Es posible subdividir estos dos grupos ms veces, por ejemplo para separar los metadatos que describen el sentido del contenido de los que describen la estructura del contenido o los que describen el recurso mismo de los que describen el ciclo vital del recurso. Variabilidad: Segn la variabilidad se puede distinguir metadatos mutables e inmutables. Los inmutables no cambian, no importa qu parte del recurso se vea, por ejemplo el nombre de un fichero. Los mutables difieren de parte a parte, por ejemplo el contenido de un vdeo. Funcin: Los datos pueden ser parte de una de las tres capas de funciones: subsimblicos, simblicos o lgicos. Los datos subsimblicos no contienen informacin sobre su significado. Los simblicos describen datos subsimblicos, es

decir aaden sentido. Los datos lgicos describen cmo los datos simblicos pueden ser usados para deducir conclusiones lgicas, es decir aaden comprensin. Tambin los metadatos se subdividen por su tipo: Metadatos para contenido y descripcin. ISBD (International Standard Bibliographic Description) AACR2 (Anglo American Cataloguing Rules) APPM (Archives, Personal Papers and Manuscripts) TEI (Text Encoding Initiative) Headers Dublin Core GILS (Government Information Locator Service) VRA (Visual Resources Association) Core Categories for Visual Resources EAD (Encoded Archival Description) Metadatos para codificacin MARC (Machine Readable Cataloging) USMARC (United States MARC) UNIMARC (Universal MARC) SGML (Standard Generalized Markup Languaje) DTD (Document Type Definition) TEI (Text Encoding Initiative) HTML (Hipertext Markup Languaje) EAD (Encoded Archival Description) DTD MARC DTD XML (Extensible Markup Languaje)

TIPOS DE METADATOS
Metadatos descriptivos: descripcin e identificacin de los recursos para permitir la bsqueda y recuperacin de una determinada categora de documentos o imgenes por ejemplo: fotografas de automviles. Metadatos estructurales: facilitan la navegacin y presentacin de los recursos electrnicos proporcionando: Informacin sobre su estructura interna (pgina, seccin, captulo, numeracin, ndices, tablas de contenidos) La relacin entre los materiales (fotografa B incluida en el manuscrito A) Unen los archivos de imagen y textos relacionados (archivo A es el formato JPEG de la imagen del archivo B)

Metadatos administrativos: facilitan la gestin y procesamiento de las colecciones digitales.

Datos tcnicos sobre la creacin y el control de calidad, gestin de derechos, control de acceso y utilizacin y condiciones de preservacin (ciclos de actualizacin, migracin, etc.)

Se pueden establecer otras tipologas en funcin de diversos elementos Fuente metadatos externos e internos mtodo de creacin automticos y manuales permanencia dentro del sistema estticos y dinmicos de larga o de corta duracin tipo de estructura estandarizados o no semntica vocabulario controlado o no

Los metadatos informan sobre cualquier objeto de informacin, fsico o virtual, reflejando sus tres elementos esenciales: El contenido, que se refiere al asunto o materia sobre el que trata el documento El contexto que integra todos los aspectos relacionados con la creacin del objeto de informacin, tales como quien, qu, porqu, dnde y cmo. La estructura, que ha hace referencia al conjunto formal de relaciones en o entre objetos de informacin

Creacin

Ciclo de vida
El ciclo de vida de los metadatos comprende las fases creacin, manipulacin y destruccin. El anlisis minucioso de cada una de las etapas saca a la luz asuntos significativos.

Destruccin

Manipulacin

Creacin Se pueden crear metadatos manualmente, semiautomticamente o automticamente. El proceso manual puede ser muy laborioso, dependiente del formato usado y del volumen deseado, hasta un grado en el que los seres humanos no puedan superarlo. Por eso, el desarrollo de utillaje semiautomtico o automtico es ms que deseable.

En la produccin automtica el software adquiere las informaciones que necesita sin ayuda externa. Aunque el desarrollo de algoritmos tan avanzados est siendo objeto de investigacin actualmente, no es probable que la computadora vaya a ser capaz de extraer todos los metadatos automticamente. En vez de ello, se considera la produccin semiautomtica ms realista; aqu un servidor humano sostiene algoritmos autnomos con la aclaracin de inseguridades o la proposicin de informaciones que el software no puede extraer sin ayuda. Hay muchos expertos que se encargan del diseo de herramientas para la creacin de metadatos pero que ignoran cuestionar este proceso. Segn los que no evitan el asunto, la generacin no debe comenzar despus de la terminacin de un recurso sino que debe hacerse durante la fabricacin: hay que archivar los metadatos tan pronto como se originan, con los conocimientos especiales del productor, para evitar una laboriosa reconstruccin posterior. Por eso, se tiene que integrar la produccin de metadatos en el procedimiento de fabricacin del recurso. Manipulacin Si los datos cambian, los metadatos tienen que cambiar tambin. Aqu se hace la pregunta quin va a adaptar los metadatos. Hay modificaciones que pueden ser manejadas sencilla y automticamente, pero hay otras donde la intervencin de un servidor humano es indispensable. La metaproduccin, el reciclaje de partes de recursos para crear otros recursos, demanda atencin particular. La fusin de los metadatos afiliados no es trivial, especialmente si se trata de informacin con relevancia jurdica, como por ejemplo la gestin de derechos digitales. Destruccin Adems hay que investigar la destruccin de metadatos. En algunos casos es conveniente eliminar los metadatos junto con sus recursos, en otros es razonable conservar los metadatos, por ejemplo para supervisar cambios en un documento de texto.

Almacenamiento de los metadatos


Hay dos posibilidades para almacenar metadatos: depositarlos internamente, en el mismo documento que los datos, o depositarlos externamente, en su mismo recurso. Inicialmente, los metadatos se almacenaban internamente para facilitar la administracin. Hoy, por lo general, se considera mejor opcin la localizacin externa porque hace posible la concentracin de metadatos para optimizar operaciones de busca. Por el contrario, existe el problema de cmo se liga un recurso con sus metadatos. La mayora de los estndares usa URIs, la tcnica de localizar documentos en la World Wide Web, pero este mtodo propone otras preguntas, por ejemplo qu hacer con documentos que no tienen URL.

Codificacin
Los primeros y ms simples formatos de los metadatos usaron texto no cifrado o la codificacin binaria para almacenar metadatos en ficheros.

Hoy, es comn codificar metadatos usando XML. As, son legibles tanto por seres humanos como por computadoras. Adems este lenguaje tiene muchas caractersticas a su favor, por ejemplo es muy simple integrarlo en la World Wide Web. Pero tambin hay inconvenientes: los datos necesitan ms espacio de memoria que en formato binario y no est claro cmo convertir la estructura de rbol en una corriente de datos. Por eso, muchos estndares incluyen utilidades para convertir XML en codificacin binaria y viceversa, de forma que se unen las ventajas de los dos.

Vocabularios controlados y Ontologas


Para garantizar la uniformidad y la compatibilidad de los metadatos, muchos sugieren el uso de un vocabulario controlado fijando los trminos de un campo. Por ejemplo, en caso de sinnimos o interlenguaje hay que acordarse qu palabras se usan para evitar que el buscador localice espaol pero no espaola. Una ontologa adems define las relaciones de los trminos del vocabulario para que la computadora pueda evaluarlas automticamente. As es posible presentar una pgina web sobre Vincent Van Gogh aunque el usuario tecle pintores neerlandeses; usando una ontologa adecuada el buscador comprende que Van Gogh fue un pintor neerlands. Un concepto muy similar a las ontologas son las folksonomas. Las ontologas son definidas por expertos del campo que ordenan los trminos, pero las folksonomas son definidas por los mismos usuarios.

Beneficios de los metadatos


1. Los metadatos adhieren contenido, contexto y estructura a los objetos de informacin, asistiendo de esta forma al proceso de recuperacin de conocimiento desde colecciones de objetos. 2. Los metadatos permiten generar distintos puntos de vista conceptuales para sus usuarios o sistemas, y liberan a estos ltimos de tener conocimientos avanzados sobre la existencia o caractersticas del objeto que describen. 3. Los metadatos permiten el intercambio de la informacin sin la necesidad de que implique el intercambio de los propios recursos. 4. En cada proceso productivo, o en cada etapa del ciclo de vida de un objeto de informacin, se van generando metadatos para describirlos y metadatos para describir dichos metadatos (manual o automticamente). generando de esta forma valor aadido a los recursos 5. Los metadatos permiten un acceso a los recursos en forma controlada ya que se conoce con precisin el objeto descrito. 6. Los metadatos permiten preservar los objetos de informacin permitiendo migrar (gracias a la informacin estructural) sucesivamente stos, para su posible uso por parte de las futuras generaciones.

7. Los metadatos son esenciales para sostener un crecimiento de una Web a mayor escala, permitiendo bsquedas, integracin y recuperacin del conocimiento desde un mayor nmero de fuentes heterogneas.

Puntos en contra de los metadatos


1. Los metadatos son costosos y necesitan demasiado tiempo. Las empresas no van a producir metadatos porque no hay demanda y los usuarios privados no van a invertir tanto tiempo. 2. Los metadatos son demasiado complicados. La gente no acepta los estndares porque no los comprende y no quiere aprenderlos. 3. Los metadatos dependen del punto de vista y del contexto. No hay dos personas que aadan los mismos metadatos. Adems, los mismos datos pueden ser interpretados de manera totalmente diferente, dependiendo del contexto. 4. Los metadatos son ilimitados. Es posible adherir ms y ms metadatos tiles y no hay fin. 5. Los metadatos son superfluos. Ya hay buscadores potentes para textos, y en el futuro la tcnica query by example (bsqueda basada en un ejemplo) va a mejorarse, tanto para localizar imgenes como para msica y vdeo. Algunos estndares de metadatos estn disponibles pero no se aplican: los crticos lo consideran una prueba de las carencias del concepto de metadatos. Hay que notar que este efecto tambin puede ser causado por insuficiente compatibilidad de los formatos o por la enorme diversidad que acobarda a las empresas. Fuera de eso hay formatos de metadatos muy populares.

Estndares en el uso de metadatos


Un estndar de modelo de metadatos incluye la informacin que permite la validacin sintctica y permite la automatizacin de la traduccin, transformacin y entrega de los datos a los sistemas deseados, en el formato nativo. No obstante, esto no incluye los metadatos que definen el significado semntico, incluyendo el contexto, relaciones y dependencias. Los estndares son extremadamente importantes para permitir la interoperabilidad de los datos. Sin embargo, hay muchos de ellos y es difcil entender como estn relacionados entre ellos. Los diferentes estndares de metadatos estn siendo definidos por organizaciones, incluyendo: el World Wide Web Consortium (W3C), abriendo el camino para XML y los estndares relacionados con la Web.

Meta Rtulos HTML Dublin Core

MARC ISO Z39.50

Estandares de metadatos

SGLM

PURL Handle

DTD

Los primeros metadatos (digitales) y sus bases se desarrollan a finales del siglo XX, cuando emergen mltiples estndares de codificacin, lenguajes y protocolos que se utilizan en la generacin y uso de catlogos. Entre ellos: 1. Machine Readable Cataloguing (MARC): El MARC fue un gran avance porque permiti el intercambio de informacin, el acceso a catlogos colectivos y la catalogacin compartida. Adems, al ser un sistema computarizado, permita la visualizacin en pantalla y facilitaba la manipulacin de registros, la bsqueda, indizacin y recuperacin. MARC fue concebido para transmitir datos de un sistema a otro, y fue revolucionario al incorporar campos de largo variable. Contiene cdigos directorio", alfanumricos de largo fijo que determinan el nombre, largo y donde empieza cada campo de descripcin, campos de control, utilizados para clasificar la informacin en trminos de tiempo y lugar. Los campos de descripcin variable son los contienen datos de catalogacin tradicionales, y son precedidos por un cdigo definido que va desde 001 a 999, donde por ejemplo el cdigo 650 es la materia por tpico del recurso. Desde la creacin de MARC se generaron ms de veinte estndares nacionales (DenMARC, AZMARC, CHMARC, UKMARC, CAN/MARC etc.) los cuales tienden a 'armonizarse'. El ms conocido de ellos es USMARC (United States MARC), tambin llamado LC-MARC que fue desarrollado en 1968 por la Biblioteca del Congreso de Estados Unidos y deriva de MARC. Otro estndar de renombre es MARC21 producto de la conjugacin de CAN/MARC (de Canad) y USMARC en 1999. Tambin desde 1977 existe una interlingua entre los distintos estndares

MARC, creada gracias a un esfuerzo de cada agencia bibliogrfica nacional, en donde se generaron traductores desde su estndar propio a un esquema UNIMARC (Universal MARC) y viceversa.

2. ISO Z39.50: es un protocolo para la generacin de consultas a lo largo de mltiples catlogos online. De origen estadounidense, data de 1988 momento en que fue aprobado por la NISO (National Information Standards Organization) y permite a un usuario de un sistema buscar y recuperar la informacin sin saber la sintaxis utilizada por los otros sistemas. Este es un protocolo para la generacin de consultas a lo largo de mltiples catlogos online. De origen estadounidense, data de 1988 momento en que fue aprobado por la NISO (National Information Standards Organization) y permite a un usuario de un sistema buscar y recuperar la informacin sin saber la sintaxis utilizada por los otros sistemas. Posee un protocolo XML llamado XER y es portable a SQL. Ambos, MARC y Z39.50, son utilizados ampliamente por las entidades bibliotecarias tradicionales y es probable que lo sigan siendo por un tiempo debido al alto costo en el que deben incurrir estas entidades para mutar de formato, adems del poco financiamiento de que disponen para estos fines. En el desarrollo de los lenguajes que son utilizados en el marcado de metadatos juega un papel fundamental Standard Generalized Markup Language (SGML), los Document Type Definition (DTD) y The Warwick Framework.

3. Standard Generalized Markup Language (SGML): Es un estndar internacional que consta de un conjunto de reglas para describir la estructura de un documento de tal forma que puedan ser intercambiados a travs de las plataformas computacionales. SGML es extremadamente flexible y es la base de los lenguajes de marcado ms utilizados hoy en da. SGML es un lenguaje de marcado de documentos. Sus races se remontan a 1969 cuando en los laboratorios de IBM se desarrolla Generalized Markup Language (GML), lenguaje que evoluciona hasta 1974 donde pasa a llamarse SGML. La International Organization for Standardization (ISO) aprueba y publica este lenguaje en 1984 con el nombre de estndar ISO 8879. Este estndar internacional consta de un conjunto de reglas para describir la estructura de un documento de tal forma que puedan ser intercambiados a travs de las plataformas computacionales. SGML es extremadamente flexible y es la base de los lenguajes de marcado ms utilizados hoy en da. En SGML un documento est definido en funcin de la estructura de las entidades que lo conforman. Estas entidades se organizan en una estructura lgica de

manera jerarquizada determinando la estructura de los elementos del documento. Las entidades pueden ser compartidas por distintos documentos. El marcado se lleva a cabo mediante delimitadores y etiquetas de la forma <etiqueta> elemento </etiqueta>. Las etiquetas pueden estar anidadas y se representan mediante el conjunto de caracteres bsicos de acuerdo al estndar ISO 8879. En el contexto histrico de los metadatos, la introduccin de SGML jug un papel fundamental, pues estableci un nuevo paradigma, en que los datos dejan de ser solo datos. Los documentos SGML contienen separadamente (en el sentido lgico) los contenidos, la estructura y el formato.

4. Document Type Definition (DTD): Son aplicaciones de SGML y son las utilizadas para definir las estructuras de un tipo de documento en especial. Son aplicaciones de SGML y son las utilizadas para definir las estructuras de un tipo de documento en especial. Sus races se remontan a 1978 cuando en los laboratorios de IBM se publican los primeros DTD como parte del desarrollo de SGML. Un DTD puede crearse para describir las estructuras de mltiples documentos o para alguno en particular. Estas estructuras se definen indicando reglas tales como nombres de los elementos permitidos, el contenido de cada tipo de elemento y el orden en el cual los elementos pueden aparecer. Uno de los ms conocidos es el DTD de HTML (Hypertexts Markup Language) que define las reglas que dan a luz este masivo lenguaje para marcado de pginas Web. Particularmente en las bibliotecas se utilizan variados DTD, tales como EAD (Encoded Archival Description) para la descripcin bibliogrfica y TEI (Text Encoding Initiative) para el marcado de las versiones electrnicas de textos culturales.

Bibliografa

1. Qu son los metadatos y cmo es la organizacin de los recursos electrnicos? http://elticus.com/?contenido=33

2. Metadatos http://es.wikipedia.org/wiki/Metadato

3. Introduccin a los metadatos http://sistemasavanzadosderecuperaciondeinformacion.iespana.es/index.html http://sistemasavanzadosderecuperaciondeinformacion.iespana.es/historia.html http://sistemasavanzadosderecuperaciondeinformacion.iespana.es/beneficios.html 4. Introduccin e historia a los metadatos

http://www.dcc.uchile.cl/~cvasquez/introehistoria.pdf

5. Introduccin a los metadatos http://www.slideshare.net/anansi/introduccin-a-metadatos http://www.slideshare.net/Coatzozon20/capitulo-8-metadatos

You might also like