Diccionario de Bases de Datos

DICCIONARIO DE BASES DE DATOS Concepto Un diccionario de datos es un conjunto de metadatos que contiene las caractersticas lgicas y puntuales de los
datos que se van a utilizar en el sistema que se programa, incluyendo nombre, descripcin, alias, contenido y organizacin. Identifica los procesos donde se emplean los datos y los sitios donde se necesita el acceso inmediato a la informacin, se desarrolla durante el anlisis de flujo de datos y auxilia a los analistas que participan en la determinacin de los requerimientos del sistema, su contenido tambin se emplea durante el diseo. En un diccionario de datos se encuentra la lista de todos los elementos que forman parte del flujo de datos de todo el sistema. Los elementos ms importantes son flujos de datos, almacenes de datos y procesos. El diccionario de datos guarda los detalles y descripcin de todos estos elementos. Un diccionario de datos es una herramienta de importancia para el administrador de la base de datos, es un catalogo accesible para el usuario de datos relacionados. Con la base de datos. Con el termino de diccionario de datos suele designarse una utilera de software ms general que un catalogo. Los sistemas de diccionario de datos sirven para mantener informacin relativa al hardware y software, la documentacin y los usuarios del sistema, as como otra informacin pertinente para la administracin del sistema. Los sistemas de diccionario de datos sirven para mantener informacin relativa al hardware y software, la documentacin y los usuarios del sistema, as como otra informacin pertinente para la administracin del sistema. Es un catalogo accesible para el usuario de datos relacionados Con la base de datos. Contenido y funcin El diccionario de datos almacena informacin acerca de la estructura de la base de datos, y la informacin de autorizacin, y datos acerca de las relaciones. Tipos de informacin que el sistema debe almacenar estn: Los nombres de las relaciones. Los nombres de los atributos de cada relacin. atributos. Los dominios de los
Los nombres de las vistas definidas en la base de datos y la definicin de esas vistas. Las restricciones de integridad de cada relacin (por ejemplo, las restricciones e clave). Adems de esto, muchos sistemas conservan los datos siguientes de los usuarios del sistema: Nombres de los usuarios autorizados. Informacin contable acerca de los usuarios. En los sistemas que utilizan estructuras altamente sofisticadas para almacenar relaciones, pueden conservarse datos estadsticos y descriptivos acerca de las relaciones: Nmero de tuplas en cada relacin. Mtodo de almacenamiento utilizado para cada relacin (por ejemplo, agrupado o sin agrupar). Tipos Diccionario de datos Activo: Es un diccionario cuyas entradas son modificadas en forma automtica por el software, siempre que ocurran modificaciones en la escritura de la base de datos. Diccionario de datos Pasivo: necesitan ser actualizados en forma separada, para hacer modificaciones en la base de datos, de lo contrario no reflejarn con exactitud el estado de la base de datos. Los diccionarios de datos Activos cuestan ms, pero aseguran se actualicen; no estn disponibles con todos los productos DBMS. Los diccionarios de datos pasivos son menos costosos que los activos, pero se requiere de mayor esfuerzo para mantenerlos actualizados. Cualquiera de ellos es una gran ayuda al DBA para registrar y rastrear nombres, formatos, relaciones y referencias cruzadas de los datos.
NIVELES DE TRANSPARENCIA EN UNA BASE DE DATOS DISTRIBUIDA El propsito de establecer una arquitectura de un sistema de bases de datos distribuidas es ofrecer un nivel de transparencia adecuado para el manejo de la informacin. La transparencia se define como la separacin de la semntica de alto nivel de un sistema de los aspectos de bajo nivel relacionados a la implementacin del mismo. Un nivel de transparencia adecuado permite ocultar los detalles de implementacin a las capas de alto nivel de un sistema y a otros usuarios. El sistema de bases de datos distribuido permite proporcionar independencia de los datos. La independencia de datos se puede dar en dos aspectos: lgica y fsica. .1 Independencia lgica de datos. Se refiere a la inmunidad de las aplicaciones de usuario a los cambios en la estructura lgica de la base de datos. Esto permite que un cambio en la definicin de un esquema no debe afectar a las aplicaciones de usuario. Por ejemplo, el agregar un nuevo atributo a una relacin, la creacin de una nueva relacin, el reordenamiento lgico de algunos atributos. .2 Independencia fsica de datos. Se refiere al ocultamiento de los detalles sobr las estructuras de almacenamiento a las aplicaciones de usuario. la descripcin fsica de datos puede cambiar sin afectar a las aplicaciones de usuario. Por ejemplo, los datos pueden ser movidos de un disco a otro, o la organizacin de los datos puede cambiar. La transparencia al nivel de red se refiere a que los datos en un SBDD se accedan sobr una red de computadoras, sin embargo, las aplicaciones no deben notar su existencia. La transparencia al nivel de red conlleva a dos cosas: .1Transparencia sobre la localizacin de datos. El comando que se usa es independiente de la ubicacin de los datos en la red y del lugar en donde la operacin se lleve a cabo. Por ejemplo, en Unix existen dos comandos para hacer Base de Datos Distribuidas Pg-9una copia de archivo. Cp se utiliza para copias locales y rcp se utiliza para copias remotas. En este caso no existe transparencia sobre la localizacin. .2Transparencia sobre el esquema de nombramiento. Lo anterior se logra proporcionando un nombre nico a cada objeto en el sistema distribuido. As, no se debe mezclar la informacin de la localizacin con en el nombre de un objeto.
La transparencia sobre replicacin de datos se refiere a que si existen rplicas de objetos de la base de datos, su existencia debe ser controlada por el sistema no por el usuario. Se debe tener en cuenta que cuando el usuario se encarga de manejar las rplicas en un sistema, el trabajo de ste es mnimo por lo que se puede obtener una eficiencia mayor. Sin embargo, el usuario puede olvidarse de mantener la consistencia delas rplicas teniendo as datos diferentes. La transparencia a nivel de fragmentacin de datos permite que cuando los objetos de la bases de datos estn fragmentados, el sistema tiene que manejar la conversin de consultas de usuario definidas sobre relaciones globales a consultas definidas sobre fragmentos. As tambin, ser necesario mezclar las respuestas a consultas fragmentadas para obtener una sola respuesta a una consulta global. El acceso a una base de datos distribuida debe hacerse en forma transparente. En resumen, la transparencia tiene como punto central la independencia de datos. La responsabilidad sobre el manejo de transparencia debe estar compartida tanto por el sistema operativo, el sistema de manejo de bases de datos y el lenguaje de acceso a la base de datos distribuida. Entre estos tres mdulos se deben resolver los aspectos sobre el procesamiento distribuido de consultas y sobre el manejo de nombres de objetos distribuidos.
FRAGMENTACIN Fragmentacin El problema de fragmentacin se refiere al particionalmente de la informacin para distribuir cada parte a los diferentes sitios de la red Objetivos de la fragmentacin El objetivo de la fragmentacin consiste en dividir la relacin en un conjunto de relaciones ms pequeas tal que algunas de las aplicaciones de usuario slo hagan uso de un fragmento. Sobre este marco, una fragmentacin ptima es aquella que produce un esquema de divisin que minimiza el tiempo de ejecucin de las aplicaciones que emplean esos fragmentos.
La unidad de fragmentacin ideal no es la tabla sino una subdivisin de sta.
Esto es debido a: Las aplicaciones usan vistas definidas sobre varias relaciones, es decir, se forman a partir de "trozos" de varias tablas. Si conseguimos que cada una de las vistas est definida sobre subtablas locales (o en su defecto lo mas "cerca" posible) a cada aplicacin, es de esperar un incremento en el rendimiento. Si mltiples vistas de diferentes aplicaciones estn definidas sobre una tabla no fragmentada, se tiene: Si la tabla no est replicada entonces se produce generacin de trfico por accesos remotos. Si la tabla est replicada en todos o algunos de los sitios donde reside cada una de las aplicaciones entonces la generacin de trfico innecesario es producida por la necesidad de la actualizacin de las copias. Ventajas Al descomponer una relacin en fragmentos (unidades de distribucin): Permitimos el procesamiento concurrente de transacciones ya que no se bloquean tablas enteras sino subtablas, por lo que dos consultas pueden acceder a la misma tabla a fragmentos distintos. Permitimos la paralelizacin de consultas al poder descomponerlas en subconsultas, cada una de la cuales trabajar con un fragmento diferente incrementndose as el rendimiento. Desventajas Degradacin del rendimiento en vistas definidas sobre varios fragmentos ubicados en sitios distintos (es necesario realizar operaciones con esos trozos lo cual es costoso) El control semntico se dificulta y el rendimiento se degrada debido que la verificacin de restricciones de integridad (claves ajenas, uniques, etc) implican buscar fragmentos en mltiples localizaciones. Por lo tanto divisin y ubicacin de los fragmentos no es trivial. Tipos de fragmentacin de datos Existen tres tipos de fragmentacin: Fragmentacin horizontal Fragmentacin vertical Fragmentacin hbrida
Para que una la fragmentacin de una relacin sea correcta debe satisfacer las siguientes condiciones: Condicin de completitud. La descomposicin de una relacin R en los fragmentos R1, R2, ..., Rn es completa si y solamente si cada elemento de datos en R se encuentra en alguno de los fragmentos Ri. Condicin de Reconstruccin. La descomposicin de una relacin R en los fragmentos R1, R2, ..., Rn es completa si y solamente si cada elemento de datos en R se encuentra en alguno de los fragmentos Ri. Condicin de Fragmentos Disjuntos. Si la relacin R se descompone en los fragmentos R1, R2, ..., Rn, y el dato di est en Rj, entonces, no debe estar en ningn otro fragmento Rk (k?j). Fragmentacin horizontal La fragmentacin horizontal de una relacin R produce una serie de fragmentos R1, R2, ..., Rr, cada uno de los cuales contiene un subconjunto de las tuplas de R que cumplen determinadas propiedades (predicados) Fragmentacin horizontal primaria y derivada La Fragmentacin Horizontal Primaria (FHP) de una relacin se obtiene usando predicados que estn definidos en esa relacin. La Fragmentacin Horizontal Derivada (FHD) por otra parte, es el particionamiento de una relacin como resultado de predicados que se definen en otra relacin. Fragmentacin vertical La fragmentacin vertical de una relacin R produce una serie de fragmentos R1, R2, ..., Rr cada uno de los cuales contiene un subconjunto de los atributos de R as como la clave primaria de R. Complejidad de la fragmentacin Vertical La fragmentacin vertical resulta ms complicada que la horizontal. En el caso vertical, si una relacin tiene m atributos clave no primarios, el nmero de posibles fragmentos es igual a B(m), es decir el m-simo nmero de Bell [3]. Para valores grandes de m, B(m)(mm; por ejemplo, para m = 10, B(m) ( 115.000, para m = 15, B(m) ( 109, para m = 30, B(m) = 1023.
Estos valores indican que la obtencin de una solucin ptima de la fragmentacin vertical resultar una tarea imposible, sino nos apoyamos en el uso de heursticas. El problema de la asignacin de fragmentos Asumamos que hay un conjunto de fragmentos F = { F1, F2, ..., Fn } y una red que consiste de los sitios S = { S1, S2, ..., Sm } en los cuales un conjunto Q = { q1, q2, ..., qq } de consultas se van a ejecutar. El problema de asignacin consiste en determinar la distribucin "ptima" de F en S. La optimalidad puede ser definida de acuerdo a dos medidas: Costo mnimo. Consiste del costo de comunicacin de datos, del costo de almacenamiento, y del costo procesamiento (lecturas y actualizaciones a cada fragmento). El problema de la asignacin, es encontrar un esquema de asignacin o ubicacin que minimiza la funcin de costo combinada. Rendimiento: La estrategia de asignacin se disea para mantener una mtrica de rendimiento. Las dos mtricas ms utilizadas son el tiempo de respuesta y el "throughput" (nmero de trabajos procesados por unidad de tiempo). Asignacin de fragmentos Asignacin Proceso mediante el cual se decide donde se ubicaran los fragmentos de la etapa anterior y si se harn replicas de los mismos. Hacer replicas tiene sentido por: Confiabilidad: Mayor seguridad ante perdida de datos Disponibilidad: Mayor tolerancia a fallos ante cadas de los computadores
Aumento del paralelismo: Mayor eficiencia en las consultas de lectura al posibilitarse su descomposicin en subconsultas y la paralizacin de stas.
Pero presenta los inconvenientes de las consultas de escritura, que conllevan la actualizacin de todas las copias de la red. En la prctica: Sopesar lecturas vs escrituras Mas escrituras que lecturas: No replicamos.
Segn el grado de replicacin, distinguimos entre: BD fragmentada: Fragmentos disjuntos, cada uno en un nodo (no hay replicas) BD totalmente replicada: Se encuentra una copia de toda la BD en cada nodo BD parcialmente replicada: Mezcla las anteriores. Algunos fragmentos estn replicados. Como se ve las tcnicas de fragmentacin y replicacin se combinan en la prctica. Replicacin de fragmentos El problema de la replicacin de segmentos asignacin consiste en la determinacin de que fragmentos se replicarn en diferentes sitios a pesar de los problemas que acarrea la actualizacin. Existen tres tipos de fragmentacin la horizontal, la vertical y la mixta 1.-Fragmentacin Horizontal Una tabla T se divide en subconjuntos, T1, T2,...Tn. Los fragmentos se definen a travs de una operacin de seleccin y su reconstruccin se Realizar con una operacin de unin de los fragmentos componentes. Cada fragmento se sita en un nodo. Pueden existir fragmentos no disjuntos: combinacin de Fragmentacin y replicacin. 2.-Fragmentacin Vertical Una tabla T se divide en subconjuntos, T1, T2,...Tn. Los fragmentos se definen a travs de una operacin de proyeccin. Cada fragmento debe incluir la clave primaria de la tabla. Su reconstruccin se realizar con una operacin de join de los fragmentos componentes, pueden existir fragmentos no disjuntos: combinacin de fragmentacin y replicacin. 3.-Fragmentacin Mixta Como el mismo nombre indica es una combinacin de las dos anteriores vistas he aqu un ejemplo a partir de una tabla fragmentada horizontalmente. 3.-REPLICA Y FRAGMENTACIN Las tcnicas de rplica y fragmentacin se pueden aplicar sucesivamente a la misma relacin de partida. Un fragmento se puede replicar y a su vez esa rplica ser fragmentada, para luego replicar alguno de esos fragmentos
DISTRIBUCIN DE LOS DATOS Una de las decisiones ms importantes que el diseador de bases de datos distribuidas debe tomar es el posicionamiento de la data en el sistema y el esquema bajo el cul lo desea hacer. Para esto existen cuatro alternativas principales: centralizada, replicada, fragmentada, e hbrida. Centralizada Es muy similar al modelo de Cliente/Servidor en el sentido que la BDD est centralizada en un lugar y los usuarios estn distribuidos. Este modelo solo brinda la ventaja de tener el procesamiento distribuido ya que en sentido de disponibilidad y fiabilidad de los datos no se gana nada. Replicadas El esquema de BDD de replicacin consiste en que cada nodo debe tener su copia completa de la base de datos. Es fcil ver que este esquema tiene un alto costo en el almacenamiento de la informacin. Debido a que la actualizacin de los datos debe ser realizada en todas las copias, tambin tiene un alto costo de escritura, pero todo esto vale la pena si tenemos un sistema en el que se va a escribir pocas veces y leer muchas, y dnde la disponibilidad y fiabilidad de los datos sea de mxima importancia. Particionadas Este modelo consiste en que solo hay una copia de cada elemento, pero la informacin est distribuida a travs de los nodos. En cada nodo se aloja uno o ms fragmentos disjuntos de la base de datos. Como los fragmentos no se replican esto disminuye el costo de almacenamiento, pero tambin sacrifica la disponibilidad y fiabilidad de los datos. Algo que se debe tomar en cuenta cuando se desea implementar este modelo es la granularidad de la fragmentacin. La fragmentacin se puede realizar tambin de tres formas: Horizontal: Los fragmentos son subconjuntos de una tabla (anlogo a un restringir) Vertical: Los fragmentos son subconjuntos de los atributos con sus valores (anlogo a un proyectar) Mixto: Se almacenan fragmentos producto de restringir y proyectar una tabla. Una ventaja significativa de este esquema es que las consultas (SQL) tambin se fragmentan por lo que su procesamiento es en paralelo y ms eficiente, pero tambin se sacrifica con casos especiales como usar JUNTAR o PRODUCTO, en general casos que involucren varios fragmentos de la BDD.
Para que una fragmentacin sea correcta esta debe cumplir con las siguientes reglas: Debe ser Completa: Si una relacin R se fragmenta en R1,R2, ... , Rn, cada elemento de la data de R debe estar en algn Ri. Debe ser Reconstruirle: Debe ser posible definir una operacin relacional que a partir de los fragmentos obtenga la relacin. Los fragmentos deben ser Disjuntos: Si la fragmentacin es horizontal entonces si un elemento e est en Ri este elemento no puede estar en ningn Rk (para k distinto a i). En el caso de fragmentacin vertical es necesario que se repitan las llaves primarias y esta condicin solo se debe cumplir para el conjunto de atributos que no son llave primaria. Hbrida Este esquema simplemente representa la combinacin del esquema de particin y replicacin. Se particiona la relacin y a la vez los fragmentos estn selectivamente replicados a travs del sistema de BDD. Criterios para escoger la distribucin Localidad de la data: la data debera ser colocada donde sta se accede ms seguido. El diseador debe analizar las aplicaciones y determinar como colocar la data de tal forma que se optimicen los accesos a la data locales. Fiabilidad de la data: Almacenando varias copias de la data en lugares geogrficamente apartados se logra maximizar la probabilidad de que la data va a ser recuperable en caso de que ocurra dao fsico en cualquier sitio. Disponibilidad de la data: como en la fiabilidad, almacenar varias copias asegura que los usuarios tengan a su disponibilidad los elementos de la data, an si el nodo al que usualmente acceden no est disponible o falla. Capacidades y costos de almacenamiento: a pesar de que los costos de almacenamiento no son tan grandes como los de transmisin, los nodos pueden tener diferentes capacidades de almacenamiento y procesamiento. Esto se debe analizar cuidadosamente para determinar donde poner la data. El costo de almacenamiento se disminuye significativamente minimizando la cantidad de copias de la data. Distribucin de la carga de procesamiento: una de las razones por la cual se escoge un sistema de BDD es porque se desea poder distribuir la carga de procesamiento para hacer este ms eficiente. Costo de comunicacin: el diseador debe considerar tambin el costo de usar las comunicaciones de la red para obtener data. Los costos de comunicacin
se minimizan cuando cada sitio tiene su propia copia de la data, por otro lado cuando la data es actualizada se debe actualizar en todos los nodos. Uso del sistema: debe tomarse en consideracin cual ser el tipo principal de uso del sistema de BDD. Factores como la importancia en la disponibilidad de la data, la velocidad de escritura y la capacidad de recuperacin de daos fsicos deben tomarse en cuenta para escoger el esquema correcto. Seguridad Desde hace ya varios aos las bases de datos son ampliamente utilizadas en departamentos de gobiernos, empresas comerciales, bancos, hospitales, etc. Actualmente se est cambiando el esquema bajo el cul se utilizan las bases de datos, ya no son utilizadas nicamente de forma interna, sino que se tiene muchos accesos externos de tipos distintos. Estos cambios que se han introducido en el uso de las bases de datos ha creado la necesidad mejorar las prcticas de seguridad ya que el ambiente ya no es tan controlado como el esquema antiguo. Conceptos Los problemas de mayor importancia en seguridad son autenticacin, identificacin, y refuerzo de los controles de acceso apropiados. El sistema de seguridad de niveles mltiples. ste consiste en muchos usuarios con distintos niveles de permisos para una misma base de datos con informacin de distintos niveles. En las bases de datos distribuidas se han investigado dos acercamientos a este modelo: data distribuida y control centralizado, y data y control distribuidos. En el acercamiento de data distribuida y control centralizado se divide en dos soluciones: particionado y replicado. En el primero de estos lo que se tiene es un conjunto de nodos y cada uno de ellos opera a cierto nivel de seguridad, as el usuario con nivel de permisos X accede al servidor que maneja la data para X. El replicado surgi debido a que si alguien con altos derechos de seguridad deseaba consultar data con de bajo nivel de seguridad deba enviar su peticin a un servidor de bajo nivel de seguridad por lo cual se podra divulgar informacin sensible. En el esquema replicado entonces la data se repite en cascada de tal forma que el nivel ms alto tiene una copia entera de la base de datos, y el ms bajo solamente la informacin de ms bajo nivel. El otro acercamiento de data y control distribuido cada nodo contiene informacin de distintos niveles y est diseado para aceptar peticiones de cualquier nivel de usuario. El problema de inferencia El problema de inferencia consiste en usuarios tratando de ejecutar consultas sobre la BD y estos infiriendo informacin sobre la respuesta legtima que la
base de datos debe responder. Las herramientas para minera de datos hacen este problema an ms peligroso ya que hacen que sea ms fcil para cualquier novato poder deducir patrones e informacin importantes de simplemente probar consultas.]Tipos de arquitecturas/implementaciones En un sistema de bases de datos distribuidas, existen varios factores que deben tomar en consideracin que definen la arquitectura del sistema: Distribucin: Los componentes del sistema estn localizados en la misma computadora o no. Heterogeneidad: Un sistema es heterogneo cuando existen en l componentes que se ejecutan en diversos sistemas operativos, de diferentes fuentes, etc. Autonoma: Se puede presentar en diferentes niveles, los cuales se describen a continuacin: Autonoma de diseo: Habilidad de un componente del sistema para decidir cuestiones relacionadas a su propio diseo. Autonoma de comunicacin: Habilidad de un componente del sistema para decidir como y cuando comunicarse con otros SGBD (Sistema Gestor de Bases de Datos). Autonoma de ejecucin: Habilidad de un componente del sistema para ejecutar operaciones locales como quiera. Multi base de datos distribuida Cuando una base de datos distribuida es muy homognea se dice que es multi base de datos distribuida. Base de datos Federada Cuando una base de datos distribuida tiene mucha autonoma local se dice que es federada. Objetivos de implementacin Al implementar una base de datos distribuida se tienen ciertos objetivos comunes: Transparencia de ubicacin. Permite a los usuarios tener acceso a los datos sin que tenga conocimiento de la ubicacin de stos. Se puede conseguir este nivel de transparencia al utilizar los administradores de transacciones distribuidas, los cuales son capaces de determinar la localizacin de los datos y de emitir acciones a los calendarizadores apropiados, lo cual puede ejecutarse
cuando los administradores de transacciones distribuidas poseen acceso a los directorios de localizaciones de los datos. Transparencia de duplicacin. Para que la transparencia de duplicacin sea posible, los administradores de transacciones deben traducir las solicitudes de procesamiento de transaccin en acciones para el administrador de datos. Para las lecturas el administrador de transacciones selecciona uno de los nodos que almacena los datos y ejecuta la lectura. Para optimizar el proceso, el administrador de transacciones necesita informacin sobre el rendimiento de varios nodos respecto al sitio de consulta, as podr seleccionar el nodo de mejor rendimiento. La actualizacin y escritura de datos duplicados suelen ser ms complicadas, ya que el manejador de transacciones debe emitir una accin de escritura para cada uno de los calendarizadores que almacena una copia de los datos. Transparencia de concurrencia. Cuando varias transacciones se ejecuten al mismo tiempo, los resultados de las transacciones no debern afectarse. La transparencia de concurrencia se logra si los resultados de todas las transacciones concurrentes son consistentes de manera lgica con los resultados que se habran obtenido si las transacciones se hubieran ejecutado una por una, en cualquier orden secuencial. Transparencia de fallas. Significa que a pesar de fallas las transacciones sean procesadas de un modo correcto. Frente a una falla, las transacciones deben ser atmicas, significa que se procesen todas o ninguna de ellas. Para este tipo de problemas es importante tener resguardo de la base de datos, y as poder restaurarla cuando sea conveniente. El sistema debe detectar cundo falla una localidad y tomar las medidas necesarias para recuperarse del fallo. El sistema no debe seguir utilizando la localidad que fall. Por ltimo, cuando se recupere o repare esta localidad, debe contarse con mecanismos para reintegrarla al sistema con el mnimo de complicaciones. Localidad del procesamiento. Los datos se deben distribuir lo ms cerca posible de las aplicaciones que los usan para maximizar la localidad del procesamiento, este principio responde a minimizar el acceso remoto a los datos. Disear una distribucin que maximice localidad del procesamiento puede hacerse aadiendo la cantidad de referencias locales y remotas correspondientes a cada fragmentacin candidata y asignar la fragmentacin eligiendo la mejor solucin. Independencia de configuracin. La independencia de configuracin permite aadir o remplazar hardware sin tener que cambiar componentes de software existentes en el sistema de base de datos distribuida. Particionado de la Base de Datos. La base de datos se distribuye de modo que no haya solapamiento o duplicacin de los datos mantenidos en las diferentes localidades, como no hay duplicaciones de los datos, se evitan los costos
asociados con el almacenamiento y mantenimiento de datos redundantes. Si un mismo segmento de datos se usa en ms de una localidad se ve limitada la disponibilidad de los datos. La fiabilidad tambin puede verse limitada cuando se produce un fallo en el sistema de clculo de una localidad se afecta la disponibilidad de los datos de esa localidad no estn disponible para los usuarios en cualquier parte del sistema. Fragmentacin de datos. Consiste en subdividir las relaciones y distribuirlas entre los sitios de la red, tiene como objetivo buscar formas alternativas de dividir una las instancias (tablas) de relaciones en otras ms pequeas. La fragmentacin se puede realizar por tuplas individuales (fragmentacin horizontal), por atributos individuales fragmentacin vertical) o una combinacin de ambas (fragmentacin hbrida). El principal problema de la fragmentacin radica en encontrar la unidad apropiada de distribucin. Una relacin no es una buena unidad por muchas razones. Normalmente las vistas de una relacin estn formadas por subconjuntos de relaciones. Adems, las aplicaciones acceden localmente a subconjuntos de relaciones. Por ello, es necesario considerar a los subconjuntos de relaciones como unidad de distribucin. Al descomponer de una relacin en fragmentos, tratados cada uno de ellos como una unidad de distribucin, permite el proceso concurrente de las transacciones. El conjunto de estas relaciones, provocar la ejecucin paralela de una consulta al ser dividida en una serie de subconsultas que operar sobre los fragmentos. Cuando las vistas definidas sobre una relacin son consideradas como unidad de distribucin que se ubican en diferentes sitios de la red, podemos optar por dos alternativas diferentes: La relacin no estar replicada y se almacena en un nico sitio, o existe rplica en todos o algunos de los sitios en los cuales reside la aplicacin. Las consecuencias de esta estrategia son la generacin de un volumen de accesos remotos que pueden ser innecesarios con un mal manejo de estas replicas. Adems, las rplicas innecesarias pueden causar problemas en la ejecucin de las actualizaciones y puede no ser deseable si el espacio de almacenamiento est limitado. Los inconvenientes de la fragmentacin estn dados en que si las pueden estar definidas por fragmentos mutuamente exclusivos y al recuperar los datos de dos fragmentos situados en sitios diferentes es necesario trasmitir los datos de un sitio a otro y realizar sobre ellos la operacin de unin (Join), lo cual puede ser costoso. El control semntico cuando los atributos implicados en una dependencia una relacin se descompone en diferentes fragmentos y estos se ubican en sitios diferentes puede ser muy costos porque es necesario hacer bsquedas en un gran nmero de sitios.
INTRODUCCIN
Las bases de datos se ingeniaron gracias a la necesidad de las grandes empresas de almacenar ingentes cantidades de informacin de una forma rpida, sencilla y fiable, y que a su vez pudieran acceder a ella en cualquier momento sin necesidad de desplazarse a salas dedicadas a archivar documentacin, como hasta hace poco se venia haciendo. Cuando comenz el despegue de los programas informticos se empezaron a almacenar datos en los archivos de los programas, lo cual era ms cmodo pero aun as tenan grandes dificultades a la hora de querer modificar registros, estructuras o simplemente buscar informacin. A finales de los aos sesenta nacen las bases de datos. En estas bases de datos se guardan los datos utilizados por los usuarios, empresas, etc. Y los programas que los utilizan no se tienen que preocupar de su mantenimiento ni almacenaje por lo que un cambio en la base de datos no tiene por qu afectar en principio a los programas que la utilizan. Como definicin de base de datos entendemos que se trata de un conjunto de datos interrelacionados y almacenados sin redundancias innecesarias, los cuales sirven a las aplicaciones sin estar relacionados de una manera directa entre ellos. Una base de datos puede ser utilizada por varias aplicaciones y usuarios. Toda base de datos debe permitir insertar, modificar y borrar datos por lo que en las bases de datos se guarda informacin de dos tipos:
CONCLUSIONES A lo largo de la historia hemos modificado informacin de modo manual, esto era complicado, ya que las empresas deban tener mucho cuidado con la informacin y manipulacin de la misma, ya sea archivando o guardando en grandes cantidades de papelera, es as que surge la idea de implementar un sistema el cual almacenara con demasa informacin importante, entre todos estos mbitos, la base de datos a pesar de almacenar mucha informacin, es capaz de poder distinguir entre muchos tipos y relacionarlas con dems, es as que concluimos en que las base de datos son muy importantes ya que sin ellas seria mucho mas difcil la bsqueda de informacin , mas tardada y mucho mas inexacta, es importante conocerlas, que tipos de archivos manejan, cuales son los lenguajes de programacin que los acompaa y como podemos manipular una base de datos muy extensa as como la construccin de la misma.
BIBLIOGRAFIA
http://www.iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf http://carlosjacobo.wordpress.com/fragmentacion/ http://msdn.microsoft.com/es-es/library/ms183524.aspx

Diccionario de Bases de Datos

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Diccionario de Bases de Datos

Uploaded by

Copyright:

Available Formats

DICCIONARIO DE BASES DE DATOS Concepto Un diccionario de datos es un conjunto de metadatos que contiene las caractersticas lgicas y puntuales de los

La unidad de fragmentacin ideal no es la tabla sino una subdivisin de sta.

http://www.iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf http://carlosjacobo.wordpress.com/fragmentacion/ http://msdn.microsoft.com/es-es/library/ms183524.aspx

You might also like