Professional Documents
Culture Documents
GRIDS
Introduccin
Qu es una base de datos?
Un conjunto de datos no redundantes, almacenados en un soporte informtico, organizados de forma independiente de su utilizacin y accesibles simultneamente por distintos usuarios y aplicaciones. Un conjunto de datos relacionados almacenados de forma persistente.
Las bases de datos son necesarias cuando el volumen o la organizacin de los datos hace imposible un seguimiento a mano de los mismos por el usuario. Si bien hay aplicaciones grid que tienen poca o ninguna necesidad de acceso a base de datos, el uso de aplicaciones cada vez ms complejas ha hecho que cada vez estn ms presentes en este entorno.
Una BD nunca se accede o manipula directamente sino a travs del SGBD. Se puede considerar al SGBD como el interfaz entre el usuario y la BD. Se pueden considerar tres niveles:
Externo. Lgico. Interno.
Problemas:
Redundancia de la informacin. Borrado en cascada.
Red.
Evita el problema de redundancia con conectores.
Propiedades ACID
Las bases de datos con transacciones deben implementar estas de tal manera que se cumplan las siguientes propiedades: Atomicity (atomicidad): las operaciones de una transaccin
son o bien completadas con xito o bien abortadas (la base de datos queda en su estado anterior).
El modelo relacional
Desarrollado por E. F. Codd a finales de los sesenta. Es el ms extendido hoy en da. Motivos de su xito:
ofrecen sistemas simples y eficaces para representar y manipular los datos se basan en un modelo, el relacional, con slidas bases tericas (matemticas): lgebra y teora de conjuntos.
La estructura fundamental es la relacin o tabla. SQL es el lenguaje que se utiliza para manejar este tipo de bases de datos.
Estndar ANSI (1986), ISO (1987). Versin actual SQL92. Aunque la mayora de las bases de datos solo implementan el entry level. Sirve para realizar tanto operaciones en los datos (DML) como en su estructura (DDL).
El modelo objeto-relacional que hoy implementan las compaas ms importantes (IBM, Microsoft y Oracle) es una extensin del mismo.
Debe ser estandarizado en parte con la adopcin especificacin SQL3 (SQL1999).
Normalizacin
El proceso de normalizacin es un estndar que consiste, bsicamente, en un proceso de conversin de las relaciones entre las entidades, evitando:
La redundancia de los datos: repeticin de datos en un sistema. Anomalas de actualizacin: inconsistencias de los datos como resultado de datos redundantes y actualizaciones parciales. Anomalas de borrado: prdidas no intencionadas de datos debido a que se han borrado otros datos. Anomalas de insercin: imposibilidad de adicionar datos en la base de datos debido a la ausencia de otros datos.
Tipos de datos definidos por el usuario. Jerarquas de tablas. Funciones sobrecargadas. Implementaciones comerciales:
IBM DB2 Informix Universal Server (IDS 9.x) Oracle 8i, muchas nuevas caractersticas en 9i.
Open Source:
PostgresSQL
Hoy en da los proyectos Grid tambin contemplan compartir otros recursos como instrumentos de medida.
Tipos de metadata
Tcnico
Localizacin, esquema fsico, caractersticas de los datos, propietario, versin, mtodos de acceso. Capacidades de las bases de datos.
Contextual
Esquema lgico, clasificaciones, terminologas, ontologas, datos derivados.
Mapeo de esquema
Evolucin y conversin del esquema
Proyectos:
MCAT (SRB) Spitfire (EDG)
TOPOLOGIA
Registry GDSR
Database
(Xindice, MySQL Oracle, DB2)
Futuro
Migracin a web/grid services Nuevos casos de uso:
Queries distribuidas en grid
Aplicaciones grid que accedan directamente a bases de datos Adaptacin a grid de bases de datos existentes:
Oracle 10g IBM DB2 v8.1 MySQL (open source) (autentificacin GSI en 4.1) Ser posible mantener una infraestructura estndar?