Se necesitan herramientas para ayudar a la migracin y a la
transformacin de los datos hacia el almacn. Una vez construido, se requieren medios para manejar grandes volmenes de informacin. Se disea su arquitectura dependiendo de la estructura interna de los datos del almacn y especialmente del tipo de consultas a realizar. Con este criterio los datos deben ser repartidos entre numerosos data marts. Es necesario hacer un estudio de algunos temas generales de la organizacin o empresa, como: Situacin actual de partida: Cualquier solucin propuesta debe estar orientada por las necesidades del negocio y debe ser compatible con la arquitectura. Tipo y caractersticas del negocio Entorno tcnico: incluye tanto el aspecto del hardware as como aplicaciones y herramientas. Expectativas de los usuarios Etapas de desarrollo: el desarrollo de un modelo conceptual Prototipo: simulaciones Piloto: primeros resultados Prueba del concepto tecnolgico A partir de esta arquitectura, consideramos que en el desarrollo de un almacn de datos se puede estructurar en un marco integrado por 5 etapas y 3 niveles. - 5 etapas: 1. .Origen (Source) : Las fuentes de datos externos, OLTP 2. .Integracin (Integration): Define el mapeo entre los orgenes de datos y el propio almacn de datos. 3. .Almacn de datos (Data Warehouse): Define la estructura de almacn de datos. 4. .Adaptacin (Customization): Define el mapeo. 5. .Cliente (Client): Define las estructuras concretas que son empleadas por los clientes. - 3 niveles: 1. .Conceptual: Define el almacn de datos desde el mayor nivel de abstraccin y contiene los objetos y relaciones ms importantes. 2. .Lgico: Definicin de tablas, claves, procesos de ETL, etc. 3. .Fsico: el almacenamiento de las estructuras lgicas en diferentes discos o configuracin de los servidores. DISEO DE ESQUEMAS: 1. 1 Aislar los datos en tener en cuenta: esquemas de las tablas de hechos. 2. 2 Definir las dimensiones: Ejes de anlisis. 3. Estandizar dimensiones: dividir en varias tablas unidas por las restricciones de referencia. 4. Integrar todo: varias tablas de hechos comparten algunas tablas de dimensiones (constelacin de estrellas) Tipos de esquemas: - Copo de nieve: El esquema de copo de nieve consta de una tabla de hechos que est conectada a muchas tablas de dimensiones, que pueden estar conectadas a otras tablas de dimensiones a travs de una relacin de muchos a uno. Las tablas de un esquema de copo de nieve generalmente se normalizan en el tercer formulario de normalizacin. Cada tabla de dimensiones representa exactamente un nivel en una jerarqua. - Estrella: Consta de una sola tabla de hechos central que contiene los datos para el anlisis rodeados de tablas de dimensiones que tendrn siempre una clave primaria simple, minetras que ne la tabla de hechos la clave principal estar compuesta por las claves principales de las tablas dimensiones. - Constelacin: Un esquema de constelacin es una combinacin de un esquema de estrella y un esquema de copo de nieve. Los esquemas de constelacin son esquemas de copo de nieve en los que slo algunas de las tablas de dimensiones se han desnormalizado. El objetivo de los esquemas de constelacin es aprovechar las ventajas de los esquemas de estrella y de copo de nieve.