You are on page 1of 28

BASES DE DATOS

MULTIDIMENSIONALES
INTRODUCCIÓN

• La gran cantidad de datos heterogéneos acumulados por las


organizaciones representa una de las razones por las que las
empresas necesitan una tecnología que les permita realizar
rápidamente un análisis complejo sobre estos datos. Debido a que
las bases de datos relacionales son ineficaces, desde este punto de
vista se requiere un nuevo concepto, el concepto de base de datos
multidimensional.

• Cada año se acumula un gran volumen de información en cualquier


organización. Los responsables de los diferentes departamentos
deben elaborar periódicamente informes que sinteticen la
información acumulada en distintos periodos y para facilitar esa
labor se debe diseñar una base de datos multidimensional dónde se
almacene esta información para agilizar su actividad.
BASE DE DATOS MULTIDIMENSIONAL

• La base de datos multidimensional es una tecnología muy popular cuando


hablamos de Business Intelligence. Permite a una empresa llevar a cabo análisis
estratégico en profundidad teniendo en cuenta una gran variedad de factores que
afectan a la empresa.
• Permite que se puedan aprovechar los conocimientos en herramientas con las
que ya se suele estar familiarizado, como Microsoft Excel, para trabajar y analizar
los datos de dicha base de datos multidimensional mediante lo que se conoce
como “slice and dice”, lo que podría traducirse como rebanadas y cubos de datos,
y que viene a indicar la facilidad con la que se pueden dividir y cortar los datos
para su estudio teniendo en cuenta diferentes variables o dimensiones.
BASE DE DATOS MULTIDIMESIONALES

• Una base de datos multidimensional representa un tipo de base de datos


donde los datos se almacenan en celdas y cada posición de celda está
definida por una serie de variables denominadas dimensiones. Cada celda
significa un evento de negocio y los valores de dimensiones indican el
momento y el lugar donde ocurre el evento. Puedes encontrarlo con
diferentes sinónimos como cubo, hipercubo, cubo OLAP, base de datos OLAP
o almacén de datos multidimensional. Aunque lógicamente una base de
datos multidimensional se parece a un cubo, físicamente se almacena como
una matriz multidimensional comprimida con posicionamiento offset.
BASE DE DATOS MULTIDIMENSIONALES
• Las bases de datos multidimensionales se crean con frecuencia usando entradas de las bases
de datos relacionales existentes. Mientras que a una base de datos relacional se accede
normalmente mediante una consulta de Lenguaje de Consulta Estructurado (SQL), una base
de datos multidimensional permite a un usuario hacer preguntas como: "¿Cuántas Aptivas se
han vendido en Nebraska en lo que va del año?" y cuestiones similares relacionadas a
resumir operaciones y tendencias de negocios. A una aplicación OLAP que accede a los datos
desde una base de datos multidimensional se le conoce como una aplicación MOLAP (OLAP
multidimensional).
VENTAJAS

Una base de datos multidimensional presenta varias ventajas:


• Utiliza un espacio en disco menor porque está comprimido y no utiliza la indexación para buscar datos.
• Tiene mejores prestaciones sirviendo necesidades al usuario ya que los datos agregados son
precalculados y el formato de almacenamiento reduce el número de operaciones de entrada y salida.
• Garantiza un rendimiento superior porque se modelan teniendo en cuenta sólo los requisitos de un
solo grupo de usuarios.
• Soporta un acceso, directo, eficiente y rápido a los datos.
DESVENTAJAS

• El tiempo de procesamiento de los datos es alto ya que los datos agregados deben recalcularse cuando
se actualizan las fuentes de datos operacionales.
• La escalabilidad disminuye a medida que aumenta el número de dimensiones o cuando la base de
datos es muy grande.
• La flexibilidad de una base de datos multidimensional es muy baja.
• El alcance del diseño es limitado, por lo tanto, a medida que aumenta el número de grupos de usuarios
cuyos requerimientos deben ser tomados en cuenta, el modelo corre el riesgo de fallar.
BENEFICIOS
 Es de fácil acceso y de fácil uso, flexibles para los usuarios.
 Los datos están organizados en diferentes dimensiones lo que permite un mejor análisis.
 Ahorro generado por productividad de personas altamente profesionales.
 Permite encontrar la historia en los datos.
 Genera cierta ventaja competitiva.
TÉRMINOS Y FUNCIONAMIENTO BÁSICO DE UNA BASE DE
DATOS MULTIDIMENSIONAL

OLTP
• El primer término es el de procesamiento de transacciones online comúnmente conocido como OLTP.
Como su nombre indica, consiste en sistemas basados en transacciones, los cuales frecuentemente
utilizan una base de datos relacional como almacén de datos. Los sistemas OLTP suelen centrarse en
tiempos de respuesta rápida y necesidades de servicio inmediatas.
• Un buen ejemplo de un sistema OLTP es un cajero automático. Cuándo vas a retirar dinero del cajero
automático no estás realmente interesado en analizar un montón de datos. Estás allí sólo para hacer
una retirada de dinero y terminar para que la siguiente persona que espera pueda completar también
su transacción. El sistema OLTP facilita estos procesos.
OLAP
• Esto nos lleva a otro término conocido como OLAP, que nos ayuda con el procesamiento analitico
online. El enfoque OLAP se centra en el análisis de datos, y típicamente los datos provienen de los
sistemas OLTP. Esto no quiere decir que la tecnología OLAP sea más lenta que la tecnología OLTP, sino
que los dos se centran en cosas completamente diferentes. OLTP se enfoca en hacer el trabajo y OLAP
en analizar los resultados del trabajo.
• Un sistema OLTP puede tener miles de millones de registros por lo que intentar ejecutar informes en un
sistema OLTP es malo ya que podríamos ralentizarlo o hacer que deje de funcionar. Los sistemas OLTP
suelen ser de misión crítica para el negocio y no es conveniente sobrecargarlos.
TIPOS DE OLAP

• Tradicionalmente los sistemas OLAP se clasifican en las siguientes categorías:


ROLAP
La implementación OLAP almacena los datos en un botón relacional llamado ROLAP los datos
son detallados evitando las agregaciones y las tablas que se encuentran normalizadas, los
esquemas más comunes son de estrella y copo de nieve aunque es posible de trabajar sobre
cualquier base de datos relacional. La arquitectura de esta se compone de un servidor de banco
de datos relacional y el botón OLAP se encuentra en el servidor dedicado. La principal ventaja de
esta arquitectura es que permite el análisis de una enorme cantidad de datos.

La arquitectura ROLAP excede a los datos relacionados para proporcionar los análisis OLAP. La
primicia de los sistemas ROLAP es que las capacidades OLAP se ejecutan mejor contra las bases
de datos relacionales.
ROLAP
Las respuestas a las consultas ROLAP suelen ser más lentas que las que se realizan con MOLAP u HOLAP.
Normalmente, ROLAP se utiliza para tener acceso a grandes conjuntos de datos que se consultan con poca
frecuencia, por ejemplo, datos históricos menos recientes.

Utiliza una arquitectura de tres niveles:


• Nivel Base De Datos: Usa base de datos relacionales para el manejo, acceso y obtención de datos.
• Nivel de Aplicación: Ejecuta las consultas multidimensionales de los usuarios.
• Motor Rolap: Se integra con niveles de presentación atreves de los cuales los usuarios realizan un
análisis OLAP.
• Esta metodología se basa en la manipulación de los datos almacenados en la base de datos
relacional para dar la apariencia de la funcionalidad tradicional de cortar y cortar en cubitos
de OLAP. En esencia, cada acción de cortar y cortar en cubitos equivale a agregar una cláusula
"DONDE" en la declaración de SQL.

VENTAJAS

• Puede manejar grandes cantidades de datos: la limitación de tamaño de datos de la


tecnología ROLAP es la limitación en el tamaño de los datos de la base de datos relacional
subyacente. En otras palabras, ROLAP no pone ninguna limitación en la cantidad de datos.
• Puede aprovechar funcionalidades inherentes a la base de datos relacional: a menudo, la
base de datos relacional ya viene con una gran cantidad de funcionalidades. Las tecnologías
ROLAP, ya que se encuentran en la parte superior de la base de datos relacional, pueden
aprovechar estas funcionalidades.
DESVENTAJAS :

• El rendimiento puede ser lento: dado que cada informe ROLAP es esencialmente una consulta SQL (o varias
consultas SQL) en la base de datos relacional, el tiempo de consulta puede ser largo si el tamaño de los datos
subyacentes es grande.
• Limitado por las funcionalidades de SQL: como la tecnología ROLAP depende principalmente de generar
sentencias SQL para consultar la base de datos relacional, y las sentencias SQL no se ajustan a todas las
necesidades (por ejemplo, es difícil realizar cálculos complejos usando SQL), las tecnologías ROLAP
tradicionalmente están limitadas por lo que SQL puede hacer. Los proveedores de ROLAP han mitigado este
riesgo incorporando las funciones complejas de la herramienta, así como la capacidad de permitir a los
usuarios definir sus propias funciones.
MOLAP
Esta almacena los datos de una base de datos multidimensional. Para utilizar los tiempos de respuesta,
hacer resúmenes de información calculados por adelantado y un sinfín de operaciones utilizadas de forma
multidimensional para proporcionar el análisis su principal premisa es que OLAP esta mejor implantado
almacenando los datos multidimensionales.
• El sistema MOLAP utiliza una arquitectura de 2 niveles
• La base de datos multidimensional
• El motor analítico.

El almacenamiento OLAP multidimensional (MOLAP) proporciona el tiempo más rápido de respuesta a


consultas, dependiendo sólo del porcentaje y diseño de las agregaciones del cubo. En general, MOLAP es
más apropiado para cubos de uso frecuente y que necesitan tiempos de respuesta muy cortos.
VENTAJAS

• Excelente rendimiento: los cubos MOLAP están diseñados para una recuperación de datos rápida y son óptimos
para las operaciones de rebanado y corte.
• Puede realizar cálculos complejos: todos los cálculos se generaron previamente cuando se creó el cubo. Por lo
tanto, los cálculos complejos no solo son factibles, sino que regresan rápidamente.
DESVENTAJAS

• Limitado en la cantidad de datos que puede manejar: dado que todos los cálculos se realizan cuando se
crea el cubo, no es posible incluir una gran cantidad de datos en el mismo cubo. Esto no quiere decir
que los datos en el cubo no puedan derivarse de una gran cantidad de datos. De hecho, esto es
posible. Pero en este caso, solo se incluirá información de nivel de resumen en el cubo mismo.
• Requiere una inversión adicional: la tecnología de cubo a menudo es propietaria y no existe en la
organización. Por lo tanto, para adoptar la tecnología MOLAP, es probable que se necesiten inversiones
adicionales en recursos humanos y de capital.
HOLAP
• Un desarrollo un poco más reciente ha sido la solución OLAP híbrida (HOLAP), la cual combina las
arquitecturas ROLAP y MOLAP para brindar una solución con las mejores características de ambas:
desempeño superior y gran escalabilidad. Un tipo de HOLAP mantiene los registros de detalle (los
volúmenes más grandes) en la base de datos relacional, mientras que mantiene las agregaciones en un
almacén MOLAP separado.
• Los cubos almacenados como HOLAP tienen un tamaño menor que los cubos MOLAP equivalentes y
responden con mayor rapidez que los cubos ROLAP a consultas relativas a datos de resumen. El
almacenamiento HOLAP suele ser adecuado para cubos que requieren tiempos cortos de respuesta
para consultas realizadas en resúmenes basados en grandes cantidades de datos base.
CUBO

Un cubo es una estructura de datos organizada mediante jerarquías. Cada indicador se puede evaluar en
cualquiera de los niveles de las jerarquías. Así, por ejemplo, se pueden obtener las "ventas" a nivel diario,
mensual, o a anual, para un cliente, una provincia, o un país…
EL USO DE CUBOS OLAP TIENE DOS VENTAJAS FUNDAMENTALES:

• Facilidad de uso. Una vez construido el cubo, el usuario


de negocio puede consultarlo con facilidad, incluso si se
trata de un usuario con escasos o nulos conocimientos
técnicos. La estructura jerárquica es sumamente fácil de
comprender para la mente humana, y si ésta coincide
con el modelo de negocio, los resultados suelen ser
espectaculares, ya que el cubo se convierte en una gran
"tabla dinámica" que el usuario puede consultar en
cualquier momento.
• Rapidez de respuesta. Habitualmente, el cubo tiene pre calculados las distintas agregaciones,
por lo que los tiempos de respuesta son muy cortos. Si el cubo está bien diseñado, resultará
igual de rápido consultar las ventas de una ciudad, o las ventas de todo el país, o incluso el
total de ventas de la compañía.
SIN EMBARGO, NO TODO SON VENTAJAS… ESTOS SON ALGUNOS DE
LOS INCONVENIENTES:

• El cubo es estructura adicional de datos que mantener y actualizar, eso supone un gasto extra
de recursos (servidores, discos, procesos de carga…).
• El modelo de negocio no siempre se adapta bien en un modelo jerárquico.
¿CUÁLES SON LOS COMPONENTES DE UN CUBO?

Un cubo en un origen de datos multidimensionales tiene estos componentes:


• Una medida, que es el nombre proporcionado a los datos.
• Una o varias dimensiones. Dimensión es el nombre proporcionado a las partes del cubo que
clasifican los datos, como Producto, Geografía y Tiempo. Las dimensiones tienen miembros,
jerarquías y atributos.
¿QUÉ SON LAS MEDIDAS?

Las medidas representan los datos que se pueden examinar y analizar en


matrices y gráficos. Como ejemplos se incluyen Ventas, Costo y Beneficio.
DIMENSIONES
• Las Dimensiones son categorías descriptivas por los cuales los datos numéricos (Las
Mediciones) en un cubo, son separados para su análisis.

• Una dimensión puede ser creada para usarse en un cubo individual o en múltiples cubos. Una
dimensión creada para un cubo individual, es llamada dimensión privada. Por el contrario si
esta puede ser usada por múltiples cubos, se le llama dimensión compartida. Estas podrán
ser usadas dentro de todo cubo, en la base de datos, así se optimiza el tiempo y se evita el
andar duplicando dimensiones privadas.
¿QUÉ SON LAS JERARQUÍAS DE DIMENSIÓN?

Una jerarquía de dimensión describe la relación jerárquica entre dos o más miembros de la dimensión.
Los miembros de la dimensión pueden estar relacionados unos con otros de forma jerárquica. Por ejemplo,
un día concreto pertenece a un mes concreto que, a su vez, está dentro de un año concreto. Para reflejar
tales relaciones, los miembros de la dimensión se organizan en jerarquías de dimensión.
Una jerarquía de dimensión es una estructura lógica que utiliza niveles ordenados para organizar y agregar
datos. Por ejemplo, la dimensión Tiempo podría tener una jerarquía para agregar datos desde el nivel Mes
hasta el nivel Trimestre y el nivel Año.
¿QUÉ SON LOS ATRIBUTOS DE DIMENSIÓN?

• Un atributo de dimensión describe una característica que comparten los miembros de la


dimensión. Los atributos de dimensión permiten seleccionar datos según características
similares. Por ejemplo, una dimensión Producto podría tener un atributo Color que le
permite buscar todos los productos de color rojo.

You might also like