Professional Documents
Culture Documents
Nivel 01
Lección 01
Originalmente las bases de datos solo se utilizaban para guardar datos en cualquier
computadora o servidores especializados, por ejemplo, para saber cómo iban las ventas
de la empresa, quiénes eran los clientes y qué compras se hicieron durante un período
específico.
Ahora las bases de datos no solo sirven para conocer datos, sino para hacer
predicciones del comportamiento, de muchos aspectos de una organización.
Antes de llegar al análisis de los datos, hay que dejarlos listos para ser analizados,
para ello, el administrador de bases de datos aplica metodologías de extracción de datos,
posteriormente los transforma en un repositorio de información más eficiente que permite
realizar búsquedas gracias a que la información está enfocada a un objetivo de
predicción.
Para que la extracción de la información de las bases de datos sea lo más eficiente
posible, estas deben estar normalizadas, es decir, todo proceso de modificación, debe
cumplir con las normas de la organización, de tal manera que el repositorio se alimente de
información que cumpla con el objetivo de predicción.
Se divide en:
Lenguaje de definición de datos. Sirve para crear, modificar y borrar una base de
datos, tablas y campos. Contiene las siguientes funciones básicas:
Create. Crear objetos de datos, como nuevas bases de datos, tablas, vistas,
entre otros.
Alter. Modificar la estructura de una tabla u objeto, se pueden agregar y quitar
campos en una tabla, modificar el tipo de campo, etcétera.
Drop. Elimina un objeto de la base de datos.
Truncate. Borra todo el contenido de una tabla sin eliminar a la misma.
Todos los sistemas gestores utilizan SQL para crear y manipular a las bases de datos
incluso en su interfaz gráfica.
Lección 02
Modelo relacional
Este modelo basa su lógica en las relaciones, por lo que no es muy diferente al modelo
entidad-relación, de hecho si construcción se deriva de él. Ahora las entidades son
mostradas como la abstracción de una tabla y los atributos se introducen en esta. Por lo
general, al pasar una tabla al modelo relacional, el primer atributo o campo, estará
ocupado por la llave primaria, después se pondrán las llaves foráneas y al final los demás
atributos.
La cardinalidad en este modelo se representa con líneas que relacionan dos tablas,
desde una llave primaria, hasta una llave foránea, con la siguiente simbología:
Estas cardinalidades pueden variar según el estándar que se utilice, por ejemplo, en el
estándar UML, que es el más utilizado a nivel mundial, se representan de la siguiente
manera:
De uno a uno
De uno a muchos
De muchos a muchos
De uno a cero o muchos
De muchos a cero o muchos
Para diseñar una base de datos, primero debes de concebir toda su lógica de
operación, esto se logra teniendo en claro la situación del negocio y de todos sus
procesos, por ejemplo, en la base de datos de una tienda departamental con muchas
sucursales, se tienen clientes, empleados y productos, pero además el dueño desea que
los empleados pertenezcan solo a una tienda; los clientes estén divididos por grupos de
clientes, los proveedores puedan surtir solo un producto; cada producto tenga una
categoría.
Tabla Cruzada
Las tablas cruzadas se usan cuando existe una relación de muchos a muchos, ya que
unes la tabla con una llave foránea a la otra tabla, esa misma tendría inconsistencias de
duplicidad, por ejemplo, una tabla de número de venta y otra de productos, se relacionan
con una cardinalidad de muchos a muchos, porque una venta puede tener muchos
productos y un producto puede estar en varias ventas, si la relación se hace poniendo una
llave foránea en la tabla “Número de venta”, esto supondría que puedo comprar varios
productos en la venta “0001”, pero para cada producto tendría que poner ID, número,
venta repetido y como esta es la llave primaria de la tabla rompería la primera forma
normal. Este hecho se soluciona con la creación de una tabla cruzada que relaciona a las
dos tablas anteriores y une sus llaves primarias, eliminando los problemas de duplicidad
de información.
A través de estas reglas de negocio, se distinguen seis entidades con sus llaves
primarias y se logran apreciar las siguientes relaciones:
Con los datos anteriores, estableces las relaciones, creando llaves foráneas en las
tablas principales.
Coloca los atributos restantes a cada tabla, por ejemplo, para la tabla de productos,
algunos atributos importantes son cantidad, precio o stock.
Nivel 02
Lección 01
Almacén de datos
Orientado a temas. Todos los datos deben estar relacionados respecto al tema a
analizar.
Variante en el tiempo. Los cambios de los datos en el tiempo, deben quedar
registrados para evitar pérdidas de información.
No volátil. La información no se modifica, ni se elimina, solo es de lectura.
La función del Data Warehouse es contener los datos útiles para el ambiente de
negocio y posteriormente transformarlos en información relevante, que se pueda analizar
rápidamente, de esta forma, los usuarios autorizados pueden realizar consultas, sin tocar
o afectar la operación del sistema.
Data Marts
Los data marts son bases de datos departamentales que se alimentan del Data
Warehouse, con el fin de evitar, una búsqueda exhaustiva por parte del sistema y así
recibir la información más rápido, por ejemplo, en el Data Warehouse de una tienda,
existen data marts de áreas específicas como Recursos Humanos, Ventas, Compras,
etcétera. A cada uno de estos data marts, solo acceden un número limitado de usuarios,
que se dedican al análisis de la información de un propósito específico. Para el análisis de
los data marts, se contemplan estructuras multidimensionales de datos como los cubos
relacionales que conocerás más adelante.
Esquemas de almacenes de datos
Las tablas de hechos, pueden ser vistas como una tabla cruzada de entre varias
entidades y su llave primaria queda conformada por la combinación de las llaves primarias
de las dimensiones, tener la información relevante en una tabla de hechos, hace posible
que la programación de las consultas sea más simple y rápida, ya que el sistema en vez
de ir cada tabla a buscar la información, solo va a la tabla de hechos.
Para identificar este esquema es importante que notes que solo existe una tabla de
dimensiones por dimensión.
¿Formación de dimensiones?
Toma el ejemplo de la tienda para diseñar un Data warehouse, primero identifica qué
tipo de información, va a querer analizar en el futuro el cliente, ¿cuántos productos se
vendieron?, ¿quién vendió cada uno?, ¿quién compró cada uno?, ¿cuándo ocurrió?
Dependiendo de las necesidades del proyecto, organiza la base de datos con las
siguientes etiquetas: Products, Employees, Customers. Para el Data warehouse, crea una
dimensión de tiempo que dependerá de la fecha de la orden, utilizando las entidades,
genera una tabla que combine las llaves primarias para crear la llave primaria de hechos y
después ingresar los atributos, como cantidad, costo total entre otros.
Las dimensiones se pueden formar del uso de más tablas, por ejemplo, la dimensión
de productos puede llevar la categoría de los mismos, eso significa que ahora está en
juego la tabla de Categories de la base de datos para conformar la dimensión de
productos, de esta forma se diseña un Data warehouse, más adelante, aprenderás a
utilizar un software de diseño para crear modelos relacionales de manera gráfica.
Estos esquemas logran las mismas velocidades de búsqueda que el esquema estrella,
siempre y cuando se genere una tabla por dimensión, por ejemplo, la misma persona, que
mandó hacer el Data Warehouse, ahora quiere saber cuál es el bono por mes para cada
empleado en cada uno de los territorios, con esto sabrá el rendimiento de cada empleado.
Para resolver esto toma el esquema estrella y agrega otra tabla de hechos, en esta
crea llaves primarias de las dimensiones de tiempo, producto y empleado, además crea la
dimensión geográfica, para saber el territorio de donde proviene el empleado, la segunda
tabla de hechos se llamará “Bonos por empleado” y resolverá este aspecto del negocio.
Creación de una base datos. El proceso que utiliza el software para diseñar y crear una
base de datos es el siguiente:
1. Conexión al manejador de base de datos
2. Creación de una base de datos
3. Creación de tablas y atributos
4. Relaciones entre tablas
5. Modificación de llaves primarias
Para realizar una conexión con una base de datos, sigue estos pasos:
Localiza la sección para agregar atributos ubicada en la pestaña main, haz click en el
ícono que se encuentra en el campo de name, una vez en la ventana emergente, asígnale
un nombre, selecciona el tipo de variable, selecciona primary, si necesitas que la variable
tenga la función de autoincremento, selecciona identity y presiona aceptar.
Para crear una llave primaria múltiple, sigue el mismo proceso, recuerda que en una
tabla solo puede haber un campo que se incremente, para agregar otros atributos que no
sean llaves primarias, sigue el proceso hasta el paso cuatro, cuando hayas terminado de
agregar atributos selecciona el ìcono de guardar.
Una vez que tienes las tablas creadas, solo falta crear las relaciones, para hacerlo
sigue estos pasos:
Localiza la sección de database, en la barra de herramientas y selecciona database
diagram, arrastra la base de datos hacia la área de trabajo para agregar las tablas, da
click en el ìcono de new relation para crear la relación, haz click sostenido en la tabla
adonde vaya a ir a la llave foránea y arràstralo hacia la tabla de donde venga la llave
foránea, selecciona las llaves relacionadas en la ventana emergente y haz click en update
database para finalizar, realiza este procedimiento para relacionar todas las tablas de tu
base de datos.
Hay ocasiones en las que después de haber creado una tabla se necesita modificar
una llave primaria, para poder reasignar una llave primaria:
Lección 02
Funciones de SQL
Funciones
Funciones escalares
Funciones en línea
Funciones en línea de múltiples sentencias
Funciones escalares
Para utilizar una función, solo debes crear una nueva consulta, por ejemplo, realiza una
búsqueda, escribe SELECT y los campos a utilizar de la tabla Products, para calcular el
IVA con respecto al precio por unidad, en el último campo escribe dbo punto nombre de
función y entre paréntesis, los parámetros de entrada, en este caso será UnitPrice,
después renombra a la columna con un AS, ejecuta la consulta y deberá aparecer la
columna antes nombrada con el IVA calculado para cada unidad.
SELECT ProductID, ProductName, UnitPrice, dbo. CalculoIVA (UnitPrice) AS IVA
FROM Products
Toma en cuenta que las funciones, siempre deben ejecutarse dentro de una sentencia
por ejemplo, SELECT, no se pueden ejecutar solas.
Funciones en línea
Sigue el mismo procedimiento para crear una función escalar y en lugar de BEGIN y
END, escribe RETURN, abre un paréntesis y aquí es donde se escribe el código que será
una consulta.
Como ejemplo, debes generar una función que arroje a todos los clientes de una
misma nacionalidad, para realizar esto sigue este procedimiento:
Escribe el nombre del parámetro de entrada con una arroba y el tipo de dato junto con
su longitud, en RETURNS escribe el tipo de datos table, en el código escribe la sentencia
de consulta en la tabla Customers, como es en este caso, elige los campos que vayas a
utilizar, después escribe WHERE y la operación lógica que tiene que relacionar el campo
del país en la tabla y el parámetro de entrada, ejecuta este código seleccionándolo con el
mouse y presiona ejecutar, como el retorno de la función es un dato tipo tabla, este se
llama con una instrucción SELECT, especificando el parámetro de entrada, también ten
en cuenta que no puedes utilizar sentencias como ORDER BY dentro de una función en
línea.
Son similares a las funciones en línea, excepto que el resultado está compuesto por la
ejecución de varios SELECT, por lo general, se utilizan cuando se requieren de mayor
lógica de proceso.
Para crearlas, se sigue la misma estructura que para las funciones escalares, con la
siguiente diferencia, en la parte de RETURNS debes nombrar una variable tipo tabla y
abrir paréntesis, entre los paréntesis, deberás definir las columnas de la estructura de la
tabla que quieres regresar; entre BEGIN y END, debes generar el código de la función.
Como ejemplo, debes diseñar una función que al ejecutarse, traiga la información de
cada cliente por país, para hacerlo:
Nombra la función y declara los parámetros de entrada con su tipo de dato y longitud,
en este caso, solo será el nombre del país, nombra a la variable tipo tabla y en los
paréntesis, declara las columnas de esta variable, junto con su tipo de dato y longitud, si
es más de una sepáralas con comas, en este caso será CustomerID, CompanyName,
ContactName y Country; entre BEGIN y END llevarás la variable de la tabla realizando un
INSERT a la misma, ahora realizarás un SELECT de los campos con los que deseas
llenarla, que en este caso, son los mismos de la tabla cliente, ten en cuenta que los
campos deben estar en el mismo orden que los campos de la variable tabla, finalmente
escribimos WHERE donde la columna Country, sea igual al parámetro de entrada,
después de esto escribe RETURN.
En una nueva consulta escribe CREATE TRIGGER después escribe el nombre del
mismo, escribe ON y el nombre de la tabla a la que le quieres anclar el trigger; escribe
AFTER y la o las instrucciones del DML con las que se activará el trigger, en lugar de
AFTER también puedes poner FOR, la diferencia será el tiempo de activación del trigger,
con FOR se activa primero el trigger y después la instrucción DML, mientras que con
AFTER es al revés; ahora escribe AS, BEGIN y END.
Triggers en acción
Lección 03
1. En una nueva consulta escribe CREATE PROCEDURE, seguido por el nombre del
procedimiento.
Como ejemplo, realizarás un procedimiento almacenado, que solo traiga a los clientes
mexicanos. Sigue estas instrucciones:
2. Entre AS y GO, escribe la consulta que nos arrojará a los clientes mexicanos, en
columnas, escribe el símbolo de asterisco para que nos traiga toda la tabla.
EXECUTE CustomerCountry
GO
Los usos de procedimientos almacenados en SQL son muy extensos, por lo que
necesitas conocer y aplicarlos en bases de datos. Los procedimientos almacenados y las
funciones parecen tener la misma tarea pero entre ellas existen importantes diferencias,
las más grandes de ellas es cuando los procedimientos almacenados son llamados
únicamente cuando tu lo deseas por medio de la instrucción EXECUTE, mientras que las
funciones son llamadas dentro de otras sentencias, además con los procedimientos
almacenados puedes restringir acciones de usuarios a un nivel más específico, por
ejemplo, a un usuario que no tiene control de la tabla de inventario, cada vez que se
realiza la venta de un producto y se debe registrar un decremento en el inventario, se le
puede dar acceso a un procedimiento almacenado que registre el producto vendido, sin
que el usuario cambie arbitrariamente la tabla inventario.
Cambio de sintáxis
AS
BEGIN
Código que desees
END
AS
BEGIN
INSERT INTO Customers (CustomerID, CompanyName) Values (Customer ID,
@CompanyName)
IF (@@ERROR <> 0)
BEGIN
UPDATE Customers
SET Customers, CustomerID = @CustomerID
Customers, CompanyName = @CompanyName
WHERE Customers, CustomerID = @CustomerID
PRINT (‘Se realizó un UPDATE’)
END
ELSE
BEGIN
PRINT (‘Se realizó un INSERT’)
END
SELECT @ReturnID = CustomerID FROM Customers WHERE Customers,
Customer ID = @Customer ID
END
Para ejecutar el procedimiento almacenado, primero se tiene que declarar una variable
que obtenga el valor de retorno del procedimiento, por lo tanto, debe tener el mismo tipo
de datos y longitud, después escribe EXECUTE, el nombre del procedimiento y los
valores a insertar a la tabla, deben ser los valores que definiste más la variable que acaba
de declarar y escribir OUTPUT. Al ejecutar el procedimiento almacenado, debe aparecer
alguno de los dos mensajes que declaraste en el procedimiento, para saber el valor de la
variable de retorno, solo realiza un SELECT a la variable y así sabrás que ID se modificó
o se insertó.
Transacciones
Para cumplir con esto, todas las transacciones deben cumplir con ACID que son las
iniciales de cuatro principios:
Para cumplir con los criterios ACID, en el lenguaje de SQL, provee de los mecanismos
para especificar que un conjunto de acciones deben constituir una transacción, estos son:
BEGIN TRANSACTION (Inicio). Especifica que va a empezar una transacción.
COMMIT (Completado). Le indica a la base de datos que puede considerar que
la transacción fue completada con éxito.
ROLLBACK (Error). Indica que se ha presentado un fallo y que debe
restablecer la base de datos.
Para aplicar estas instrucciones, genera una nueva consulta en el sistema gestor y
asegúrate de elegir la base de datos en la que has estado trabajando, después sigue
estos pasos:
BEGIN TRANSACTION
UPDATE Customers SET PostalCode = ‘06450’ WHERE CustomerID = ‘AAAA’
INSERT INTO Customers (CustomersID, CompanyName) VALUES (‘AAAA1’,
‘Manzana’)
IF (@@ERROR <> 0)
BEGIN
ROLLBACK
PRINT (‘ERROR’)
END
ELSE
BEGIN
COMMIT
PRINT (‘BIEN’)
END
Lección 04
DISTINCT. Esta instrucción elimina los registros duplicados de las columnas abarcadas
en SELECT, para ejecutarla sigue estos pasos:
En una nueva consulta escribe SELECT DISTINCT y anota los campos de la tabla que
quieras obtener, escribe FROM y la tabla donde se realizará la búsqueda, puedes
combinar la sintáxis de búsqueda en diferentes tablas con INNER JOIN si así lo requieres.
Como ejemplo, se requiere encontrar los productos que se vendieron del 4 al 5 de julio
de 1996, utilizando la base de datos que has estado manipulando, escribe SELECT y
anota los campos de retorno Product ID y Product Name de las tablas Order Details,
Orders y Products, une las tablas con INNER JOIN e iguala las llaves primarias con las
foráneas de la tabla Order Details, escribe WHERE y realiza la sentencia “Fecha de orden
es mayor igual que”, escribe AND y la sentencia “Fecha de orden es menor igual que”, por
último escribe ORDER BY y el campo que desees, en este caso, Product ID. Esta
consulta arrojará los productos vendidos entre los cuales habrá datos repetidos ya que la
tabla se consulta registro por registro, al agregar DISTINCT y ejecutar la consulta
nuevamente, los productos aparecerán solo una vez. Siempre que realices una consulta
por fecha, utiliza un rango de fechas, como lo hiciste en este ejemplo, así la consulta
arrojará más resultados.
Con lo anterior WHERE utilizará otras instrucciones como LIKE, para buscar cualquier
cadena de caracteres contenida en campos de tipo char, nchar, nvarchaw.
INTO es una de las instrucciones complementarias de SELECT, esta crea una tabla en
la base de datos y la agrega a los resultados de la búsqueda que haya realizado, la
arquitectura de esta tabla, tendrá los campos del SELECT, pero no estará referenciada a
ninguna otra tabla, es común utilizar esta instrucción, porque los errores no dañarán las
tablas importantes. Si intentas ejecutarla dos veces seguidas, el sistema te indicará que
hay un error, ya que no puede crear una tabla que ya existe, por lo que tendrás que
eliminar la primera, para crear esta consulta, sigue estos pasos:
Escribe SELECT y los campos que deseas guardar en la nueva tabla, escribe INTO y
el nombre que llevará, escribe FROM y de dónde obtendrás esos datos.
Para crear la nueva tabla escribe SELECT y el nombre de los campos que deseas
obtener, después escribe INTO y el nombre de la tabla que quieres crear, pon FROM y el
nombre de la tabla que en este caso es Customers, ejecuta todo lo que escribiste, al
realizar esto, en el área de selección aparecerá la nueva tabla, si no aparece da click en
refresh.
Para ver sus datos, escribe SELECT asterisco FROM el nombre de la tabla y ejecútalo,
aparecerán todos los datos solicitados.
Escribe SELECT y los campos que desees en la consulta, ingresa FROM y las tablas
que sean requeridas, puedes utilizar la sintáxis INNER JOIN, según sea el caso, después
escribe GROUP BY y el campo por el que deseas agrupar toda la consulta, al final puedes
utilizar ORDER BY para organizar el resultado.
Es importante que el campo por el que vas a agrupar existen los campos solicitados en
el SELECT, de no ser así obtendrás un mensaje de error. Como ejemplo, tu cliente quiere
saber el total de ventas por categoría de producto y región, realizadas en la tienda hasta
el momento, como generar este SELECT, implica la relación de muchas tablas, utilizarás
la sintáxis abreviada de INNER JOIN, para lograrlo sigue estos pasos:
En una nueva consulta escribe SELECT y el nombre de los campos que quieres como
resultado, en este caso, el RegionDescription y CategoryName, realiza la suma del Unit
Price por Quantity de la tabla Order Details, para que obtengas el total por categoría;
escribe FROM y todas las tablas necesarias para unir Category y Region, en este caso
serán Region, Territories, EmployeeTerritories, Employees, Orders, [Order Details],
Products y Categories; separa las tablas por comas, en vez de escribir INNER JOIN,
después agrega WHERE y todas las sentencias de unión de tablas, empezando por
Region y terminando con Category, las sentencias de unión de tablas son las que
igualarán la llave primaria de una tabla con la llave foránea de otra, es importante que
especifiques de qué tabla obtendrás el campo llave para que no tengas confusiones,
separa cada sentencia con AND, para que los resultados sean solo los que cumplan con
todas las sentencias de unión, escribe GROUP BY y agrupa todo el resultado por los
campos que solicitaste en la consulta que son RegionDescription y CategoryName,
separados por coma, escribe ORDER BY y ordena todo por RegionDescription, para
obtener un resultado más comprensible.
Nivel 03
Lección 01
Diseño de ETL
Extracción de datos
Una vez terminado el diseño, debes crear el Data Warehouse en el software gestor con
las configuraciones correspondientes.
Ahora se deben transformar los datos para que concuerden con el diseño del Data
Warehouse, para ello sigue estos pasos:
Transformación de datos
Arrastra una nueva tarea Ejecutar SQL, hacia la pestaña del flujo de control, edítala y
elige una conexión al Data Warehouse, escribe en SQL Statement el código que vas a
utilizar, ya que requieres las tablas de las bases de datos de la tienda, genera un INSERT
a la tabla de hechos y llena cada columna con un SELECT desde la tabla histórica, o con
un detalle de la base de datos deseada, genera un INNER JOIN en este SELECT por
cada tabla de dimensiones, también debes igualar la llave foránea de la tabla
correspondiente al atributo ID de la tabla de dimensiones, que no es su llave primaria,
acepta y ejecuta todo el flujo de control. Si hiciste bien todo este procedimiento,
aparecerán todos los recuadros en verde, después de ejecutar el DW estará lleno de
información y lo podrás corroborar con tu sistema gestor, ten en cuenta que si vuelves a
correr el proceso, el sistema te marcará ERROR, las tablas al tener datos ya no se
pueden limpiar con la instrucción DELETE, por lo que tendrás que cambiar el código que
puedes encontrar en la ayuda de estudio.
Lección 02
Cubo OLAP
Las compañías han encontrado que las bases de datos relacionales son muy buenas
para almacenar información pero es difícil generar reportes de datos utilizando tanta
información.
Los cubos OLAP (Procesamiento Analítico Online) nos sirven para hacer más eficiente
la base de datos ya que pre procesa la información y te permiten tener acceso
instantáneo a esta.
Imagina un cubo constituido de diferentes cajas, cada una de ellas contiene un total de
la información analizada, como sabes un cubo consta de 3 dimensiones.
Toma un ejemplo de un gerente de ventas que quiere sacar reportes de los totales de
venta de productos de diferentes categorías en determinado tiempo, para traducir y acotar
los requerimientos del cliente, en el cubo se proponen las siguientes dimensiones y
medidas:
La primera dimensión es la categoría de los productos en el primer segmento, se
encontrarán los productos de confección, en el segundo medio los condimentos y en el
último las bebidas, es importante mencionar que se pueden agregar las categorías que se
necesiten. La siguiente dimensión será la del tiempo, en este ejemplo, está conformada
por cuatro meses, la dimensión de medida contiene los totales de los productos stock,
pendientes de entrega, cantidad y costo de ventas. Ahora que tienes las tres dimensiones
y las medidas asignadas, lo que falta es ver de qué forma se accede a la información.
Jerarquías en dimensiones
La mejor manera para explicar cómo funcionan las jerarquías es con ejemplos, un cubo
se puede dar en la dimensión de tiempo, contando con meses, trimestres y años en una
relación padre e hijo, el padre se representa en años, el hijo como trimestres seguido de
meses. Otra dimensión puede ser una localización geográfica, por ejemplo, se tiene como
padre a país y como hijo a estado, la siguiente categoría puede ser municipio como hijo
de estado.
Para poder desplazarte entre jerarquías y navegar entre la información son necesarias
las operaciones en los cubos como las siguientes:
Drill Up. Sirve para compactar los datos, por ejemplo, si la dimensión de tiempo
de tu cubo se encuentra en meses, haces un Drill Up para que los datos se
muestren en años.
Drill Down. Sirve para ver los datos con más detalle, se puede hacer un Drill
Down de años a trimestres.
Ahora que tienes los conceptos básicos de cubos OLAP, sabes cómo funcionan y
cómo acceder a su información, podrás aprender a crearlos en la herramienta Business
Intelligence.
Ahora aprenderás a crear cubos OLAP con un software de Business Intelligence, para
obtener información desde almacenes de datos.
Conexión de los datos. Para establecer el origen de datos, sigue estos pasos:
Selección de tablas. Para elegir las tablas que quieres utilizar en el cubo, sigue estos
pasos, haz click derecho en vistas de origen de datos, ubicado en el explorador de
soluciones y selecciona nueva vista de origen de datos, selecciona el almacén de datos
que agregaste y da click en siguiente, agrega las tablas y vistas con las que vas a
trabajar, haz click en siguiente y después en finalizar.
Para seleccionar los atributos de cada dimensión, haz doble click sobre la dimensión y
arrastra los atributos de las tablas hacia la sección de atributos del cubo.
Jerarquización
Una vez seleccionados los atributos de la dimensión a jerarquizar, sigue estos pasos
para crear la jeraquía:
Una vez que hayas terminado con el diseño del cubo, solo debes procesarlo para
llenarlo de datos, haz click derecho en el cubo que creaste y selecciona procesar,
presiona ejecutar, una vez terminado el proceso presiona cerrar.
Para poder acceder a los datos del cubo y manejarlos en una hoja de cálculo, sigue
estos pasos:
Abre una hoja de cálculo vacía, haz click en “De otras fuentes” en la pestaña de datos,
y selecciona desde “Analysis Services”, pon un punto como nombre de servidor,
selecciona la base de datos y después del cubo en que trabajaste da click en finaliza.
Selecciona informa gráfico y tabla dinámica y da click en aceptar.
Nivel 04
Lección 01
Índices
En una base de datos relacional, existen dos caminos para acceder a la información
contenida en una tabla, uno es recorrerla de principio a fin hasta localizar los datos y otra
es utilizar índices para referenciar la información, así siempre sabrás exactamente dónde
se encuentra. Por esta razón, los índices son indispensables en las bases de datos, con
grandes volúmenes de información, los más usados son:
Clustesed Index o Índice agrupado. Este define el orden físico de la tabla, es decir, la
forma en la que se acomodarán los registros guardados, solo se puede tener uno por
tabla, un ejemplo de esto es un directorio telefónico, cuyo índice agrupado se encuentra
en el campo apellido, este te permite encontrar un número sin tener que leer toda la tabla,
por lo general, si no asignas uno, el índice agrupado de cualquier tabla será la llave
primaria, para saber cómo asignar un índice agrupado toma en cuenta qué campo es el
que utilizas con mayor frecuencia para consultar la tabla.
Nonclustered Index o Índice no agrupado. Este genera una tabla separada que contien
los punteros que indican el lugar donde se almacenan los elementos indizados, este
índice es parecido a la tabla de contenidos de un libro, el índice no agrupado, sería la lista
de temas y el puntero, la página donde se encuentra, así cuando quieres un dato
específico, solo lo buscas y te diriges a la ubicación que te indique, el límite de índices no
agrupados que se pueden asignar por tabla oscila entre 249 y 999, de acuerdo a la
versión de SQL.
Profesionalización