You are on page 1of 27

ANALÏTICA DE DATOS PODEROSA, ATRACTIVA Y DE AUTO-SERVICIO

Curso de Power BI
PRESENTADO POR ALEJANDRO SÁNCHEZ / BI CONSULTANT & POWER BI EVANGELIST
Módulo 2 / Descubrimiento y transformación de datos

• Transformando datos con Power BI Desktop


• Combinando los datos / Merge Queries
• DEMO
• Combinando los datos / Combinando binarios (archivos en carpetas)
• DEMO
• Parámetros, templates y otras características
• DEMO
Opciones para combinar datos

• Append Queries (Anexar Queries)


• Anexa los resultados de un query con otro query

• Combinar Binarios
• Usualmente utilizado para anexar varios archivos
(desde la opción Get Data from Folder)

• Merge Queries (Mezclar Queries)


• Une los resultados de un query con otro query
Append Queries

• Permite unir dos o más tablas

• Se recomienda que ambos tengan la misma


estructura si este no es el caso el sistema
añade al conjunto final los campos de todas
las demás con valores nulos.

• Es Similar a una operación UNION del


estándar SQL.

• Los Resultados pueden ser una nueva


query o ser un paso de la existente.
Demostración: Anexar Datos
Merge Queries
Tabla a combinar #2

Tabla a combinar #1 Tabla a combinar #3

Resultado: Consulta
combinada
Merge Queries / Tipos de Joins
Demostración: Merge Queries
Combinar Binarios (archivos en Folders)

• Funcionalidad que permite


anexar (append) los datos de
múltiples archivos contenidos
en un folder.

• Los archivos podrían ser


de distinto tipo (xlsx, csv, txt),
no hay problema.

• Esta funcionalidad se recomienda


cuando se tiene un Excel con muchos
registros el cual puede ser convertido
en multiples Excels mas pequeños
Demostración: Combinar Binarios
Parámetros, templates y otras características

• Parámetros
• Consultas y conexiones dinámicas
(parametrizando filtros y conexiones)

• Templates (plantillas)
• Habilita tu Solución Power BI Desktop para ser
compartida con otros usuarios (sin publicar en nube)
• Incluye todo, excepto los datos

• Características de usabilidad
• Query Dependencies
• Query Grouping → organizando tus queries
Módulo 3 / Modelamiento de Datos

• Conociendo el Motor de Modelado de Datos


• Como comprime datos PBI
• Demo de Compresión
• ¿Que es un modelo de datos?
• Tablas y Relaciones de un modelo Analitíco
• Experiencia analitica en PBI vs Excel
• PivotTables
• ¿Como crear un modelo de alto desempeño?
• ¿Comó empezar a diseñar un modelo de datos?
• Proceso de creación
• Laboratorio
Ciclo de desarrollo con Power BI

Data Discovery Data Modeling Data Visualization


• Extracción de datos • Relaciones • Filtros
• Transformaciones • Cálculos • Cuadros

Power BI Mobile Power BI Service


• Cualquier momento • Compartir resultados
• Cualquier lugar • Refrescar datos
• Cualquier dispositivo • Q&A
Motor del Modelo de Datos

• xVelocity
• Llamado xVelocity (antes conocido como Vertipaq)
• Válido para el tipo de conexión Importado,
no para DirectQuery o Live Connection
• Construido sobre tecnología de SSAS Tabular

• Performance
• Usa tecnología in-memory que provee un elevado
desempeño para el almacenamiento y consulta de datos

• Ciclos de desarrollo cortos, pensado para el usuario final


• Permite crear soluciones fácil y rápido
• Utiliza un lenguaje llamado DAX (Data Analysis
Expressions) que es similar a fórmulas Excel
Cómo trabaja xVelocity
Tabla lógica y representación de
• ¿Qué hace especial a xVelocity? almacenamiento por filas (Row-Store)

• Datos almacenados
por columnas (Column-Store)

• Compresión de datos extrema


Column-Store

“x 2” significa que el “x 3” significa que


“Red” está repetido “20” está repetido
dos veces tres veces
¿Qué es un modelo de datos?

M
o
d
e
(

A Tablas de Búsqueda Columnas


l (Lookup Tables) Calculadas (DAX)
n
o
a
l
d
í
e
t
i Medidas
D Calculadas (DAX)
c
a
o
t
)

o Tablas de Datos
Relaciones
(Data Tables)
s (Relationships) Jerarquías
Versus experiencia de analítica tradicional con Excel

• Tablas dinámicas → base de nuestros reportes en Excel


• Habilidades de modelamiento de datos NO requeridas

• Habilidades para utilizar VLOOKUP, INDEX, etc.


• Sin Modelo de Datos:

• Múltiples datasets → Múltiples tablas dinámicas


• Tamaño limitado por Excel:

• Los datos se cargan en Worksheets


• Excel 2007+ → 1 millón de registros
• El tamaño del archivo crece bastante con unos cuantos miles
de registros, así como el rendimiento deja mucho que desear
Versus experiencia de analítica tradicional con Excel

Modelo tradicional Excel

▪ Modelo de datos con múltiples


tablas de búsqueda (Lookup ▪ Modelo de datos de UNA SOLA
Tables) y datos (Data Tables) TABLA (Flat-And-Wide).
(Star Schema)
▪ El nivel de usabilidad para un
▪ El nivel de usabilidad para un usuario final es BAJO.
usuario final es ALTO.
▪ NO se orienta al Self-Service.
▪ SÍ se orienta al Self-Service.

Modelo Power Pivot en Excel


(motor analítico de Power BI)
Modelando datos para usabilidad y alto desempeño

• Modelo de datos Power BI basado


en principios del “esquema estrella”
(star schema):
• Tabla de Hechos al centro (conocida
como Tabla de Datos en PBI)
• Dimensiones alrededor (conocidas
como Tablas de Búsqueda en PBI)

• El esquema estrella es uno de los


esquemas más popular y vigente
para diseñar modelos datos
utilizado en la creación de DM/DW
y Cubos OLAP
Perspectiva de base de datos vs perspectiva de usuario

Perspectiva de base de datos OLTP (base de datos transaccional)


▪ Enfocada en maximizar el desempeño de los sistemas informáticos (datos normalizados)
Perspectiva de usuario (negocio)
▪ Enfocada en maximizar el desempeño de los
usuarios (datos denormalizados)

Para el consumo
Para la inserción y el almacenamiento
Modelando datos PBI
Modelando datos PBI
Modelando datos PBI

• Hacer cada pequeña cosa


en una tabla de búsqueda
no es un buen modelo de
datos (Exceso de Tablas de
búsqueda).
• Falta de desnormalización.
Mejoras para la usabilidad del modelo de datos

• Renombrando columnas y tablas


• El nombramiento debería mantener al usuario final en mente
• Las tildes y espacios entre palabras se aceptan

• Ocultando columnas y tablas


• Prevenir que los usuarios se vean saturados de datos (Ejemplo: Ocultar llaves)

• Ordenamiento de datos
• Incorpora otros valores de columna
para el ordenamiento
(Ejemplo: Días de la semana)
Cómo empezar a diseñar un modelo de datos

1. Preguntar cuáles son los hechos (conjuntos de datos) sobre los que el
negocio quiere respuestas. Y qué métricas o indicadores se desean conocer.
Por ejemplo: Quiero analizar las ventas, costo y margen de mis empleados
2. Preguntar cuáles son las dimensiones de corte de las
métricas o indicadores seleccionados (¿Quién?, ¿Qué?, ¿Dónde?, ¿Cuándo?,
¿Cómo?, etc. Por ejemplo: Mis empleados, Productos, Punto de venta,
Tiempo, etc.
3. Preguntar cuáles son los atributos de estas dimensiones. Por ejemplo:
Empleado → ¿Quién? → Nombre, Edad, Sexo, etc.
4. Identificar las fuentes de datos.
5. Diseñar un modelo de datos utilizando el esquema estrella
Laboratorio

Creando un
modelo de datos

You might also like