Professional Documents
Culture Documents
• Introduzione
– Il contesto, processi aziendali
• Decision Support Systems
• Sistemi di Data Warehousing
– Data mart
– Architettura
– Modellazione Concettuale
– Star Schema, Dimensioni, Livelli
• OLAP
• Progettazione di un Data Warehouse
– Analisi, Integrazione, Progettazione
1
Il Contesto
2
Il problema
3
Tipiche richieste
• Qual è il volume delle vendite per regione e
categorie di prodotto durante l’ultimo anno?
•telecomunicazioni
contesti
•banking
•gestione dei rischi •università
•analisi finanziaria •assicurazioni
•programmi di marketing •beni di consumo
•analisi statistica •salute
•integrazione DB clienti •produzione
•integrazione relazioni clienti
problematiche
•analisi temporale
5
In sintesi ...
sistemi di supporto
alle decisioni (DSS)
conoscenza utile
dati all’azienda
6
Processi Aziendali
7
Processi Aziendali - Una Banca
Processi Operativi:
Gestione di un movimento su Conto Corrente
bancario presso uno sportello
Processi Gestionali
Concessione di un fido
Revisione delle condizioni su conto corrente
Processi Direzionali
Verifica dell’andamento di servizi su carte di
credito
Lancio di una campagna promozionale
Accordi commerciali
8
Processi Aziendali - Compagnia
Telefonica
Processi Operativi:
Stipula dei contratti
Instradamento delle telefonate
Dati contabili telefonate(scatti, durata, tariffa…)
Processi Gestionali
Stipula di contratti speciali
Installazione infrastrutture
Processi Direzionali
Scelta dei parametri che fissano il costo delle
telefonate
Definizione di contratti diversificati
Pianificazione potenziamento infrastrutture
9
Informatizzazione dei sistemi
informativi aziendali
10
Sistemi Informativi
11
Perché i sistemi tradizionali non
sono sufficienti?
12
Più formalmente…
• Sistemi tradizionali
– On-Line Transaction Processing (OLTP)
⇒ Profondamente diversi
13
Sistemi di Supporto alle
Decisioni
I DSS sono i sistemi che supportano la dirigenza nel
predere decisoni tattico-strategiche, nel modo
migliore e velocemente.
Tipiche operazioni:
3. Quali sono stati i volumi di vendita dello scorso
anno per una certa categoria di prodotto?
4. Quali ordini dovremmo soddisfare per
massimizzare le entrate?
14
In dettaglio ...
OLTP OLAP
funzione gestione supporto alle
giornaliera decisioni
progettazione orientata alle orientata al soggetto
applicazioni
frequenza giornaliera sporadica
dati recenti, dettagliati
storici, riassuntivi,
multidimensionali
sorgente singola DB DB multiple
uso ripetitivo ad hoc
accesso read/write read
flessibilità accesso uso di programmi generatori di query
precompilati
16
Evoluzione dei DSS
17
I sistemi di data warehousing
18
Data Marts
19
Il data warehouse
20
Il data warehouse
21
Il data warehouse
Integrata:
– i dati provengono da tutte le sorgenti informative
– il data warehouse rappresenta i dati in modo
univoco, riconciliando le eterogeneita` delle
diverse rappresentazioni:
• nomi
• struttura
• codifica
• rappresentazione multipla
22
Il data warehouse
23
Il data warehouse
24
Il data warehouse
Fuori linea:
– base di dati operazionale: i dati vengono acceduti,
inseriti, modificati, cancellati pochi record alla volta
– data warehouse:
• operazioni di accesso e interrogazione diurne
• operazioni di caricamento e aggiornamento
notturne che riguardano milioni di record
25
Architettura
OLAP
Server
Analysis
other
Query
source Serve
Extract Reports
s Transform Data
Load
Data mining
Operational
Refresh
Warehouse
DBs
Tools
Data Marts
26
Popolare un data warehouse
27
System Design
28
Tecnologie coinvolte
• conceptual data modeling
– disegno dello schema del warehouse
• integrazione di dati da fonti eterogenee
– monitoraggio e integrazione
• estensione di tecniche relazionali
• distributed and parallel processing
– warehouse & OLAP server
29
Modellazione concettuale di
un data warehouse
Dimensioni e misure
– Star schema: Un singolo oggetto (fact table) in mezzo
connessa ad un numero di oggetti (dimension tables)
– Snowflake schema: Un raffinamento dello star schema
in cui la gerarchia dimensionale è rappresentata
esplicitamente (normalizzando le tabelle delle
dimensioni)
– Fact constellations: fact tables multiple condividono
dimension tables.
30
Star Schema
31
Dimensioni
33
Dimensioni
34
Fatti
35
Addittività dei fatti
36
Gerarchie ed aggregati
37
Esempio di Star Schema
40
OLAP: On-Line Analytical
Processing
• Una visione multidimensionale, LOGICA, dei dati
• Analisi interattiva dei dati
• Modellazione analitica: derivazione delle proporzioni, delle
varianze, etc
• Aggregazioni per ogni intersezione di ogni dimensione.
• Previsione, trend analysis, e statistical analysis.
• Calcola e visualizza i dati in 2D o 3D crosstabs, charts, e
grafi, with semplici operazioni di pivoting degli assi
41
OLAP: Data Cubes
All Products
Product
Milk Bread Orange … ... sum
January 96, Pisa.
Store Pisa
Roma Jan 96
Firenze
sum Feb 96
… ... Time
sum
magazzino
tempo
prodotto
Drill-Down
Time
45
Operazioni tipiche: Roll-Up
Re Product
gio
n
Roll-up
Year
Sto Product
r e
Drill-Down
Roll-up
Year
Sto Product
re
Drill-Down
Month
46
Operazioni tipiche: Slice and
Dice
Sto Product
re
Slice
Month
Sto Product
re
Month
47
ROLAP & MOLAP
• Performance
– Query: MOLAP
– Caricamento: ROLAP
• Analisi: MOLAP
• Dimensione DW: ROLAP
– MOLAP: problema sparsità
• Flessibilità nello schema: ROLAP
– MOLAP: minor numero di dimensioni ammesse
51
Metodologie di Progetto
52
Progettazione del Data
Warehouse
Attività principali:
– Requisiti utenti (interviste….)
– Analisi delle sorgenti informative esistenti
– Integrazione
– Progettazione concettuale, logica e fisica
53
Progettazione del Data
Warehouse
Analisi
Selezione delle sorgenti informative
Traduzione in un modello concettuale comune
Analisi delle sorgenti informative
Integrazione
Integrazione di schemi concettuali
Progettazione
Progettazione Concettuale
Progettazione Logica
Progettazione Fisica 54
Dati in ingresso
55
Fase di Analisi
56
La fase di Integrazione
57
La Fase di Progettazione
58
Modelli dei Dati
59
Reverse Engineering
60
Integrazione di sorgenti
informative
• E’ necessario risolvere i conflitti che nascono
dall’integrazione degli schemi. Sono dovuti
alla diversa rappresentazione
dell’informazione.
• Esempio: Nome e Cognome:
– “Mario”, “Rossi”
– “Mario Rossi”
– “Rossi Mario”
– “Rossi, M.”
61
Progettazione del DW e schemi
MD
• Introduzione di elementi dimensionali nella
base di dati integrata
• Identificazione di fatti, misure e dimensioni
• Ristrutturazione dello schema concettuale
– Rappresentazione dei fatti tramite entità
– Individuazione di nuove dimensioni
– Raffinamento dei livelli per ogni dimensione
• Grafo dimensionale
• Progettazione logica e fisica
62
Schema integrato ER
63
Grafo di derivazione di uno
schema dimensionale
64
La traduzione
65
Star Schema
66