You are on page 1of 11

VARIABILI CASUALI

Una variabile casuale il risultato numerico di un esperimento casuale Generalmente una variabile casuale indicata da una lettera latina maiuscola (X), mentre il valore numerico che assume indicato da una lettera latina minuscola (x) La distribuzione di probabilit di una variabile casuale X ci dice quali valori pu assumere X e come assegnare la probabilit a questi valori

ESEMPI
Risultato del lancio di un dado Numero di esami superati (sul totale per laurearsi) Numero di casi di morbillo (in una settimana) Tempo impiegato per laurearsi Reddito Altezza, peso, ...

VARIABILI CASUALI
Osserviamo che alcune v.c. sono discrete, nel senso che possono assumere solo un numero limitato di valori, o, al pi, una infinit numerabile di valori. Si tratta, in generale, di conteggi, rappresentati da numeri naturali (0,1,2,) Altre v.c. sono invece continue, ovvero possono assumere qualsiasi valore in un dato intervallo. Si tratta, in generale, di misure, rappresentate da numeri reali.

DISTRIBUZIONE DI PROBABILIT DI UNA VARIABILE CASUALE DISCRETA


Ci dice quale la probabilit che la variabile casuale X assuma una valore esattamente uguale a x. Si indica generalmente con f(x).

f ( x ) Pr ( X = x )
I valori che pu assumere f(x) possono essere assegnati con una tabella (vedi lesercizio 3.1 a pag. 48 delleserciziario) oppure con una formula.

DISTRIBUZIONE DI PROBABILIT DI UNA VARIABILE CASUALE DISCRETA


Perch f(x) possa essere considerata una distribuzione di probabilit discreta, deve rispettare due richieste:

VARIABILI CASUALI DISCRETE


Uniforme discreta Binomiale (Bernoulli) di Poisson

f ( x) 0

f ( x) = 1
x

UNIFORME DISCRETA
Ai possibili risultati, viene assegnato lo stesso valore (la stessa probabilit). Quindi, se i risultati possibili (distinti) sono n la distribuzione di probabilit sar data da

UNIFORME DISCRETA
In unurna abbiamo inserito 10 palline, numerate con i seguenti valori (x): 0,1,2,3,4,5,6,7,8,9. Quindi, in questo caso,

f ( x) =

1 n

f ( x) =

1 10

VALORE ATTESO (MEDIA) DI UNA V.C. DISCRETA

E( X ) = x f ( x )
x

x 0 1 2 3 4 5 6 7 8 9

f(x) 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1

xf(x) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 4.5

VARIANZA DI UNA V.C. DISCRETA


Var ( X ) = 2 ( x ) f ( x )
2 x

x 0 1 2 3 4 5 6 7 8 9

4.5 4.5 4.5 4.5 4.5 4.5 4.5 4.5 4.5 4.5

(x )2 20.25 12.25 6.25 2.25 0.25 0.25 2.25 6.25 12.25 20.25

f(x) (x )2 f(x) 0.1 2.025 0.1 1.225 0.1 0.625 0.1 0.225 0.1 0.025 0.1 0.025 0.1 0.225 0.1 0.625 0.1 1.225 0.1 2.025 8.25

LA V.C. BINOMIALE
Una giocatrice di basket ha a disposizione 5 tiri liberi. Quanti ne realizza? Vengono piantati 10 alberi. Quanti di questi sopravvivono per tutto linverno?

LA V.C. BINOMIALE
Abbiamo un numero fissato di osservazioni (n) Le n osservazioni sono fra loro indipendenti. Ciascuna osservazione pu assumere due risultati possibili (successo/insuccesso) La probabilit di un successo (p) la stessa per ciascuna osservazione.

LA V.C. BINOMIALE
In un esperimento binomiale, la distribuzione del numero di successi X la distribuzione binomiale con parametri n e p.

n nx f ( x ) = p x (1 p ) x
f ( x) = n! n x p x (1 p ) x !(n x )!

LA V.C. BINOMIALE MEDIA E VARIANZA


= n p
2 = n p (1 p )

ALCUNI ESEMPI CON R


La funzione che chiamiamo Binomiale (con due parametri); notare la maiuscola iniziale Vediamo cosa succede con n piccolo variando p Vediamo cosa succede variando n con un valore di p fissato (0.5). Vediamo cosa succede con n molto grande al variare di p.

LA V.C. BINOMIALE
La distribuzione binomiale simmetrica solo quando p=0.5 Quanto pi il parametro p si allontana da 0.5 (in pi o in meno) tanto pi la distribuzione binomiale diventa asimmetrica Quando p<0.5, la asimmetria positiva Quando p>0.5, la asimmetria negativa

LA V.C. BINOMIALE
Al crescere di n la distribuzione binomiale tende a concentrarsi sempre di pi in una zona intorno alla media. Se p diverso da 0.5, pur rimanendo asimmetrica, la distribuzione binomiale tende, in tale zona, ad essere sempre meno asimmetrica al crescere di n (per p fissato). Al crescere di n, la distribuzione binomiale tende alla normale con media np e varianza np(1p).

LA V.C. DI BERNOULLI
La variabile casuale di Bernoulli un caso particolare della variabile casuale binomiale. La variabile casuale di Bernoulli una variabile casuale binomiale in cui n=1. Pertanto, in un esperimento bernoulliano, si potr osservare soltanto o un insuccesso (x=0) o un successo (x=1). Le probabilit corrispondenti sono 1p e p.

LA V.C. DI BERNOULLI
f ( x) =
1! 1 x p x (1 p ) x !(1 x )!
f (0) = (1 p )

f (1) = p

LA V.C. DI BERNOULLI MEDIA


= 0 f (0) + 1 f (1)

LA V.C. DI BERNOULLI VARIANZA


2 = (0 p )2 f (0) + (1 p )2 f (1) 2 = p 2 (1 p ) + (1 p )2 p

= 0 (1 p ) + 1 p = p

2 = p2 p3 + p 2 p2 + p3 2 = p p 2 = p (1 p )

LA V.C. DI POISSON
Trova impiego quando contiamo eventi che avvengono in un tempo fissato (numero di disintegrazioni radioattive, numero di soggetti che si ammalano, numero di laureati che trovano lavoro, numero di morti per calcio di cavallo nelle armate prussiane, ) o in uno spazio definito (numero di meteoriti che colpiscono il suolo lunare, numero di bombe cadute a Londra durante la seconda guerra mondiale, ). La variabile casuale di Poisson, essendo un conteggio, pu assumere i valori 0,1,2, senza un limite superiore. Pu essere vista come la distribuzione cui tende la binomiale quando p tende a 0 e n tende allinfinito (eventi rari); in questo caso la media della binomiale diventa la media della Poisson.

LA V.C. DI POISSON
In un esperimento poissoniano, la distribuzione del numero di eventi X la distribuzione di Poisson con parametro :

f ( x) =

e x x!

La media di una variabile casuale di Poisson . La varianza di una variabile casuale di Poisson .

ALCUNI ESEMPI CON R


La funzione che chiamiamo Poisson (con un parametro); notare la maiuscola iniziale Vediamo cosa succede al variare di .

LA V.C. DI POISSON
La distribuzione di Poisson sempre asimmetrica positiva. Al crescere della media, pur rimanendo asimmetrica, la distribuzione tende sempre di pi a concentrarsi in una zona intorno alla media. Al crescere della media, la distribuzione di Poisson tende alla normale (con media e varianza ).

DISTRIBUZIONE DI PROBABILIT DI UNA VARIABILE CASUALE CONTINUA


A differenza del caso discreto, la distribuzione di probabilit f(x) non rappresenta pi la probabilit che la variabile casuale X assuma una valore esattamente uguale a x.

DISTRIBUZIONE DI PROBABILIT DI UNA VARIABILE CASUALE CONTINUA


Nel caso continuo, la distribuzione di probabilit f(x) una densit di probabilit (il Moore la chiama curva di densit). Perch possa essere considerata una distribuzione di probabilit continua, deve rispettare due richieste:

f ( x ) Pr ( X = x )
Infatti, nel caso continuo, la domanda precedente ha sempre come risposta zero. Lunica domanda sensata consiste nel chiedersi quale la probabilit che la variabile casuale X assuma un valore compreso in un certo intervallo.

f ( x) 0
+

f ( x )dx = 1

DISTRIBUZIONE DI PROBABILIT DI UNA VARIABILE CASUALE CONTINUA


Nel caso continuo, la probabilit che la variabile casuale X assuma un valore compreso nellintervallo che va da a a b data dallarea sotto la curva descritta da f(x) :

MEDIA E VARIANZA DI UNA V.C. CONTINUA


E( X ) = Var ( X ) =
2 +

Pr (a X b ) = f ( x )dx
a

x f ( x )dx
2

evidente che, se a uguale a b, la probabilit vale zero. Larea che sta sotto la curva e sopra un determinato intervallo di valori rappresenta la proporzione di tutte le osservazioni che cadono in quellintervallo (Moore).

(x )

f ( x )dx

VARIABILE CASUALE UNIFORME CONTINUA


Quale la probabilit di osservare un valore compreso fra 12 e 15? f(x)

LA DISTRIBUZIONE NORMALE
Rappresenta una classe particolarmente importante di curve di densit. Si tratta di curve di densit simmetriche, con un unico picco (unimodali) ed a forma di campana. Tutte le distribuzioni normali hanno la stessa forma generale e si estendono su tutto lasse reale. Per disegnare una particolare distribuzione normale sono necessari due parametri: e .

Pr (12 X 15) = (15 - 12)


1/10

1 = 0.3 10

x 5 10 12 15

La funzione di Gauss
f(x) 0.09 flesso 0.06 flesso massimo

LA DISTRIBUZIONE NORMALE
2 1( x ) e 2

0.03

f (x ) =

1 2
2

0 75 80 85 90 95 100 105 x = concentrazione di glucosio (mg/dl)

dove:

la deviazione standard della totalit delle misure;


la media della totalit delle misure; e = base dei logaritmi naturali ( e = 2.71828...). il rapporto tra circonferenza e diametro = 3.14159...)

La media di una distribuzione normale (pu essere negativa, zero o positiva). La mediana di una distribuzione normale . La moda di una distribuzione normale . La deviazione standard di una distribuzione normale (deve essere maggiore di zero). I punti in cui ha luogo il cambiamento di curvatura (flessi) sono posti ad una distanza pari a da ogni lato della media .

f(x) 0.09 flesso 0.06

massimo

ALCUNI ESEMPI CON R


flesso

0.03

La funzione che chiamiamo Normale (con due parametri); notare la maiuscola iniziale Vediamo cosa succede facendo variare e tenendo fissato . Vediamo cosa succede facendo variare e tenendo fissato .

0 75 80 85 90 95 100 105

LA DISTRIBUZIONE NORMALE
Cambiare senza modificare fa muovere la curva normale lungo lascissa (traslazione). Quando cresce la curva si sposta verso destra, quando diminuisce la curva si sposta verso sinistra. La deviazione standard controlla la variabilit di una curva normale. Quando cresce la curva si abbassa e si allunga (si appiattisce), quando diminuisce la curva si alza e si stringe (si appuntisce).

LA DISTRIBUZIONE NORMALE
Larea sotto tutta la curva normale 1. Larea a sinistra della media 0.5. Larea a destra della media 0.5. Le probabilit corrispondono ad aree sotto la curva.

ALCUNI ESEMPI CON R


La funzione che chiamiamo ProbNorm; notare le maiuscole. I parametri con cui chiamiamo la funzione sono la media, la deviazione standard e gli estremi dellintervallo.

LA DISTRIBUZIONE NORMALE
LA REGOLA 68 - 95 - 99.7
In una distribuzione normale con media e deviazione standard circa il 68% delle osservazioni compreso nellintervallo [ , +]. In una distribuzione normale con media e deviazione standard circa il 95% delle osservazioni compreso nellintervallo [ 2, +2]. In una distribuzione normale con media e deviazione standard circa il 99.7% delle osservazioni compreso nellintervallo [ 3, +3].

LA DISTRIBUZIONE NORMALE STANDARD


Tutte le distribuzioni normali hanno in comune alcune propriet. Tutte le distribuzioni normali possono essere ricondotte ad una sola, se misuriamo le differenze rispetto alla media e prendiamo una unit di misura pari a volte lunit di misura originaria. Questo processo detto standardizzazione. La distribuzione normale standard una particolare distribuzione normale con media uguale a zero e varianza uguale a uno.

STANDARDIZZAZIONE

z=

Dato il valore standardizzato z possibile risalire al valore originale x eseguendo loperazione inversa rispetto alla standardizzazione x = + z

LA D. NORMALE STANDARD
LA REGOLA 68 - 95 - 99.7
In una distribuzione normale standard circa il 68% delle osservazioni compreso nellintervallo [1,+1]. In una distribuzione normale standard circa il 95% delle osservazioni compreso nellintervallo [2,+2]. In una distribuzione normale standard circa il 99.7% delle osservazioni compreso nellintervallo [3,+3].

D. NORMALE STANDARD
Intervalli da ricordare
In una distribuzione normale standard il 38.3% delle osservazioni compreso nellintervallo [0.5,+0.5]. In una distribuzione normale standard il 50% delle osservazioni compreso nellintervallo [0.674,+0.674]; i due valori corrispondono al I e al III quartile. In una distribuzione normale standard il 60% delle osservazioni compreso nellintervallo [0.842,+0.842]. In una distribuzione normale standard il 68.3% delle osservazioni compreso nellintervallo [1,+1].

D. NORMALE STANDARD
Intervalli da ricordare
In una distribuzione normale standard il 70% delle osservazioni compreso nellintervallo [1.036,+1.036]. In una distribuzione normale standard l80% delle osservazioni compreso nellintervallo [1.282,+1.282]. In una distribuzione normale standard l86.6% delle osservazioni compreso nellintervallo [1.5,+1.5]. In una distribuzione normale standard il 90% delle osservazioni compreso nellintervallo [1.645,+1.645].

D. NORMALE STANDARD
Intervalli da ricordare
In una distribuzione normale standard il 95% delle osservazioni compreso nellintervallo [1.960,+1.960]. In una distribuzione normale standard il 95.4% delle osservazioni compreso nellintervallo [2,+2]. In una distribuzione normale standard il 98.8% delle osservazioni compreso nellintervallo [2.5,+2.5]. In una distribuzione normale standard il 99% delle osservazioni compreso nellintervallo [2.576,+2.576]. In una distribuzione normale standard il 99.7% delle osservazioni compreso nellintervallo [3,+3].

D. NORMALE STANDARD
In una distribuzione normale standard allintervallo [z,+z] associata una probabilit p. Questo vuol dire che la probabilit di osservare un valore compreso fra z e +z uguale a p. Allora allintervallo [,z] associata una probabilit (1p)/2. Cio la probabilit di osservare un valore minore di z (1p)/2. Analogamente allintervallo [+z,+ ] associata una probabilit (1p)/2. Cio la probabilit di osservare un valore maggiore di +z (1p)/2.

1 p 2

1 p 2

D. NORMALE STANDARD
In una distribuzione normale standard allintervallo [z,+z] associata una probabilit p. La probabilit di osservare un valore maggiore di z (1+p)/2. La probabilit di osservare un valore minore di +z (1+p)/2.

0.023 0.954

0.023

ALCUNI ESEMPI
In una distribuzione normale standard allintervallo [2,+2] associata una probabilit p = 0.954. La probabilit di osservare un valore compreso fra 2 e +2 0.954. La probabilit di osservare un valore minore di 2 0.023. La probabilit di osservare un valore maggiore di 2 0.977. La probabilit di osservare un valore maggiore di +2 0.023. La probabilit di osservare un valore minore di +2 0.977.

Una verifica grafica della normalit Il normal probability plot


Si tratta di un grafico quantile-quantile, in cui i quantili della variabile rilevata su un campione vengono confrontati (graficamente) con i quantili teorici di una distribuzione normale che ha la stessa media e la stessa varianza dei dati del campione. Qualora le osservazioni seguano una distribuzione normale, i punti dovrebbero allinearsi lungo una linea retta.

x <- rnorm(100); qqn(x)

x <- rnorm(1000); qqn(x)

x <- rbeta(1000,2,5); qqn(x) # asim. positiva

x <- rbeta(1000,5,2); qqn(x) # asim. negativa

qqn(df$altezza)

qqn(df$peso)

10

bmi <- df$peso/(df$altezza/100)^2; qqn(bmi)

11

You might also like