You are on page 1of 114

Estadstica.

Volum I
Joaqun Castell Benavent Mara Victoria Ibez Gual Vicente Martnez Garca Amelia Sim Vidal
Departament de Matemtiques Codi dassignatura C23

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estadstica. Volum I - UJI

Edita: Publicacions de la Universitat Jaume I. Servei de Comunicaci i Publicacions Campus del Riu Sec. Edifici Rectorat i Serveis Centrals. 12071 Castell de la Plana http://www.tenda.uji.es e-mail: publicacions@uji.es Collecci Sapientia, 21 Primera edici, 2010 www.sapientia.uji.es ISBN: 978-84-692-9048-4

Aquest text est subjecte a una llicncia Reconeixement-NoComercial-Compartir Igual de Creative Commons, que permet copiar, distribuir i comunicar pblicament lobra sempre que especifique lautor i el nom de la publicaci i sense objectius comercials, i tamb permet crear obres derivades, sempre que siguen distribudes amb aquesta mateixa llicncia. http://creativecommons.org/licenses/by-nc-sa/2.5/es/deed.ca

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estadstica. Volum I - UJI

INDEX
1. Descripci o duna mostra: distribucions gr` acs 1.1. Introducci o . . . . . . . . . . . . . . . 1.2. Conceptes b` asics . . . . . . . . . . . . 1.3. Distribucions de freq u` encies . . . . . . 1.4. M` etodes gr` acs . . . . . . . . . . . . . 1.4.1. Diagrama de sectors . . . . . . 1.4.2. Diagrama de barres . . . . . . . 1.4.3. Pol gon de freq u` encies . . . . . 1.4.4. Histogrames . . . . . . . . . . . 1.4.5. Pictogrames . . . . . . . . . . . 1.5. Problemes proposats . . . . . . . . . . de freq u` encies i m` etodes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 6 6 10 10 10 11 12 13 13 23 23 23 31 33 33 34 37 38 38 38 40 41 45 47 47 47 47 48 49 50 51 53 53 54 57 61 61 64 65

2. Descripci o duna mostra: mesures descriptives 2.1. Mesures de posici o . . . . . . . . . . . . . . . . 2.1.1. Mesures de tend` encia central . . . . . . . 2.1.2. Mesures de posici o no centrals: quantils . 2.2. Moments . . . . . . . . . . . . . . . . . . . . . . 2.3. Mesures de dispersi o . . . . . . . . . . . . . . . 2.3.1. Mesures de dispersi o absolutes . . . . . . 2.3.2. Mesures de dispersi o relatives . . . . . . 2.4. Tipicaci o duna distribuci o de freq u` encies . . . 2.5. Mesures de forma . . . . . . . . . . . . . . . . . 2.5.1. Mesures dasimetria . . . . . . . . . . . . 2.5.2. Mesures dapuntament o curtosi . . . . . 2.6. Mesures de concentraci o . . . . . . . . . . . . . 2.7. Problemes proposats . . . . . . . . . . . . . . .

3. Distribucions bidimensionals 3.1. Introducci o . . . . . . . . . . . . . . . . . . . . . . . 3.2. Distribucions de freq u` encies bivariants . . . . . . . . 3.2.1. Distribuci o conjunta . . . . . . . . . . . . . . 3.2.2. Distribucions marginals . . . . . . . . . . . . . 3.2.3. Distribucions condicionades . . . . . . . . . . 3.2.4. Independ` encia estad stica . . . . . . . . . . . 3.3. Representaci o gr` aca: diagrama de dispersi o . . . . . 3.4. Mesures descriptives duna distribuci o bidimensional . 3.4.1. Moments . . . . . . . . . . . . . . . . . . . . . 3.4.2. Mesures de depend` encia lineal . . . . . . . . . 3.5. Problemes proposats . . . . . . . . . . . . . . . . . .

4. Regressi o i correlaci o lineal 4.1. Introducci o. M` etode dels m nims quadrats . . . . . . . . . . . . . . 4.1.1. El m` etode dels m nims quadrats . . . . . . . . . . . . . . . . 4.2. Model de regressi o lineal simple . . . . . . . . . . . . . . . . . . . .
Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4 

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

c UJ

4.2.1. Recta de regressi o. . . . . . . . . . . . . . . . . . . . . 4.2.2. Mesures de la bondat dajustament. Correlaci o. . . . . 4.2.3. Predicci o. . . . . . . . . . . . . . . . . . . . . . . . . . 4.3. Regressi o lineal m ultiple . . . . . . . . . . . . . . . . . . . . . 4.3.1. Vari` ancia residual. Coecient de determinaci o m ultiple 4.3.2. Un cas particular: el pla de regressi o . . . . . . . . . . 4.4. Regressi o no lineal. Coecient de correlaci o general . . . . . . 4.4.1. Models de regressi o no lineal simple . . . . . . . . . . . 4.4.2. Mesures de la bondat dajustament . . . . . . . . . . . 4.5. Problemes proposats . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

65 68 71 71 74 74 75 75 77 79 81 81 82 82 83 84 89 90 92 94 94 95 96 99 99 100 100 102 102 104 108 113

5. Nombres ndexs 5.1. Introducci o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2. Indexs simples i complexos . . . . . . . . . . . . . . . . . . . . . . . 5.2.1. Indexs simples . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.2. Indexs simples en cadena . . . . . . . . . . . . . . . . . . . . 5.2.3. Indexs complexos: no ponderats i ponderats . . . . . . . . . 5.3. Propietats dels nombres ndexs . . . . . . . . . . . . . . . . . . . . 5.4. Alguns problemes en la construcci o i la utilitzaci o dels nombres ndexs 5.5. Deaci o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.6. Index de preus de consum i altres ndexs elaborats a Espanya . . . 5.6.1. Index de preus de consum . . . . . . . . . . . . . . . . . . . 5.6.2. Altres ndexs . . . . . . . . . . . . . . . . . . . . . . . . . . 5.7. Problemes proposats . . . . . . . . . . . . . . . . . . . . . . . . . . 6. S` eries temporals 6.1. Introducci o . . . . . . . . . . . . . . . . . 6.2. Representaci o gr` aca . . . . . . . . . . . . 6.3. Caracter stiques duna s` erie temporal . . . 6.4. An` alisi de la tend` encia . . . . . . . . . . . 6.4.1. An` alisi sense component estacional 6.4.2. An` alisi amb component estacional . 6.5. Problemes proposats . . . . . . . . . . . . Bibliograa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

TEMA 1 DUNA MOSTRA: DISTRIBUCIONS DESCRIPCIO ENCIES ` ` ` DE FREQU I METODES GRAFICS


1.1. INTRODUCCIO At es laspecte aplicat que fonamentalment t e lestad stica, comen carem amb alguns exemples: Exemple 1.1 La regidoria de Benestar Social duna determinada ciutat desitja esbrinar si la mitjana de lls per fam lia ha baixat respecte a la d` ecada anterior. Per a aquest , ha enquestat 50 fam lies i nha obtingut les dades seg uents: 2 3 4 3 2 4 3 5 1 2 2 0 4 3 2 2 3 1 0 2 2 3 2 2 2 2 3 3 2 1 6 4 2 2 3 3 2 2 2 4 3 3 2 3 3 2 3 2 4 1 Exemple 1.2 Una cadena hotelera t e la intenci o dobrir un nou hotel en una determinada ciutat. Abans de decidir el preu de les habitacions, el gerent de la cadena investiga els preus per habitaci o de 40 hotels de la mateixa categoria de la dita ciutat. Les dades obtingudes, en euros, varen ser: 39 53 33 40 49 39 43 54 37 43 41 39 56 50 58 47 43 60 44 33 49 47 38 45 50 51 61 47 61 42 43 42 51 44 53 45 45 58 45 48

Lestad tica es la ci` encia que sencarrega de la recopilaci o, la representaci oi l us de dades sobre una o diverses caracter stiques dinter es per prendre decisions o extraure conclusions generals a partir daquestes dades. El m` etode estad stic consta dels passos seg uents: Pas 1. Plantejament del problema en termes precisos: ` ambit daplicaci o (poblaci o) i caracter stica (o caracter stiques) objecte destudi (variable(s) ). Pas 2. Recollida de dades de la poblaci o dinter es (mostreig ). Pas 3. Organitzaci o, presentaci o i resum de les dades o de la mostra (estad stica descriptiva ). Pas 4. Models matem` atics (teoria de la probabilitat ). Pas 5. Obtenci o de conclusions generals o vericaci o dhip` otesi (infer` encia estad stica ). Lestad stica descriptiva es la part de lestad stica que sencarrega dorganitzar, resumir i donar una primera descripci o (sense obtindre conclusions generals) de les dades obtingudes en el mostreig.
Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4  Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

c UJI

` 1.2. CONCEPTES BASICS Anomenarem poblaci o el conjunt dindividus o ents subjectes a estudi (en lexemple 1.1, el conjunt de totes les fam lies de la ciutat; en lexemple 1.2, el conjunt de tots els hotels daquesta categoria en la dita ciutat). Algunes poblacions s on nites i poden con eixer-se (el conjunt de tots els hotels), altres s on innites o abstractes (el conjunt de totes les peces fabricades per una m` aquina). Anomenarem variable la caracter stica que volem estudiar en la poblaci o (en el primer exemple, el nombre de lls; en el segon, el preu per habitaci o). Les denotarem mitjan cant lletres maj uscules: X, Y . . . Podem classicar les variables en dos grans grups, les variables qualitatives i les variables quantitatives. Les variables qualitatives s on aquelles que no es poden mesurar, es a dir, aquelles que prenen valors als quals no es pot assignar cap n umero. Expressen qualitats o categories; per exemple: sexe, professi o, color dels ulls, etc. Les variables quantitatives, al contrari, s on mesurables, es a dir, els valors que shi observen poden expressar-se de forma num` erica. Aquestes variables poden classicar-se en: Discretes, quan prenen els seus valors en un conjunt nit o numerable. Per exemple, el nombre de lls, el nombre dobrers en una f` abrica, les vegades que ix cara en llan car una moneda 10 vegades, etc. Cont nues, quan poden prendre qualsevol valor en un interval. Per exemple, el pes, lestatura, etc. Nota 1.1 La distinci o entre variables discretes i variables cont nues es m es te` orica que pr` actica, ja que les limitacions en els aparells de mesura fan que totes les variables quantitatives es comporten com a discretes quan es pret en observar-les. Aquesta distinci o ser` a important en els models te` orics, quan estudiem la part de teoria de la probabilitat. De moment, farem m es exible el concepte de variable cont nua considerant cont nua aquella variable que pren un gran nombre de valors diferents. En aquest sentit, podem considerar la variable preu com a cont nua. Anomenarem mostra un subconjunt nit delements seleccionats entre els de la poblaci o. Per exemple, les 50 fam lies del primer exemple o els 40 hotels del segon. El nombre dobservacions de la mostra lanomenarem grand` aria mostral. Normalment el denotarem per n. Anomenarem dada cada valor observat de la variable. Si la variable la representem per X , cada dada diferent de la mostra la representarem per xi . El sub ndex i indica el lloc que la dada ocupa en la mostra, quan totes les dades diferents shan ordenat de m es xicoteta a m es gran. En lexemple 1.1: x1 = 0, x2 = 1 . . . En lexemple 1.2: x1 = 33, x2 = 37 . . . ENCIES ` 1.3. DISTRIBUCIONS DE FREQU Si observem les dades dels exemples anteriors, es obvi que el primer pas en lorganitzaci o de les dades consistir` a a agrupar aquelles que es repeteixen. Per a aquest prop` osit establim les denicions seg uents:
Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4  Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

c UJI

Denici o 1.1 La freq u` encia absoluta (ni ) dun valor xi de la variable es el nombre de vegades que aquest valor es repeteix en la mostra. Propietat 1.1 La suma de totes les freq u` encies absolutes es la grand` aria mostral: ni = n.

Denici o 1.2 La freq u` encia relativa (fi ) dun valor xi de la variable es el quoni cient entre la freq u` encia absoluta del valor i la grand` aria mostral: fi = . n Propietat 1.2 La suma de totes les freq u` encies relatives es la unitat. Denici o 1.3 La freq u` encia absoluta acumulada (Ni ) dun valor xi de la variable es el nombre de dades en la mostra iguals o inferiors a xi . Es calcula com i Ni = nk = Ni1 + ni .
k=1

Propietat 1.3 L ultima freq u` encia absoluta acumulada es la grand` aria mostral.

Denici o 1.4 La freq u` encia relativa acumulada (Fi ) dun valor xi de la variable es el quocient entre la freq u` encia absoluta acumulada del valor i la grand` aria i Ni mostral. Es calcula com Fi = = fk . n k=1 Propietat 1.4 L ultima freq u` encia relativa acumulada es la unitat. Denici o 1.5 Una distribuci o de freq u` encies duna variable es una taula que cont e els diferents valors de la variable, sense repetir-los, ordenats de m es baix a m es alt amb les freq u` encies corresponents. Exemple 1.3 Per a les dades de lexemple 1.1 tenim: xi 0 1 2 3 4 5 6 ni 2 4 fi 0.04 0.08 Ni 2 6 27 42 48 49 50 Fi 0.04 0.12 0.54 0.84 0.96 0.98 1.00

21 0.42 15 0.30 6 1 1 0.12 0.02 0.02

Una vegada ordenades les dades, es molt f` acil obtindre informaci o de la mostra. Exemple 1.4 Responeu les preguntes seg uents: 1. Quantes fam lies tenen com a m` axim dos lls? Podem mirar en la columna de les ni : 2 + 4 + 21 = 27, o en la de les Ni = 27.


Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

c UJI

2. Quantes fam lies tenen m es dun ll o com a molt tres? Mirem en la columna de les ni : 21 + 15 = 36, o en la de les Ni : 42 6 = 36. 3. Quin percentatge de fam lies t e m es de tres lls? Si mirem en la columna de les fi : 0,12 + 0,02 + 0,02 = 0,16, concloem que el 16 % de les fam lies t e m es de tres lls. Si mirem en la columna de les Fi : 1 0,84 = 0,16, obtenim el mateix resultat. Exemple 1.5 Si fem el mateix amb les dades de lexemple 1.2, obtenim: xi 36 37 38 39 40 41 42 43 44 45 47 48 49 50 51 . . . La taula es enorme!!! Quan els valors diferents que pot prendre una variable s on molts, sobt e una taula molt gran i, en conseq u` encia, es poc aclaridora. Aix` o passar` a sovint, quan la variable objecte destudi siga cont nua. La soluci o es agrupar els diferents valors de la variable en intervals de classe, tenint sempre en compte que el que es guanya quant a lorganitzaci o i la facilitat per a manipular les dades, es perd en informaci o. Agrupar en intervals de classe consisteix a agrupar les dades en un nombre xicotet dintervals que veriquen: Que no se superposen entre si, de forma que no existisca ambig uitat respecte a la classe a qu` e pertany una dada particular. Que cobrisquen tot el rang de valors de la variable. Anomenarem: L mits superior i inferior de la classe els extrems de linterval. Els representarem per Li i li , respectivament.


ni 2 1 1 3 1 1 2 4 2 4 4 1 1 2 2 . . .

fi 0.05 0.025 0.025 0.075 0.025 0.025 0.05 0.1 0.05 0.1 0.1 0.025 0.025 0.05 0.05 . . .

Ni 2 3 4 7 8 9 11 15 17 21 25 26 27 29 31 . . .

Fi 0.05 0.075 0.1 0.175 0.2 0.225 0.275 0.375 0.425 0.525 0.625 0.650 0.675 0.725 0.775 . . .

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

c UJI

Marca de classe, ci , el punt mitj` a de linterval, es a dir, ci =

Li + li . 2

Amplitud duna classe, ai , la difer` encia entre els extrems superior i inferior de linterval: ai = Li li . Freq u` encia de classe, ni , el nombre dobservacions de cada classe. Si dividim aquesta freq u` encia entre el nombre total dobservacions, tenim la freq u` encia relativa de classe, fi . An` alogament, denim Ni i Fi . A continuaci o, donarem algunes indicacions per a respondre a la pregunta: com constru m una distribuci o de freq u` encies agrupada en intervals? 1. Comen carem per determinar el recorregut de la variable, Re , que es deneix com la difer` encia entre el valor observat m es alt i el m es baix. 2. El nombre de classes dep en de la grand` aria de la mostra. Per a mostres no molt grans, n < 50, pot escollir-se un nombre de classes igual a n. O b e susa log n la f ormula de Sturtges: + 1. A m es, en general, el nombre de classes no log 2 ha de passar de 15 o 20, en casos de mostres molt grans. molt m 3. Determinem lamplitud dels intervals. Es es c` omode que tots els intervals tinguen la mateix amplitud (sempre que siga possible i excepte el primer i l ultim). Si es aix , ai = a = Re . nombre d intervals

Nota 1.2 Els passos 2 i 3 poden intercanviar-se. Nota 1.3 Perqu` e no hi haja ambig uitat, prendrem els intervals tancats per lesquerra i oberts per la dreta (excepte l ultim). Exemple 1.6 Representarem ara la distribuci o de freq u` encies de lexemple anterior, agrupant les dades. El valor m es baix es 33 i el m es alt 61, per tant: Re = 61 33 = 28. Com que n = 40, considerarem 6 classes, lamplitud de les quals ser` a: 28/6 = 4. 6. Aix , lamplitud es un nombre decimal peri` odic i ens quedarien intervals un poc estranys. Podem fer el seg uent: prenem com a primer valor 32, en lloc de 33, i com a u ltim 62, en lloc de 61. Daquesta manera, lamplitud es 5 i la distribuci o de freq u` encies queda: [li , Li [ ci ni 2 7 fi 0.05 0.175 0.3 0.25 0.1 0.125


Ni 2 9 21 31 35 40

Fi 0.05 0.225 0.525 0.775 0.875 1.00


Estadstica. Volum I - UJI

[32, 37[ 34.5 [37, 42[ 39.5

[42, 47[ 44.5 12 [47, 52[ 49.5 10 [52, 57[ 54.5 [57, 62] 59.5
Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

4 5

Estad stica. Volum I - 2009/2010

c UJI

Daquesta manera, podem respondre f` acilment a les preguntes: 1. Quants hotels tenen un preu entre 33 i 37 euros? 2 hotels. 2. Quants hotels tenen un preu igual o superior a 47 euros? 19 hotels. 3. Quin percentatge dhotels costa, com a m` axim, 42 euros? El 22.5 % dels hotels.

` ` 1.4. METODES GRAFICS 1.4.1. DIAGRAMA DE SECTORS un diagrama en forma circular en el qual, a cada valor de la variable, sassocia Es adequat per a representar un sector circular proporcional a la seua freq u` encia. Es variables qualitatives. Exemple 1.7 Una mostra de determinada poblaci o es enquestada abans de la convocat` oria dun refer` endum, per poder efectuar una predicci o sobre el resultat. El 50 % dels enquestats ha contestat que shi pronunciar` a a favor, el 40 %, en contra i el 10 % restant ha dit que sabstindr` a. El gr` ac seg uent mostra el diagrama de sectors daquest exemple:

Abstencions: el 10 %

En contra: el 40 %

A favor: el 50 %

Figura 1.1: Diagrama de sectors de lexemple 1.7 1.4.2. DIAGRAMA DE BARRES Cada valor de la variable es representa mitjan cant una barra dal cada propor cional a la freq u` encia. Es adequat tant per a representar variables qualitatives com variables quantitatives discretes. En la gura 1.2 sen pot veure un exemple.

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

10

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

10

c UJI

Freq u` encies absolutes

21 15

2 Nombre de lls 0

6 1 1 6

Figura 1.2: Diagrama de barres de lexemple 1.1 ENCIES ` 1.4.3. POL IGON DE FREQU Sobre cada valor de la variable (o interval) tracem una al cada igual a la seua freq u` encia (absoluta o acumulada). En el cas de dades discretes, unim mitjan cant segments de recta lextrem de cada ordenada amb la seg uent. En la gura 1.3 pot veures el pol gon de freq u` encies relatives acumulades (Fi ) de lexemple 1.6.

Freq u` encies relatives acumulades

1 0.875 0.775

0.525

0.225 0.05

34.5

39.5

44.5

49.5

54.5

59.5

Preu Figura 1.3: Pol gon de freq u` encies relatives acumulades de lexemple 1.6

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

11

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

11

c UJI

1.4.4. HISTOGRAMES la representaci Es o equivalent al diagrama de barres, per` o per a dades agrupades per intervals. Sobre cada classe alcem un rectangle d` area proporcional a la freq u` encia de la classe. Caldr` a, doncs, parar compte i veure si tots els intervals tenen la mateixa amplitud abans de fer el dibuix.
8 7 6 7 5 4 3 2 2 1 0 1 1 0 1 2 3 4 5 6 7 8 0 1 0 1 2 3 4 5 6 7 8 9 6 5 4 3 10 9 8

(a)
6 11 10 5 9 8 4 7 6 3 5 2 4 3 1 2 1 0 1 0 1 2 3 4 5 6 7 8 9 0 2 1 0 1

(b)

(c)

(d)

Figura 1.4: Diversos tipus dhistogrames Els histogrames (i tamb e els diagrames de barres) proporcionen molta informaci o respecte de lestructura de les dades: el valor central de la distribuci o de les freq u` encies, la seua dispersi o, simetria, etc. La gura 1.4 mostra diversos casos dhistogrames: en el primer (a), podem veure una distribuci o asim` etrica que es t pica de dades econ` omiques, com pot ser la distribuci o de la renda, les dimensions duna poblaci o, el consum delectricitat en una ciutat, etc. El histograma (b) mostra una distribuci o sim` etrica i campaniforme que es presenta en la majoria de medicions f siques, en processos de fabricaci o, etc. Aquest tipus de distribuci o sanomena normal perqu` e es el m es habitual. Lhistograma (c) presenta una distribuci o uniforme, que podria correspondre, per exemple, a l ultima xifra del n umero premiat en una loteria. Finalment, la distribuci o (d) es molt asim` etrica i apareix, per exemple, en estudiar temps entre avaries duna determinada maquin` aria, en arribades a una nestra datenci o al client, en temps transcorregut entre dos accidents de tr` ansit en una determinada carretera, etc.
12

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

12

c UJI

1.4.5. PICTOGRAMES Expressen, amb dibuixos allusius al tema destudi, les freq u` encies de les modalitats de la variable. Els gr` acs es fan de forma que queden representades les diferents escales del mateix dibuix en correspond` encia amb la grand` aria de la seua freq u` encia. Lescala dels dibuixos ha de ser de tal manera que l` area de cadascun siga proporcional a la freq u` encia de la modalitat que representa. S on molt utilitzats en variables qualitatives. Exemple 1.8 Per a mostrar el consum de carn de porc en un mes en diferents ciutats, susaria la representaci o seg uent:

100 kg a la ciutat A

60 kg en B

40 kg en C

22 kg en D

1.5. PROBLEMES PROPOSATS (1) Classica les variables seg uents: a) Color dels ulls. c) Al cada en cm. e) Anys destudis realitzats. g ) Temperatura dun malalt en o C. b) Marques dautom` obil. d) Nivell destudis. f ) Nombre dalumnes duna classe. h) Professi o.

(2) Els 100 estudiants duna classe que es van presentar al primer examen parcial destad stica en la convocat` oria de febrer varen obtindre les qualicacions seg uents: 7 2 0 6 4 3 5 2 1 7 2 6 1 0 6 4 5 5 5 3 5 4 6 7 5 1 7 4 8 0 8 1 3 5 2 6 3 5 2 8 1 5 3 0 5 8 2 3 9 3 10 4 2 7 8 2 6 7 6 5 4 3 3 2 2 9 4 4 1 7 8 1 0 2 4 0 10 2 5 7 3 5 7 4 6 1 2 6 7 4 1 4 6 3 5 1 4 5 5 6

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

13

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

13

c UJI

a ) Obt n la distribuci o de freq u` encies de les qualicacions. b ) Quin percentatge destudiants va obtindre un 5? c ) Quants estudiants van obtindre un 6 o m es? d ) Quin percentatge destudiants va aprovar? e ) Representa gr` acament les freq u` encies no acumulades. f ) Representa gr` acament les freq u` encies acumulades. (3) En una determinada ciutat sha dut a terme un mostreig a partir del qual els establiments hotelers de la mostra shan agrupat pel nombre de places que poseeixen, i sha obtingut la taula seg uent: Places [0, 100[ [100, 200[ [200, 300[ [300, 400[ [400, 500[ [500, 600[ [600, 700[ [700, 800[ [800, 900[ [900, 1000] Nre. dhotels 25 37 12 22 0 21 13 5 3 2

a ) Construeix una taula de freq u` encies completa. b ) Determina el nombre destabliments amb un nombre de places superior o igual a 400. c ) Quin percentatge destabliments t e menys de 700 places? d ) Representa gr` acament les freq u` encies. e ) Representa gr` acament les freq u` encies acumulades. (4) A continuaci o apareixen els guanys, en euros, obtinguts en 25 quioscos per la venda di` aria dun determinat diari: 55.31 81.47 64.90 70.89 86.02 77.25 76.73 84.51 56.02 84.92 90.23 78.01 88.05 73.37 87.09 55.31 81.47 64.90 70.89 86.02 77.25 76.73 84.51 56.02 84.92 Obt n la distribuci o de freq u` encies agrupades en 8 intervals amb les marques de classe 57, 62, 67, 72, 77, 82, 87, 92. (5) Donades les seg uents qualicacions destad stica dun grup de 30 estudiants: 5.3 6.5 6 5 7.5 8 7 6.5 6 4.5 4.5 3.5 4 7 6.5 5 7 4.5 5 5.5 7.5 6.5 1 6 9.5 4 6 7.5 7 7.5

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

14

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

14

c UJI

a ) Obt n la distribuci o de freq u` encies. b ) Determina el percentatge de suspensos. c ) Calcula el percentatge destudiants amb qualicacions compreses entre 5 i 7.5, ambdues incloses. (6) Sha realitzat un estudi sobre el preu (en euros) per habitaci o de 50 hotels duna determinada ciutat i shan obtingut els resultats seg uents: 70 50 40 30 70 Determina: a ) La distribuci o de freq u` encies dels preus. (a.1) Sense agrupar. (a.2) Agrupant les dades en 5 intervals de la mateixa amplitud. b ) Representa gr` acament ambdues distribucions. c ) Percentatge dhotels amb un preu superior a 75 euros. d ) Quants hotels tenen un preu superior o igual que 50 euros per` o inferior o igual que 100? 30 75 50 40 80 50 30 30 70 75 40 70 50 40 70 50 100 100 70 75 70 150 30 50 80 40 50 40 40 70 75 75 50 70 70 80 120 70 100 120 50 80 50 75 80

(7) Completa la taula seg uent: [li , Li [ ni fi Ni 60 170 200

[0, 10[ 60 [10, 20[ 0,4 [20, 30[ 30 [30, 40[ 0,1 [40, 50]

(8) Les dades proporcionades a continuaci o corresponen al pes, en kg, de 80 persones: 60 69 67 76 66 80 54 61 77 59 65 67 70 66 65 67 66 70 69 64 68 67 61 72 57 78 67 64 70 75 73 73 66 64 57 79 52 71 62 58 75 81 67 67 65 62 68 71 69 64 63 68 71 69 67 59 58 68 71 69 66 72 68 70 67 83 76 66 74 56 61 62 61 65 62 63 63 74 63 66

a ) Obt n la distribuci o de freq u` encies de manera que les dades estiguen agrupades en intervals damplitud 5.
15

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

15

c UJI

b ) Calcula el percentatge de persones que pesen menys de 65 kg. c ) Representa gr` acament les freq u` encies absolutes acumulades. (9) A lentrada dun centre comercial, un enquestador recull informaci o sobre el nombre de despla caments que fan al mes les persones que hi acudeixen. Quan ha entrevistat 60 persones entrega la informaci o obtinguda, que resulta ser la seg uent: 2 8 5 6 1 3 2 8 5 3 2 4 1 3 4 4 3 5 2 6 1 7 6 2 5 3 8 4 6 2 8 7 6 4 3 2 6 1 1 1 2 2 4 7 6 2 1 3 4 5 8 2 2 6 5 3 2 3 4 3 a ) Representa en una taula de freq u` encies, sense agrupar, les observacions anteriors. Quin percentatge de persones fa tres o menys visites al mes? Quantes persones en fan entre 4 i 7 (ambd os inclosos) al mes? b ) Representa les dades en una taula de freq u` encies, agrupant les dades en tres intervals. Quin percentatge de persones hi acudeix m es de tres vegades al mes? (10) El gr` ac seg uent representa el diagrama de una distribuci o de freq u` encies absolutes acumulades. Troba la taula de freq u` encies completa.

15 + 10 +

3+ + 100 + 200 + 300

SOLUCIONS (1) una variable qualitativa discreta: color A, color B, color C, etc. a ) Es una variable qualitativa discreta: marca X, marca Y, marca Z, etc. b ) Es una variable quantitativa cont c ) Es nua: 1.93, 1.935, 1.76, 1.67, etc. una variable qualitativa discreta: sense estudis, elementals, etc. d ) Es una variable quantitativa discreta: 0, 1, 2, 3, etc. e ) Es una variable quantitativa discreta: 0, 1, 12, 3033, 5004, etc. f ) Es una variable quantitativa cont g ) Es nua: 36.1, 36.51, 36.512, 36.78, 37.1, 39.12, etc. una variable qualitativa discreta: metge, professor, pallasso, etc. h ) Es
Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4 16 Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

16

c UJI

(2)

a ) Distribuci o de freq u` encies: xi 0 1 2 3 4 5 6 7 8 9 10 b ) El 16 %. c ) 31 estudiants. d ) El 47 %. Freq u` encies absolutes 16 13 e) 6 10 11 13 11 10 6 2 2 Qualicacions examen 0 1 2 3 4 5 6 7 8 9 10 ni 6 10 13 11 13 16 11 10 6 2 2 fi 0.06 0.10 0.13 0.11 0.13 0.16 0.11 0.10 0.06 0.02 0.02 Fi Ni

0.06 6 0.16 16 0.29 29 0.40 40 0.53 53 0.69 69 0.80 80 0.90 90 0.96 96 0.98 98 1.00 100

n = 100

Freq u` encies absolutes acumulades 96 98 100

f) 29 6 16 40

69 53

80

90

Qualicacions examen 0 1 2 3 4 5 6 7 8 9 10
Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4 17 Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

17

c UJI

(3)

a ) Distribuci o de freq u` encies: [li , Li [ [0, 100[ [100, 200[ [200, 300[ [300, 400[ [400, 500[ [500, 600[ [600, 700[ [700, 800[ [800, 900[ [900, 1000] b ) 44. c ) El 93 %. Freq u` encies relatives ni 25 37 12 22 0 21 13 5 3 2 fi 0.18 0.26 0.09 0.16 0 0.15 0.09 0.04 0.02 0.01 Fi 0.18 0.44 0.53 0.69 0.69 0.84 0.93 0.97 0.99 1.00 Ni 25 62 74 96 96 117 130 135 138 140

n = 140

0.26 d) 0.18 0.09 0.16

0.15

0.09 0.04 0.02 0.01 + + + + +0 + + + + + + Nombre de places 0 1 2 3 4 5 6 7 8 9 10 (en centenars)

Freq u` encies relatives acumulades 0.93 0.97 0.84 0.69 0.44 0.18 + + + + + + + + + + + Nombre de places 0 1 2 3 4 5 6 7 8 9 10 (en centenars)
Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4 18 Estadstica. Volum I - UJI

0.99 1

e)

0.53

Estad stica. Volum I - 2009/2010

18

c UJI

(4) Distribuci o de freq u` encies: [li , Li [ [54.5, [59.5, [64.5, [69.5, [74.5, [79.5, [84.5, [89.5, (5) 59.5[ 64.5[ 69.5[ 74.5[ 79.5[ 84.5[ 89.5[ 94.5[ ci 57 62 67 72 77 82 87 92 ni 4 0 2 3 5 2 8 1 fi 0.16 0 0.08 0.12 0.20 0.08 0.32 0.04 Fi 0.16 0.16 0.24 0.36 0.56 0.64 0.96 1.00 Ni 4 4 6 9 14 16 24 25

n = 25

a ) Distribuci o de freq u` encies: xi 1 3.5 4 4.5 5 5.3 5.5 6 6.5 7 7.5 8 9.5 ni 1 1 2 3 3 1 1 4 4 4 4 1 1 fi Fi Ni 1 2 4 7 10 11 12 16 20 24 28 29 30

0.035 0.035 0.035 0.07 0.07 0.14 0.1 0.24 0.1 0.34 0.035 0.375 0.035 0.41 0.13 0.54 0.13 0.67 0.13 0.80 0.13 0.93 0.035 0.965 0.035 1.00

n = 30

b ) El 24 %. c ) El 69 %. (6) a.1) Distribuci o de freq u` encies: xi ni fi Fi Ni 5 12 22 33 40 44 47 49 50


19 Estadstica. Volum I - UJI

30 5 0,1 0,1 40 7 0,14 0,24 50 10 0,2 0,44 70 11 0,22 0,66 75 7 0,14 0,80 80 4 0,08 0,88 100 3 0,06 0,94 120 2 0,04 0,98 150 1 0,02 1

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estad stica. Volum I - 2009/2010

19

c UJI

a.2) Distribuci o de freq u` encies (dades acumulades): [li , Li [ ci ni fi Fi Ni 12 33 44 49 50

[25, 50[ 37,5 12 0,24 0,24 [50, 75[ 62,5 21 0,42 0,66 [75, 100[ 87,5 11 0,22 0,88 [100, 125[ 112,5 5 0,1 0,98 [125, 150] 137,5 1 0,02 1,00 Freq u` encies absolutes 11 7 4 3

10 b.1) 5 7

Preu per habitaci o (en euros)

30 40 50 70 75 80 100 120 150

Freq u` encies absolutes 21

b.2)

12

11 5

Preu per habitaci o (en euros) c) El 34 %. d) 35 hotels.

+ 25

+ 50

1 + + + + 75 100 125 150

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

20

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

20

c UJI

(7) Distribuci o de freq u` encies: [li , Li [ ni fi 0.3 0,4 0.15 0,1 0.05 Ni 60 140 170 190 200

[0, 10[ 60 [10, 20[ 80 [20, 30[ 30 [30, 40[ 20 [40, 50] 10

(8)

a ) Distribuci o de freq u` encies: [li , Li [ [50, [55, [60, [65, [70, [75, [80, 55[ 60[ 65[ 70[ 75[ 80[ 85[ ci ni fi Fi Ni 2 9 26 56 70 77 80

52.5 2 0.025 0.025 57.5 7 0.0875 0.1125 62.5 17 0.2125 0.325 67.5 11 0.375 0.7 72.5 11 0.175 0.875 77.5 5 0.0875 0.9625 82.5 1 0.0375 1

b ) El 32.5 %. c) Freq u` encies absolutes acumulades 77 80

70 56 26

Pes en kg

+ + + + + + + + 50 55 60 65 70 75 80 85

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

21

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

21

c UJI

(9) a.1) Distribuci o de freq u` encies: xi 1 2 3 4 5 6 7 8 ni 7 fi Fi Ni 7 20 30 38 44 52 55 60 n = 60

0,116 6 0,116 6 13 0,266 0,3 3 10 0,16 6 0,5 8 6 8 3 5 0,13 3 0,1 0,13 3 0,05 0,0833 0,63 3 0,73 3 0,86 6 0,916 6 1

a.2) El 66. 6 %. a.3) 25 persones. b.1) Distribuci o de freq u` encies: [li , Li [ [1, 4[ [4, 7[ [7, 9[ ci ni fi Fi Ni 30 52 60

2.5 30

0.5 0.5 5.5 22 0.36 6 0.83 3 8 8 0.133 1

b.2) El 50 %.

(10) Distribuci o de freq u` encies: [li , Li [ [100, 200[ [200, 300[ [300, +[ ni 3 7 5 fi Fi Ni 3 10 15 n = 15

0,2 0,2 0,6 0,466 6 0,3 3 1

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

22

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

22

c UJI

TEMA 2 DUNA MOSTRA: MESURES DESCRIPCIO DESCRIPTIVES


Per a dades qualitatives, la distribuci o de freq u` encies proporciona un resum conc s i complet de la mostra, per` o per a variables quantitatives pot complementarse utilitzant mesures descriptives num` eriques tretes de les dades. Les mesures descriptives s on valors num` erics calculats a partir de la mostra i que ens resumeixen la informaci o que aquesta cont e. En la part dinfer` encia estad stica, les anomenarem estad stics. 2.1. MESURES DE POSICIO Ens donen el valor que ocupa una determinada posici o respecte de la resta de la mostra. ` 2.1.1. MESURES DE TENDENCIA CENTRAL Ens donen un centre de la distribuci o de freq u` encies. S on valors que poden considerar-se com a mesura resum de totes les dades. Hi ha diferents formes de denir el centre de les observacions dun conjunt de dades. Per ordre dimport` ancia s on: 1. Mitjana aritm` etica (o simplement mitjana) (x): es el quocient entre la suma de totes les dades i el nombre total daquestes (tenint en compte que si un valor es repeteix, cal considerar-ne totes les repeticions). Es calcula mitjan cant: 1 xi n i = xi fi . n i=1 i=1
k k

x=

Si les dades estan agrupades en intervals, usarem la marca de classe, ci , en lloc de xi . la mesura de centralitzaci Es o m es important. Exemple 2.1 En lexemple 1.1, del tema anterior, la mitjana de lls per fam lia es: 126 0 2 + 1 4 + 2 21 + 3 15 + 4 6 + 5 1 + 6 1 = = 2.52 lls. 50 50
k

x=

Haur em pogut calcular-la tamb e com x =

xi fi , es a dir:

i=1

x = 00.04+10.08+20.42+30.3+40.12+50.02+60.02 = 2.52 lls.


Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4
Estad stica. Volum I - 2009/2010

23

Estadstica. Volum I - UJI


23 c UJI

Exemple 2.2 El preu mitj` a de les habitacions en lexemple 1.2, del tema anterior, el calculem utilitzant les marques de classe, es a dir:

x=

34.5 2 + 39.5 7 + 44.5 12 + 49.5 10 + 54.5 4 + 59.5 5 = 47.25 e. 40

O, equivalentment:

x = 34.50.05+39.50.175+44.50.3+49.50.25+54.50.1+59.50.125 = 47.25 e. Les propietats m es importants de la mitjana s on: (a) Si a tots els valors duna variable els sumem una constant C , la mitja a dir, queda na aritm` etica queda augmentada en aquesta constant. Es afectada pels canvis dorigen de la mateixa manera que les dades: yi = C + xi y = C + x. Demostraci o:

1 1 1 1 y= y i ni = (C + xi )ni = C ni + xi n i = C + x, n i=1 n i=1 n i=1 n i=1 ja que


k

ni = 1

i=1

(b) Si tots els valors duna variable els multipliquem per una constant C , la seua mitjana aritm` etica queda multiplicada per la mateixa constant. Es a dir, la mitjana aritm` etica queda afectada pels canvis descala de la mateixa manera que les dades: yi = Cxi y = Cx. Demostraci o: 1 1 1 yi ni = Cxi ni = C xi ni = Cx y= n i=1 n i=1 n i=1
k k k

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

24

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

24

c UJI

(c) Com a corollari dambdues propietats anteriors, si considerem la transformaci o lineal yi = A + Cxi , on A i C s on dues constants qualssevol, la mitjana arirm` etica de la nova variable es: y = A + Cx. Demostraci o: Es evident a partir de les propietats anteriors. (d) La suma de totes les difer` encies entre els valors de la variable i la mitjana es 0.
k i=1

(xi x)ni = 0,

es a dir, la mitjana es el centre de gravetat de les observacions. Demostraci o:


k i=1

(xi x)ni =

k i=1

xi n i

k i=1

xni = nx nx = 0

(e) La suma de les desviacions al quadrat dels valors de la variable respecte a una constant C qualsevol es m nima quan aquesta constant es la mitjana aritm` etica. Es a dir:
k i=1

(xi x) ni

k i=1

(xi C )2 ni , per a qualsevol constant C .

2. Mediana (M e): es el valor per al qual, quan totes les observacions sordenen de m es baixa a m es alta, la meitat daquestes es m es petita que aquest valor i laltra meitat, m es gran. Si el nombre de dades es imparell, la mediana ser` a el valor central; si es parell, prendrem com a mediana la mitjana aritm` etica dels dos valors centrals. La forma m es c` omoda de calcular-la es usant les freq u` encies acumulades. (a) Distribucions no agrupades n 1) Calculem . 2 2) Mirem en la distribuci o de freq u` encies la columna de les freq u` encies absolutes acumulades i hi busquem la freq u` encia Ni que fa ca complir n que Ni1 < Ni : 2 n Si < Ni , aleshores la mediana es aquell valor la freq u` encia 2 acumulada del qual es Ni , es a dir: M e = xi , de manera que n < Ni . 2

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

25

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

25

c UJI

n Si = Ni (noteu que aix` o nom es pot passar quan n es parell), la 2 mediana es la mitjana aritm` etica daquells valors la freq u` encia acumulada dels quals es Ni i Ni+1 , respectivament, es a dir: Me = xi + xi+1 n , de manera que = Ni . 2 2

Exemple 2.3 Mediana del nombre de lls de lexemple 1.1:

xi 0 1 2 3 4 5 6

ni 2 4 21 15 6 1 1

Ni 2 62 27 42 48 49 50 n = 50 n = 25 2 N2 = 6 < 25 27 = N3 Per tant, M e = x3 = 2 lls.

(b) Distribucions agrupades per intervals n . 2

1) Calculem

2) Mirem en la distribuci o de freq u` encies la columna de les freq u` encies absolutes acumulades i hi busquem la freq u` encia Ni que fa ca comn plir que Ni1 < Ni . A aquesta freq u` encia, li correspon linterval 2 [li , Li [ (que anomenarem interval medi` a); a continuaci o, per obtindre la mediana, aplicarem la f ormula seg uent: n Ni1 ai M e = li + 2 . ni El raonament per a justicar la utilitzaci o daquesta f ormula es el seg uent: la freq u` encia absoluta acumulada ns a linterval anterior al medi` a es Ni1 . Per a arribar a la meitat de es a dir, n les dades, n per a arribar ns a , necessitem prendre Ni1 dades de 2 2 linterval medi` a (el qual cont e ni ) repartides en una amplitud ai .
Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4 26 Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

26

c UJI

Com que a cada dada correspon una longitud dades, els corrrespondr` a la longitud: n Ni1 ai 2 . ni

n ai , a les Ni1 ni 2

Exemple 2.4 Mediana del preu de les habitacions dels 40 hotels de lexemple 1.2:

[li , Li [ [32, 37[ [37, 42[

ni 2 7

Ni 2 9 21 31 35 40

n = 40
n 2

= 20

[42, 47[ 12 [47, 52[ 10 [52, 57[ [57, 62] 4 5

N2 = 9 < 20 21 = N3 Interval medi` a: [37, 42[ M e = 37 +


9)5 ( 40 2 7

= 44,86 e

Les propietats m es importants de la mediana s on: (a) Si a tots els valors duna variable els sumem una mateixa constant C , la a dir, la mediana mediana queda augmentada en aquesta constant. Es queda afectada pels canvis dorigen de la mateixa manera que les dades: y i = C + xi M ey = C + M e x . (b) Si tots els valors duna variable els multipliquem per una constant C , la a dir, la seua mediana queda multiplicada per la mateixa constant. Es mediana queda afectada pels canvis descala de la mateixa manera que les dades: yi = Cxi M ey = CM ex . (c) Com a corollari de totes dues propietats anteriors, si considerem la transformaci o lineal yi = A+Cxi , on A i C s on dues constants qualssevol, la mediana de la nova variable es: M ey = A + CM ex . (d) La mediana fa m nima la suma de totes les desviacions absolutes dels a dir: valors de la variable respecte a una constant C qualsevol. Es
k i=1

|xi M e| ni

k i=1

|xi C | ni , per a qualsevol constant C .


27 Estadstica. Volum I - UJI

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estad stica. Volum I - 2009/2010

27

c UJI

3. Moda (M o): es el valor de la variable que m es es repeteix, es a dir, la freq u` encia (absoluta o relativa) del qual es m es alta. No t e per qu` e ser u nica. Per a calcular-la distingirem: (a) Distribucions no agrupades Simplement observem en la columna de les freq u` encies absolutes i triem aquell valor o aquells valors de la variable que tenen m es freq u` encia. Quan trobem dues modes, diem que la distribuci o es bimodal; quan en trobem tres, trimodal, etc. Exemple 2.5 Moda del nombre de lls per fam lia de lexemple 1.1: xi 0 1 2 3 4 5 6 ni 2 4 21 15 6 1 1

ni m es alt = 21 Correspon a n3 . Per tant, M o = x3 = 2 lls.

ai

ni+1

li

Li

Figura 2.1: Representaci o de la moda en distribucions agrupades

(b) Distribucions agrupades per intervals 1) Intervals digual amplitud: observant les freq u` encies absolutes, determinem linterval amb m es freq u` encia [li , Li [ (que anomenarem interval modal). A continuaci o, per a calcular la moda, aplicarem la f ormula seg uent:
28

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

28

c UJI

M o = li +

ni+1 ai . ni1 + ni+1

El raonament per a justicar la utilitzaci o daquesta f ormula (observeu la gura 2.1) es el seg uent: considerem els intervals anterior i posterior al modal, amb freq u` encies respectives ni1 i ni+1 . Si aquestes freq u` encies s on iguals, la moda es el centre de linterval modal. En cas contrari, la moda estar` a m es prop daquell interval contigu, la freq u` encia del qual es m es alta, es a dir, les dist` ancies de la moda als intervals contigus al modal s on inversament proporcionals a les freq u` encies daquests intervals. Com a conseq u` encia da c` o, tindrem: m ni+1 = . ai m ni1 Si a llem m i substitu m, obtenim la f ormula anterior. M o = li + m, on m permet que Exemple 2.6 Moda del preu de les habitacions dels 40 hotels de lexemple 1.2: [li , Li [ [32, 37[ [37, 42[ ni 2 7 Interval modal: [42, 47[ M o = 42 + 10 5 = 44,94 e 7 + 10 ni m es alt = 12, correspon a n3 .

[42, 47[ 12 [47, 52[ 10 [52, 57[ [57, 62] 4 5

2) Intervals de diferent amplitud: en primer lloc hem de calcular la densitat de freq u` encia de cada interval, que es deneix com: ni . ai Linterval modal, [li , Li [, ser` a ara el que tinga la densitat de freq u` encia m es alta, i per a calcular la moda aplicarem la f ormula anterior, i substituirem les freq u` encies per les densitats de freq u` encia, es a dir: di = M o = li + di+1 ai . di1 + di+1

Nota 2.1 Comparaci o entre mitjana, mediana i moda: Aquestes tres mesures de tend` encia central s on les m es importants i les m es usuals, per` o quan utilitzem luna o laltra?

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4


Estad stica. Volum I - 2009/2010

29
29

Estadstica. Volum I - UJI


c UJI

La mitjana es la millor perqu` e fa u s de tota la informaci o, es a dir, pren en consideraci o tots els valors de la distribuci o. Tamb e t e com a avantatge que es u nica. Linconvenient principal es que es molt sensible a la presentaci o de dades an` omales o at piques, que fan que el seu valor es desplace cap als dits valors. Aix doncs, no es recomanable usar la mitjana en aquests casos. Un altre desavantatge es que pot no coincidir amb un dels valors de la distribuci o. Usarem la mediana quan falle la mitjana. Aquella usa menys informaci o que aquesta, ja que no dep en dels valors de la variable, sin o del lloc que ocupen. Per aquest motiu, t e lavantatge de no estar afectada per observacions extremes. Un altre avantatge davant de la mitjana es que quasi sempre coincideix amb un valor de la variable. La moda es la que menys informaci o utilitza i es, per tant, la pitjor. A m es, pot no ser u nica, la qual cosa es un altre inconvenient. Lavantatge m es important es que podem obtindre-la, tamb e, per a dades qualitatives. Si la distribuci o es sim` etrica i campaniforme, la mitjana, la mediana i la moda coincideixen. En el cas de distribucions campaniformes, la mediana est` a, amb freq u` encia, entre la mitjana i la moda (un poc m es prop de la mitjana). La relaci o seg uent ens permet calcular aproximadament (en distribucions campaniformes) una daquestes mesures en funci o de les altres: M o 3M e 2x. Les mesures de centralitzaci o seg uents tenen un signicat estad stic menys intu tiu i sutilitzen en situacions m es espec ques. 4. Mitjana geom` etrica (G): es deneix com larrel en` esima del producte de les n dades: k n i xn G= i .
i=1

La mitjana geom` etrica sol emprar-se per a fer mitjanes amb percentatges, taxes i nombres ndexs. Propietat 2.1 El logaritme de la mitjana geom` etrica es igual a la mitjana aritm` etica dels logaritmes dels valors de la variable.

5. Mitjana harm` onica (H ): es deneix com el rec proc de la mitjana aritm` etica dels rec procs de les dades: n . H= k 1 ni i=1 xi Sol utilitzar-se per a fer mitjanes amb velocitats, rendimients i, en general, magnituds expressades en termes relatius.
30

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

30

c UJI

Nota 2.2 Si les dades estan agrupades, per a calcular totes dues mesures anteriors utilitzarem les marques de classe, es a dir, ci en lloc de xi . Propietat 2.2 Les tres mitjanes estan relacionades mitjan cant: H G x.

NO CENTRALS: QUANTILS 2.1.2. MESURES DE POSICIO Els quantils s on valors de la distribuci o que la divideixen en parts iguals, es a dir, en intervals que contenen el mateix nombre de valors de la distribuci o. Els m es usuals s on: 1. Percentils: s on 99 valors que divideixen la distribuci o en 100 parts iguals, despr es dhaver ordenat les dades. El percentil dordre p (Pp ) es el menor valor superior al p % de les dades (ordenades les dades de m es baixa a m es alta, deixa el p % de les dades per davant). Els calculem a partir de les freq u` encies acumulades. (a) Dades no agrupades: pn . 100 Es busca en la taula el valor la freq u` encia acumulada del qual es la primera superior o igual al p % de n, es a dir: pn Pp = xi que permeta que Ni1 < Ni . 100 Calculem el p % de n, es a dir, (b) Dades agrupades (utilitzem la mateixa idea que en el c` alcul de la mediana): pn Calculem el p % de n, es a dir, . 100 Busquem linterval [li , Li [ la freq u` encia acumulada del qual verica pn Ni1 < Ni . 100 A continuaci o, per a trobar el percentil, apliquem la f ormula seg uent: p n Ni1 ai Pp = li + 100 . ni

2. Quartils (Qi ): s on els tres valors que divideixen el conjunt de dades ordenades en quatre parts iguals. S on un cas particular dels percentils, de forma que: Q1 = P25 , Q2 = P50 i Q3 = P75 .

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

31

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

31

c UJI

Exemple 2.7 Calcula els tres quartils per a la distribuci o del nombre de lls de les 50 fam lies de lenquesta de lexemple 1.1: xi 0 1 2 3 4 5 6 ni 2 4 21 15 6 1 1 Ni 2 6 27 42 48 49 50 Q1 = P25 ; Q2 = P50 ; Q3 = P75 ;

25 50 = 12,5 Q1 = 2 lls 100 50 50 = 25 Q2 = 2 lls 100 75 50 = 37,5 Q3 = 3 lls 100

Exemple 2.8 Calcula els tres quartils per a la distribuci o del preu per habitaci o dels 40 hotels de lenquesta de lexemple 1.2:

[li , Li [ [32, 37[ [37, 42[

ni 2 7

Ni 2 9 21 31 35 40

Q1 = P25 ;

25 40 = 10 Q1 [42, 47[ 100

[42, 47[ 12 [47, 52[ 10 [52, 57[ [57, 62] 4 5

25 40 9 Q1 = 42 + 100 5 = 42,42 e 12 q2 = P50 ; 50 40 = 20 Q2 [42, 47[ 100

50 40 9 Q2 = 42 + 100 5 = 46,58 e 12 Q3 = P75 ; 75 40 = 30 Q3 [47, 52[ 100

75 40 12 Q3 = 47 + 100 5 = 56 e 10 3. Decils (Di ): s on els nou valors que divideixen la distribuci o, una vegada ordenades les dades de m es baixa a m es alta, en deu parts iguals. Tamb e s on un cas particular dels percentils: D1 = P10 , D2 = P20 , ..., D9 = P90 .

Propietat 2.3 Evidentment, per a qualsevol distribuci o es verica: M e = P50 = Q2 = D5 .

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

32

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

32

c UJI

2.2. MOMENTS Els moments duna distribuci o es deneixen com una generalitzaci o de la mitjana aritm` etica i, com veurem m es endavant, serveixen per a descriure algunes caracter stiques importants de les distribucions de freq u` encies. La propietat m es important es que dues distribucions s on iguals quan tenen iguals tots els moments, i com m es moments iguals tenen m es paregudes s on.

1. El moment respecte a lorigen dordre r (ar ) es la mitjana aritm` etica de a dir: les pot` encies r-` esimes de les dades. Es 1 r ar = x ni . n i=1 i ` Propietat 2.4 Obviament es veriquen: n 1 1 0 xi ni = = 1 i a1 = xi ni = x. n i=1 n n i=1
k k k

a0 =

2. El moment dordre r respecte a la mitjana aritm` etica es: 1 mr = ( x i x ) r ni . n i=1 Propietat 2.5 Els moments dordre r respecte a la mitjana aritm` etica m es comuns veriquen:
k

1 n 1 m0 = (xi x)0 ni = = 1 i m1 = (xi x)r ni = x x = 0. n i=1 n n i=1

2.3. MESURES DE DISPERSIO Les mesures de tend` encia central tenen com a objectiu sintetitzar les dades en un valor representatiu. Les mesures de dispersi o ens diuen ns a quin punt les de tend` encia central s on representatives com a s ntesi de la informaci o. Les mesures de dispersi o quantiquen la separaci o, la dispersi o, i la variabilitat dels valors de la distribuci o respecte dels valors centrals. Distingirem entre mesures de dispersi o absolutes, que no s on comparables entre diferents mostres, i les relatives, que ens permeten comparar-ne diverses.
33

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

33

c UJI

ABSOLUTES 2.3.1. MESURES DE DISPERSIO Per ordre dimport` ancia tenim: 1. Vari` ancia (s2 ): es la mitjana dels quadrats de les dist` ancies entre cada observaci o i la mitjana aritm` etica del conjunt de les observacions: 1 s = ( x i x ) 2 ni = (xi x)2 fi . n i=1 i=1
2 k k

Si les dades estan agrupades per intervals, usarem les marques de classe per a calcular-la, es a dir, ci en lloc de xi . En el cas extrem que totes les observacions siguen iguals, la mitjana coincideix amb aquest valor com u i, en conseq u` encia, la vari` ancia es 0. En general, com m es disperses siguen les observacions, m es grans seran les difer` encies dins dels quadrats i per tant, m es alt es el valor de s2 . Nota 2.3 La vari` ancia es el moment dordre 2 respecte de la mitjana, es a dir, s2 = m2 . Les propietats m es importants de la vari` ancia s on: (a) La vari` ancia mai pot ser negativa: s2 0.
k

(b) Una forma m es senzilla de calcular la vari` ancia es: 1 2 s = xi ni x = x2 x = a2 a2 1 n i=1


2

Demostraci o: s
2

1 1 2 = (xi x)2 ni = (xi 2xi x + x2 )ni = n i=1 n i=1 1 2 1 1 = xi ni 2x xi + x2 ni = n i=1 n i=1 n i=1 1 2 x ni 2x2 + x2 = x2 x2 = a2 a2 = 1 n i=1 i
k k k k

(c) Si a tots els valors duna variable, els sumem la mateixa constant C , la vari` ancia no canvia:
2 y i = C + x i s2 y = sx .

Demostraci o: s2 y = 1 1 1 (yi y )2 ni = (C + xi C x)2 ni = ( x i x ) 2 ni = s 2 x n i=1 n i=1 n i=1


k k k

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

34

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

34

c UJI

(d) Si tots els valors duna variable, els multipliquem per una mateixa constant C , la seua vari` ancia queda multiplicada pel quadrat de la constant:
2 2 yi = Cxi s2 y = C sx .

Demostraci o: s2 y 1 1 1 = (yi y )2 ni = (Cxi Cx)2 ni = C 2 (xi x)2 ni = C 2 s2 x n i=1 n i=1 n i=1


k k k

(e) Com a corollari de les propietats anteriors, si considerem la transformaci o lineal yi = A + Cxi , on A i C s on dues constants qualssevol, la 2 2 nova vari` ancia queda s2 = C s . y x

Exemple 2.9 Vari` ancia del nombre de lls per fam lia de lexemple 1.1:

xi 0 1 2 3 4 5 6

ni 2 4 21 15 6 1 1

x = 2.52 lls 02 2 + 12 4 + 22 21 + 32 15 + 42 6 + 52 1 + 62 1 s = 50
2

(2.52)2 = 1.25 (lls)2

Altres mesures de dispersi o directament relacionades amb la vari` ancia s on les dues seg uents:

2. Desviaci o t pica (s): es larrel quadrada positiva de la vari` ancia. El motiu principal per a utilitzar-la es que la vari` ancia no est` a donada en les mateixes unitats que la variable, sin o en aquestes unitats al quadrat. Les propietats m es importants de la desviaci o t pica, que es dedueixen f` acilment a partir de les corresponents propietats per a la vari` ancia, s on: (a) s 0

(b) yi = C + xi sy = sx

(d) yi = A + Cxi sy = |C | sx
Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4 35 Estadstica. Volum I - UJI

(c) yi = Cxi sy = |C | sx

Estad stica. Volum I - 2009/2010

35

c UJI

Exemple 2.10 En lexemple 2.9, s =

1.25 = 1.12 lls.

3. Quasivari` ancia (s ): la denici o es com la de la vari` ancia, per` o dividint entre (n 1): s
2 k 1 n = ( x i x ) 2 ni = s2 . n 1 i=1 n1

Exemple 2.11 En lexemple 2.9, s =

50 1.25 = 1.27 (lls)2 . 49

4. Desviaci o mitjana respecte de la mitjana aritm` etica (Dx ): es deneix com la mitjana aritm` etica de les desviacions, en valor absolut, respecte de la mitjana aritm` etica: k 1 Dx = |xi x| ni . n i=1 Si pren valors grans, signica que els valors de la variable es distribueixen en valors allunyats de la mitjana. Exemple 2.12 Per al nombre de lls per fam lia de lexemple 1.1: xi 0 1 2 3 4 5 6 ni 2 4 21 15 6 1 1 50 |xi x| |xi x| ni 2.52 1.52 0.52 0.48 1.48 2.48 3.48 5.04 6.08 10.92 7.2 8.88 2.48 3.48 44.08

1 44.08 Dx = = 0.88 lls. |xi x| ni = n i=1 50

5. Desviaci o mitjana respecte de la mediana (DM e ): es deneix com la mitjana aritm` etica de les desviacions, en valor absolut, respecte de la mediana: k 1 DM e = |xi M e| ni . n i=1

Si pren valors grans, signica que els valors de la variable estan dispersos respecte de la mediana.

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

36

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

36

c UJI

Exemple 2.13 Per al cas del nombre de lls: xi 0 1 2 3 4 5 6 ni 2 4 21 15 6 1 1 50 |xi M e| |xi M e| ni 2 1 0 1 2 3 4 4 4 0 15 12 3 4 42

DM e =

1 42 |xi M e| ni = = 0.84 lls. n i=1 50

6. Recorregut o rang mostral (Re ): es la difer` encia entre els valors m es alt i m es baix de les observacions: Re = xm ax xm n . Com m es recorregut, m es dispersi o. Exemple 2.14 Per al cas del nombre de lls: Re = 6 0 = 6 lls. 7. Recorregut interquart lic (RQ): es la difer` encia entre el tercer i el primer quartil. RQ = C3 C1 . Com m es RQ, m es dispersi o. Exemple 2.15 Per al cas del nombre de lls: RQ = 3 2 = 1 ll.

RELATIVES 2.3.2. MESURES DE DISPERSIO Nom es considerarem el coecient de variaci o de Pearson, que es deneix com el quocient entre la desviaci o t pica i el valor absolut de la mitjana aritm` etica: CV = s . |x|

adimensional i val per a comparar dues distribucions que no v Es enen en les mateixes unitats. Representa quantes vegades la mitjana aritm` etica est` a continguda en la desviaci o t pica. Com m es alt es CV , m es gran es la dispersi o i menor la representativitat de la mitjana aritm` etica.

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

37

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

37

c UJI

Exemple 2.16 El coecient de variaci o del nombre de lls es: CV = 1.12 = 0.44 2.52

DUNA DISTRIBUCIO DE FREQU ENCIES ` 2.4. TIPIFICACIO Es diu que una variable estad stica est` a tipicada quan la seua mitjana arim` etica es 0 i la seua vari` ancia (o la seua desviaci o t pica) es 1. Suposem que apliquem a les dades la transformaci o seg uent: zi = xi x , sx

es a dir, a cada valor de la variable, li restem la mitjana i despr es dividim entre la desviaci o t pica. Es tracta, doncs, duna transformaci o lineal zi = A + Cxi , 1 on A = sx i C = . Usant la propietat c de la mitjana i la propietat d de la sx x desviaci o t pica, es f` acil demostrar que la nova distribuci o de freq u` encies t e mitjana 0 i desviaci o t pica 1. Aleshores direm que la mostra o la distribuci o de freq u` encies est` a tipicada i la transformaci o realitzada, lanomenarem tipicaci o. 2.5. MESURES DE FORMA Comparen la forma que t e la representaci o gr` aca de la distribuci o, b e siga lhistograma o el diagrama de barres, amb la distribuci o normal. 2.5.1. MESURES DASIMETRIA Mesuren la simetria de la distribuci o. Suposem que hem representat gr` acament una distribuci o de freq u` encies; tracem una perpendicular a leix dabscisses per o es sim` etrica si a ambd os labscissa corresponent a x. Direm que la distribuci costats de la perpendicular tra cada existeix el mateix nombre de valors, equidistants dos a dos, i cada parell de punts equidistants amb la mateixa freq u` encia. 1. El coecient dasimetria de Fisher (g1 ): g1 =
k 1 m3 3 ( x x ) n = . i i ns3 i=1 s3

Si la distribuci o es sim` etrica, en el numerador tindrem tantes desviacions positives com negatives i per tant, g1 = 0. Si g1 > 0, la distribuci o es asim` etrica positiva o asim` etrica per la dreta. Si g1 < 0, la distribuci o es asim` etrica negativa o asim` etrica per lesquerra.

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

38

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

38

c UJI

Exemple 2.17 Coecient dasimetria de Fisher per al nombre de lls: xi 0 1 2 3 4 5 6 ni 2 4 21 15 6 1 1 50 xi x -2.52 -1.52 -0.52 0.48 1.48 2.48 3.48 (xi x)3 -16.003 -3.512 -0.141 0.11 3.242 15.253 42.144 (xi x)3 ni -32.006 -14.047 -2.953 1.658 19.451 15.253 42.144 29.5

x = 2.52 lls sx = 1.12 lls g1 = 29.5 = 0.42 > 0 50 (1.12)3

Distribuci o asim` etrica per la dreta

En el dibuix seg uent poden observar-se els diferents tipus dasimetries:

Sim` etrica

Sim` etrica

Asim` etrica per la dreta

Asim` etrica per lesquerra

Asim` etrica per la dreta

Asim` etrica per lesquerra

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

39

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

39

c UJI

2. El coecient dasimetria de Pearson (As ): es molt m es f` acil de calcular que lanterior, per` o sols es aplicable a les distribucions que nom es tenen una moda i que tenen forma de campana. Es deneix com: x Mo . s

As =

Si la distribuci o es sim` etrica, x = M o i per tant, As = 0. Si As > 0, la distribuci o es asim` etrica positiva. Si As < 0, la distribuci o es asim` etrica negativa.

Exemple 2.18 Per al cas de lexemple 1.1: M o = 2 lls, x = 2.52 lls i s = 1.12 lls. Per tant:

As =

x Mo 2.52 2 = = 0.46 > 0 Distribuci o asim` etrica positiva. s 1.12

2.5.2. MESURES DAPUNTAMENT O CURTOSI Mesuren la quantitat de dades que sagrupen en torn a la mitjana. Sols tenen sentit en les distribucions campaniformes, es a dir, unimodals sim` etriques o lleugerament asim` etriques. Si per a valors pr` oxims a la mitjana les freq u` encies s on m es altes que en la distribuci o normal, la gr` aca ser` a molt apuntada en aquesta zona, i es diu que la distribuci o es leptoc urtica. Quan s on m es baixes que en la normal, direm que la distribuci o es platic urtica. Finalment, quan la distribuci o de freq u` encies es igual dapuntada que la normal, direm que es una distribuci o mesoc urtica.

El coecient dapuntament o curtosi (g2 ) es deneix com: g2 =


k 1 m4 (xi x)4 ni 3 = 4 3. 4 ns i=1 s

Si g2 > 0, es leptoc urtica; si g2 < 0, platic urtica i si g2 = 0, mesoc urtica. En la gura 2.2, pot observar-se una representaci o gr` aca de la curtosi.

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

40

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

40

c UJI

Exemple 2.19 Curtosi per al nombre de lls de lexemple 1.1:

xi 0 1 2 3 4 5 6

ni 2 4 21 15 6 1 1 50

xi x -2.52 -1.52 -0.52 0.48 1.48 2.48 3.48

(xi x)4 40.327 5.338 0.073 0.053 4.798 37.827 146.662

(xi x)3 ni 80.655 21.352 1.533 0.795 28.788 37.827 146.662 317.612 317.612 3 = 1.037 > 0 50 (1.12)4

g2 =

Distribuci o leptoc urtica

Normal

Normal

Platic urtica

Leptoc urtica

Figura 2.2: Representaci o de diversos tipus dapuntament

2.6. MESURES DE CONCENTRACIO Les mesures de concentraci o tracten de posar de maniest el grau digualtat en el repartiment total dels valors de la variable. S on, per tant, indicadors del grau dequidistribuci o de la variable. Aquestes mesures tenen especial aplicaci oa variables de tipus econ` omic: rendes, salaris, etc. Suposem que tenim n subjectes i els valors de la variable (rendes, salaris, etc.) s on: x1 x2 xn i ens interessa estudiar ns a quin punt la suma total de valors (renda total, suma dels salaris, etc.) est` a equitativament repartida. Les dues situacions extremes s on:

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

41

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

41

c UJI

Concentraci o m` axima: dels n subjectes, nom es un rep el total i la resta, res: x1 = x2 = = xn1 = 0, Concentraci o m nima: tots tenen el mateix valor: x1 = x2 = = xn1 = xn . xn = 0.

Nota 2.4 Cal considerar que, des dun punt de vista estad stic, els termes dispersi o i concentraci o no s on oposats. Recordem que el primer fa refer` encia a la variabilitat de les dades respecte de la mitjana; mentre que el segon, com acabem dassenyalar, a la no-equitat en el repartiment de la suma total de la variable. 1. Index de concentraci o de Gini (Ico ). Es construeix a partir de les quantitats seg uents: (a) Calculem, en primer lloc, els productes xi ni , que ens indiquen el total percebut (renda total, guanys totals, etc.) pels ni subjectes amb valor xi (renda, guany, etc.). Aquest producte, es anomenat riquesa de li-` esim grup. (b) Calculem les riqueses acumulades de la variable, que denotarem per ui : u1 = x 1 n 1 u2 = x 1 n 1 + x 2 n 2 u3 = x 1 n 1 + x 2 n 2 + x 3 n 3 . . . uk = x 1 n 1 + x 2 n 2 + + x k n k (c) Les riqueses acumulades (ui ), les representem en tant per cent del total (uk ). Denotem aquests percentatges per qi : ui qi = 100. uk (d) Expressem les freq u` encies relatives acumulades en tant per cent. Denotem aquests percentatges per pi : pi = Ni 100 = Fi 100. n

Una vegada efectuats aquests c` alculs, es deneix l ndex de concentraci o de Gini a partir de la f ormula:
k 1 i=1

Ico =

(pi qi ) pi
i=1

Shi obt e que 0 Ico 1.


Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

k 1

42

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

42

c UJI

Podem observar que:


k 1 i=1 k 1 i=1

pi =1i pi

Si qi = 0, per a i = 1, 2, . . . , (k 1) i qk = 0, aleshores Ico = la concentraci o es m` axima.

Si per a cada i, qi = pi , aleshores Ico = 0 i el repartiment es equitatiu, ja que cada percentatge dindividus poseeix el mateix percentatge de riquesa.

2. Corba de Lorenz: una forma destudiar gr` acament la concentraci o es mitjan cant la corba de Lorenz. Es construeix representant en leix dabscisses el percentatge de freq u` encies acumulades (pi ) i en el dordenades, els percentatges acumulats del total de la variable (qi ). En unir aquests punts obtenim la corba de Lorenz. Per a una millor interpretaci o, se sol dibuixar un quadrat de costat 100 (en la gura 2.3 OABC) i la seua diagonal (OB). Noteu que: Com que per a pi = 0, es qi = 0, la gr` aca sempre passa pel punt (0, 0). Com que per a pi = 100, es qi = 100, la gr` aca sempre passa pel punt (100, 100). Com que pi qi , la gr` aca sempre est` a situada per davall de la diagonal del quadrat (OB) o hi coincideix. En el cas dexistir repartiment equitatiu, es a dir, concentraci o m nima (pi = qi ), la corba coincideix amb la diagonal. Si la concentraci o es m` axima, la corba de Lorenz est` a formada pels costats del quadrat: OA i OB (observeu la gura 2.4).

Es demostra que, aproximadament: Ico = ` Area entre la corba i la diagonal OB . ` Area del triangle OAB

Nota 2.5 L ndex de Gini t e lavantatge, sobre la corba de Lorenz, de resumir la informaci o en una sola xifra, per` o quan realitzem comparacions entre dues distribucions, aquest avantatge t e com a contrapartida negativa que dues distribucions amb aspectes molt diferents poden tindre el mateix ndex de Gini.

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

43

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

43

c UJI

Figura 2.3: Corba de Lorenz

Distribuci o de concentraci o m nima

Distribuci o de concentraci o m` axima

Figura 2.4: Comparaci o de dues corbes de Lorenz

Exemple 2.20 Est` a el nombre de lls molt concentrat en unes poques fam lies en lexemple 1.1? xi 0 1 2 3 4 5 6 ni 2 4 21 15 6 1 1 xi n i 0 4 42 45 24 5 6 ui 0 4 46 91 115 120 126 qi 0 3.17 36.51 72.22 91.27 95.24 100 Fi pi pi q i 4 8.83 17.49 11.78 4.73 2.76 49.59
Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4 44 Estadstica. Volum I - UJI

0.04 4 0.12 12 0.54 54 0.84 84 0.96 96 0.98 98 1 100

Ico =

49.59 = 0.142 348

Poca concentraci o

Estad stica. Volum I - 2009/2010

44

c UJI

2.7. PROBLEMES PROPOSATS (1) Donada la distribuci o xi = {45924, 45926, 45928, 45930, 45932} amb freq u` encies respectives ni = {5, 7, 5, 2, 9}, calculan la mitjana artim` etica. Pots proposar-ne un m` etode senzill de c` alcul? (2) La taula seg uent mostra la distribuci o dels salaris (en euros) en 2005 en la ind ustria tur stica dun determinat pa s: li L i 0 600 600 900 900 1200 1200 1500 1500 1800 1800 2100 2100 2700 2700 4000 > 4000 ni 2140 1525 845 950 1105 2347 615 323 150

Calcula: a ) El salari mitj` a per treballador (pren com a marca de classe de l ultim interval 5000). b ) El salari m es freq uent. c ) El salari que permet ser superior a la meitat dels restants.

(3) Demostra que la mitjana aritm` etica de la variable Z , obtinguda com a suma de les dades daltres dues variables X i Y , es la suma de les mitjanes aritm` etiques daquestes. (4) Calcula la mediana, la moda, el primer i el tercer quartil, el quart decil i el nonag` esim centil de la distribuci o: xi ni 5 3 10 7 15 5 20 3 25 2

(5) Donada la distribuci o de freq u` encies seg uent: xi ni


Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

0 2

10 4

20 7
45

30 5

40 2
Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

45

c UJI

Calcula: a ) Mitjana, moda, mediana, primer i tercer quartil, i quaranta-cinqu e centil. b ) Vari` ancia, desviaci o t pica, coecient de variaci o, i desviaci o mitjana respecte de la mitjana i respecte de la mediana, i recorregut i recorregut interquart lic. c ) El coecient dasimetria i la curtosi. d ) Comenta els resultats.

(6) Dues empreses A i B tenen 100 treballadors cadascuna. Els salaris per dia i treballador s on: A lempresa A, 20 persones perceben 15 euros i 80 perceben 120 euros. A lempresa B , 20 persones perceben 120 euros i 80 perceben 15 euros. a ) Calcula mitjana, vari` ancia, desviaci o t pica i coecient de variaci o en cada cas. Compara els resultats. b ) Obt n la corba de Lorenz i l ndex de concentraci o de Gini en cada cas. Analitza-ho i compara els resultats.

SOLUCIONS (1) x = 45928.2143 (2) a ) x = 1366.35 euros b ) M o = 1865.31 euros c ) M e = 1354.74 euros (4) M e = 12.5, M o = 10, C1 = 10, C3 = 15, D4 = 10, P90 = 20 (5) a ) x = 20.5, M o = 20, M e = 20, C1 = 10, C3 = 30, P45 = 20 b ) s2 x = 124.75, sx = 11.17, CV = 0.55, Dx = 8.65, DM e = 8.5, Re = 40, RQ = 20 c ) As = 0.045, g1 = 0.09848, g2 = 0.65 (6) a ) Empresa A: x = 99, s2 x = 1764, sx = 42, CVx = 0.42 Empresa B : y = 36, s2 y = 1764, sy = 42, CVy = 1.17 b ) Empresa A: Ico = 0.84, Empresa B : Ico = 0.58

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

46

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

46

c UJI

TEMA 3 DISTRIBUCIONS BIDIMENSIONALS


3.1. INTRODUCCIO Es vol fer un estudi dacceptaci o de dos models dimpressores. Per a aquest , es consideren les vendes en una tenda durant un per ode de 25 dies, durant els quals les vendes foren: Model A Model B Model A Model B 0 2 2 1 3 3 1 1 2 2 3 2 2 2 2 2 1 3 3 1 3 1 2 1 3 1 4 1 3 1 2 2 3 2 2 2 4 4 0 1 3 3 2 2 2 1 3 1 3 1

En molts processos de la vida ordin` aria es necessari estudiar simult` aniament dues caracter stiques en una determinada poblaci o, es a dir, dues variables. Lestudi conjunt permet determinar les relacions que guarden. Suposarem, inicialment, que estem observant dues variables encara que el tractament que presentarem es podria generalitzar sense dicultat per a qualsevol nombre de variables. Al llarg del tema usarem la notaci o seg uent: Representarem les variables per X i Y . En lexemple anterior, X = nombre dimpressores del model A que es venen en un dia. Y = nombre dimpressores del model B que es venen en un dia. n: nombre de parells dobservacions. En lexemple, n = 25. xi : cada dada diferent observada en la mostra de X . k : nombre de valors diferents de X . En lexemple, k = 5. yj : cada dada diferent observada en la mostra de Y . h: nombre de valors diferents de Y . En lexemple, h = 4. ENCIES ` 3.2. DISTRIBUCIONS DE FREQU BIVARIANTS CONJUNTA 3.2.1. DISTRIBUCIO Com en el cas duna variable, quan volem descriure conjuntament dues variables, el primer que farem ser` a representar les dades en una taula de freq u` encies. Denici o 3.1 La freq u` encia absoluta conjunta (nij ) dun parell (xi , yj ) es el nombre de vegades que aquest apareix en la mostra. Exemple 3.1 Per al parell (x1 , y3 ) = (0, 2) de lexemple de la introducci o es t e que n13 = 1.

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4


Estad stica. Volum I - 2009/2010

47

Estadstica. Volum I - UJI


47 c UJI

Propietat 3.1 La suma de totes les freq u` encies absolutes conjuntes es el nombre k h total de parells dobservacions, es a dir, nij = n.
i=1 j =1

Denici o 3.2 La freq u` encia relativa conjunta (fij ) dun parell (xi , yj ) es: fij = nij . n

Exemple 3.2 Per al cas de lexemple anterior, f13 = 0.04. Propietat 3.2 La suma de totes les freq u` encies relatives conjuntes es la unitat, es k h fij = 1. a dir,
i=1 j =1

Denici o 3.3 Una distribuci o de freq u` encies conjunta es una taula de doble entrada on, en la primera columna, representarem, ordenats de m es baix a m es alt, els valors observats de la variable X i en la primera la, els de la variable Y . Al centre, les corresponents nij , fij o ambdues. Exemple 3.3 Per a lexemple introductori de les impressores es t e: yj xi 0 1 2 3 4 nj 0 0 0 0 1 1 0 0 3 8 2 1 0 5 4 0 0 1 0 0 0 0 1 2 3 ni 1 1 8 12 3 25

13 10 1

3.2.2. DISTRIBUCIONS MARGINALS Denici o 3.4 Les distribucions marginals s on les dues distribucions unidimensionals que podem obtindre considerant separadament les dades de cadascuna de les variables X i Y . Denici o 3.5 Les freq u` encies marginals s on les que sobtenen en les distribucions marginals. Les obtindrem a partir de les conjuntes. (1) La freq u` encia absoluta marginal per a X (ni ) es el nombre de vegades que es repeteix el valor xi sense tindre en compte els valors de Y (observeu la taula de lexemple 3.3), es a dir: ni =
h j =1

nij

(noteu que sumem la la i).

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

48

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

48

c UJI

(2) La freq u` encia absoluta marginal per a Y (nj ) es el nombre de vegades que es repeteix el valor yj sense tindre en compte els valors de X (observeu la taula de lexemple 3.3), es a dir: nj =
k i=1

nij

(noteu que sumem la columna j ).

Exemple 3.4 En lexemple de la introducci o: x3 = 2; n3 = 3 + 5 = 8. Daltra banda, y2 = 1; n2 = 3 + 8 + 2 = 13. De la mateixa forma podem denir les freq u` encies relatives marginals: fi i fj , que es calculen a partir de les freq u` encies absolutes marginals. Les distribucions daquestes freq u` encies marginals poden tabular-se de forma separada, com ho hem fet al tema anterior, o en la taula conjunta, collocant les ni i les fi en les dues u ltimes columnes, i les nj i les fj en les dues u ltimes les. 3.2.3. DISTRIBUCIONS CONDICIONADES A partir de la distribuci o de freq u` encies conjunta, podem denir un altre tipus de distribucions unidimensionals, tant per a X com per a Y , que denim a continuaci o. Denici o 3.6 Les distribucions condicionades s on les que sobtenen a partir de les conjuntes xant el valor duna de les variables. Exemple 3.5 Nombre dimpressores venudes del model A, at es que sabem que se nha venut una del model B . Denici o 3.7 Les freq u` encies condicionades s on les que sobtenen en les distribucions condicionades. Les obtindrem a partir de les conjuntes. (1) La freq u` encia absoluta condicionada per a X = xi donada Y = yj (ni(j ) ) es el nombre de vegades que es repeteix xi quan nom es considerem els casos en qu` e Y = yj . Es a dir, ni(j ) = nij ; (1 i k ). (2) La freq u` encia absoluta condicionada per a Y = yj donada X = xi (n(i)j ) es el nombre de vegades que es repeteix yj quan nom es considerem els casos en qu` e X = xi . Es a dir, n(i)j = nij ; (1 j h). Propietat 3.3
i=1 k

ni(j ) = nj

i=1

n(i)j = ni .

En les distribucions condicionades no se solen usar les freq u` encies absolutes, perqu` e, com ja sabem, depenen del nombre de dades i el nombre de dades es diferent per a cada distribuci o, ja que dependr` a de la freq u` encia del valor que xem de laltra variable. S on molt m es u tils les freq u` encies relatives condicionades, que denim a continuaci o:
49

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

49

c UJI

Denici o 3.8 Freq u` encia relativa condicionada per a X = xi donada Y = yj (fi(j ) ): nij fi(j ) = . nj Denici o 3.9 Freq u` encia relativa condicionada per a Y = yj donada X = xi (f(i)j ): nij f(i)j = . ni Exemple 3.6 Calcula la distribuci o de freq u` encies del nombre dimpressores ve nudes del model A, quan sabem que del model B sha venut una impressora. Es a dir, calcula la disribuci o de freq u` encies de X condicionada que Y = 1, o siga, condicionada a y2 .

xi 0 1 2 3 4

ni(2) 0 0 3 8 2 13

fi(2) 0 0 0.23 0.62 0.15 1

Nota 3.1 Si la taula resulta molt gran caldr` a agrupar una o ambdues variables en intervals de classe, de la mateixa manera que hem vist al tema 1. En aquest cas, totes les denicions que hem vist en aquest tema, es generalitzen como ho v` arem fer al tema 1. ` 3.2.4. INDEPENDENCIA ESTAD ISTICA Des dun punt de vista exclusivament intu tiu, podem dir que dues variables s on independents quan en xar el valor duna no canvia la distribuci o de freq u` encies de laltra. M es precisament: Denici o 3.10 Direm que X i Y s on variables independents estad sticament quan totes les freq u` encies relatives condicionades s on iguals a les corresponents a dir: freq u` encies marginals. Es fi(j ) = fi ; j = 1, . . . , h i f(i)j = fj ; i = 1, . . . , k .

Denici o 3.11 Direm que X i Y s on variables independents estad sticament quan la freq u` encia relativa conjunta es igual al producte de les freq u` encies relatives a dir: marginals. Es fij = fi fj ; i = 1, . . . , k
50

j = 1, . . . , h
Estadstica. Volum I - UJI

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estad stica. Volum I - 2009/2010

50

c UJI

o, equivalentment: nij ni nj = ; n n n i = 1, . . . , k i j = 1, . . . , h.

GRAFICA: ` 3.3. REPRESENTACIO DIAGRAMA DE DISPERSIO Com en el cas univariant, la forma de la distribuci o conjunta saprecia a primera vista, i es ret e m es f` acilment en la mem` oria, amb una adequada representaci o gr` aca. El diagrama de dispersi o (tamb e anomenat n uvol de punts) sobt e representant cada parell observat (xi , yj ) com un punt en el plan cartesi` a. Sol utilitzar-se amb les dades sense agrupar. Si les dades estan agrupades per intervals, prenem les marques de classe. el tipus de gr` Es ac m es u til, ja que ens permet visualitzar la relaci o entre ambdues variables. Exemple 3.7 Com podem observar en el diagrama de dispersi o per a lexemple de les impressores, en augmentar X disminueix Y .

4 3.5 3 2.5 2 1.5 1 0.5 0 0.5 1 1 0 1 2 3 4 5

Figura 3.1: Diagrama de dispersi o de lexemple 3.3


Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4 51 Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

51

c UJI

Alguns casos que se solen presentar en la pr` actica s on els seg uents: 1. Els punts sagrupen al voltant duna recta y a + bx. a ) Pendent positiu (b > 0): relaci o lineal directa.

b ) Pendent negatiu (b < 0): relaci o lineal inversa.

2. Els punts sagrupen al voltant duna par` abola y ax2 +bx+c: relaci o quadr` atica.

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

52

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

52

c UJI

3. No saprecia cap relaci o.

3.4. MESURES DESCRIPTIVES DUNA DISTRIBUCIO BIDIMENSIONAL 3.4.1. MOMENTS De la mateixa forma que es deneixen els moments en les distribucions unidimensionals, tamb e es poden denir en les distribucions bidimensionals. De nou, algun cas particular ens donar` a certa informaci o sobre la distribuci o de freq u` encies i, en general, podrem armar que els moments la caracteritzen.

1. Moments respecte a lorigen: es deneix el moment dordre r, s respecte a lorigen (ars ) (r = 0, 1, . . .; s = 0, 1, . . .) com: 1 r s ars = x y nij . n i=1 j =1 i j Alguns casos particulars interessants s on: a00 = a10 =
k h 1 n 0 = 1. x0 i yj nij = n i=1 j =1 n k h

k h k 1 1 0 es la mitjana marginal de x1 xi ni = x, que i yj nij = n i=1 j =1 n i=1 la variable X . k h h 1 1 1 a01 = yj nj = y , que es la mitjana marginal de x0 i yj nij = n i=1 j =1 n j =1 la variable Y .

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

53

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

53

c UJI

2. Moments centrals o respecte a la mitjana: es deneix el moment dordre r, s respecte a la mitjana (mrs ) (r = 0, 1, . . .; s = 0, 1, . . .) com: 1 mrs = (xi x)r (yj y )s nij . n i=1 j =1 Alguns casos particulars interessants s on: m00 = m10 = m01 = m20 = m02 =
k h 1 n (xi x)0 (yj y )0 nij = = 1. n i=1 j =1 n k h

k h k k 1 1 1 (xi x)1 (yj y )0 nij = xi ni xni = x x = 0. n i=1 j =1 n i=1 n i=1 k h h h 1 1 1 (xi x)0 (yj y )1 nij = yj nj ynj = y y = 0. n i=1 j =1 n j =1 n j =1 k h k 1 1 (xi x)2 (yj y )0 nij = (xi x)2 ni = s2 x. n i=1 j =1 n i=1

k h h 1 1 (xi x)0 (yj y )2 nij = (yj y )2 n j = s2 y. n i=1 j =1 n j =1

` 3.4.2. MESURES DE DEPENDENCIA LINEAL En lestudi conjunt de dues variables, el que ens interessa principalment es saber si existeix algun tipus de relaci o entre aquestes variables. En lapartat anterior, amb la representaci o gr` aca del diagrama de dispersi o, hem pogut fer-nos una primera idea de si hi existeix algun tipus de relaci o. En aquesta secci o, presentem mesures descriptives que ens permetran analitzar si hi existeix alguna relaci o de tipus lineal, es a dir, de la forma Y = a + bX . Denici o 3.12 Covari` ancia (sxy ). Es deneix com: sxy a dir, sxy = m11 . Es Si hi ha relaci o lineal directa (a valors grans de X corresponen valors grans de Y ), aleshores sxy > 0 i es gran en valor absolut. Si hi ha relaci o lineal inversa (a valors grans de X corresponen valors xicotets de Y ), aleshores sxy < 0 i es gran en valor absolut. Si no hi ha relaci o lineal, aleshores sxy 0.
Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4 54 Estadstica. Volum I - UJI

1 (xi x)(yj y )nij . = n i=1 j =1

Estad stica. Volum I - 2009/2010

54

c UJI

La f ormula seg uent ens permet calcular la covari` ancia duna forma m es senzilla: k h 1 xi yj nij xy = a11 a10 a01 . sxy = n i=1 j =1

Les propietats m es importants de la covari` ancia s on: (1) Si a tots els valors de la variable X sumem una constant C , i a tots els valors a dir: de la variable Y sumem una constant C , la covari` ancia no varia. Es zi = C + x i , tj = C + yj szt = sxy .

(2) Si tots els valors de la variable X els multipliquem per una constant C , i tots els valors de la variable Y els multipliquem per una constant C , la covari` ancia queda multiplicada pel producte de les constants. Es a dir: zi = C x i , tj = C yj szt = CC sxy .

(3) Com a corollari de totes dues propietats anteriors, si considerem les transformacions lineals zi = a + bxi i tj = a + b yj , on a, b, a , b s on constants qualssevol, aleshores szt = bb sxy .

Exemple 3.8 Per al cas dels models dimpressores, es t e: x = 2.6 impressores, y = 1.44 impressores i, en conseq u` encia: sxy = 0 0 0 + 0 1 0 + (2.6 1.44) = 0.344. 25

Suposem ara que cada impressora del model A val 120 euros i que el preu duna impressora del model B es de 150 euros. Aleshores, la quantitat invertida en la compra dimpressores model A i impressores model B la podem obtindre posant: Z = 120 X, T = 150 Y .

Daquesta manera, Z representa els diners invertits en la compra dimpressores del model A, i T els diners invertits en la compra dimpressores del model B , i sobt e aix : szt = 120 150 sxy = 6192. Linconvenient principal de la covari` ancia com a mesura de la relaci o lineal entre dues variables es la dep` endencia respecte de les unitats i, en conseq u` encia, respecte dels canvis descala. Denim a continuaci o una mesura que no est` a afectada per les unitats i, en conseq u` encia, tampoc pels canvis dunitats de mesura.

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

55

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

55

c UJI

Denici o 3.13 Coecient de correlaci o (rxy ). Es deneix com: rxy = sxy . sx sy

Les propietats principals s on: adimensional. (1) Es (2) 1 rxy 1. (3) Si hi ha relaci o lineal directa, aleshores rxy > 0 i pr` oxim a 1. (4) Si hi ha relaci o lineal inversa, aleshores rxy < 0 i pr` oxim a 1. (5) Si no hi ha relaci o lineal, aleshores rxy 0.

Exemple 3.9 Per al cas dels dos models dimpressores: sx = 0.8 = 0.89, sy = 0.41 = 0.64 rxy = 0.344 = 0.9427. 0.89 0.41

Finalitzarem el tema donant una condici o necess` aria per a la independ` encia estad stica. Teorema 3.1 Si X i Y s on independents, aleshores sxy = 0. Demostraci o: Aplicant la primera propietat de la covari` ancia, i tenint en nij compte que fij = , podem escriure: n sxy =
k h i=1 j =1

xi yj fij xy.

Ara b e, com que les variables s on independents, la freq u` encia relativa conjunta es el producte de les freq u` encies relatives marginals. Per tant:
k h i=1 j =1 k i=1 k h i=1 j =1

sxy = =

xi yj fij xy =
h j =1

xi yj fi fj xy =

xi fi

yj fj xy = xy xy = 0.

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

56

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

56

c UJI

Corollari 3.1 Si X i Y s on independents, aleshores rxy = 0. evident, tenint en compte el resultat anterior, ja que: Demostraci o: Es rxy = sxy . sx sy

Nota 3.2 Existeixen casos en qu` e la covari` ancia entre dues variables pot ser zero sense que aquestes siguen independents.

3.5. PROBLEMES PROPOSATS (1) Les seg uents s on les qualicacions obtingudes per 25 alumnes de 2n curs de la Diplomatura en Ci` encies Empresarials en les assignatures Matem` atiques i Comptabilitat: Matem` atiques Comptabilitat Matem` atiques Comptabilitat 4 3 8 7 5 5 8 7 5 5 8 8 5 6 8 8 6 7 8 8 6 7 8 8 7 7 9 8 7 7 9 8 7 7 7 7 9 9 8 10 7 8 9 10 7 8 7 8 10 10

a ) Obt n la taula de freq u` encies conjunta. b ) Quina proporci o dalumnes obt e m es dun 5 en ambdues assignatures? Quina proporci o dalumnes obt e m es dun 5 en Matem` atiques? Quina proporci o dalumnes obt e m es dun 5 en Comptabilitat? c ) S on independents les qualicacions en Matem` atiques i Comptabilitat? d ) Representa el diagrama de dispersi o i comental. e ) Calcula el coecient de correlaci o i interpretan el resultat.

(2) Es pret en fer un estudi sobre la utilizaci o dun esc` aner en una determinada ocina. Per a aquest es van mesurar, durant un dia, els minuts transcorreguts entre les successives utilitzacions (X ) i el nombre de p` agines escanejades (Y ), i es van obtindre els resultats seg uents: X Y X Y 8 8 2 7 8 8 11 19 3 2 9 7 5 7 7 2 8 19 8 7 14 7 6 7 9 7 5 8 7 2 19 8 8 9 7 9 11 7 11 7 7 11 7 8 7 9 19 8 11 9 19

7 11 7

11 11

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

57

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

57

c UJI

a ) Escriu la distribuci o de freq u` encies conjunta. Quin es el percentatge de vegades que transcorren m es de 8 minuts des de la utilitzaci o anterior de lesc` aner i sescanegen menys d11 p` agines? b ) Escriu les distribucions de freq u` encies marginals. Quantes vegades sescanegen com a m` axim 11 p` agines? Quantes p` agines sescanegen com a m` axim el 80 % de les ocasions? c ) Troba la distribuci o de freq u` encies del nombre de p` agines escanejades condicionada que hagen transcorregut 8 minuts entre utilitzacions successives. d ) Dibuixa el diagrama de dispersi o.

(3) De la distribuci o (xi , yj , nij ), per a 100 observacions, es t e que: xi ni = 500, yj nj = 1000, xi yj nij = 6000.
i j i j

a ) Quant val la covari` ancia entre X i Y ? 3U + 4 2Z + 3 iY = ? b ) I la covari` ancia entre U i Z , si X = 2 2

(4) Lassignatura Comptabilitat Financera consta de dues parts, una de te` orica i una altra de pr` actica. A lexamen nal es varen presentar 10 alumnes, que van obtindre les qualicacions seg uents: Teoria Pr` actica 5 7 6 5 6 8 9 6 3 4 1 2 2 1 4 3 6 7 8 8

Calcula la covari` ancia i el coecient de correlaci o lineal. Dibuixa el n uvol de punts. Comentan els resultats.

(5) Entre els empleats duna empresa es disposa dinformaci o sobre els seus salaris (en milers deuros) i el nombre de vehicles de motor que shan adquirit en els u ltims 5 anys:

Vehicles Salaris [18, 27[ [27, 45]

0 1 2 3 0 0

2 1 2

3 0 2

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

58

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

58

c UJI

Calcula: a ) El percentatge dempleats que cobra menys de 27000 euros i que t e m es dun vehicle. b ) La covari` ancia. c ) Lajuda mitjana per empleat si lempresa d ona una ajuda de 100 euros per a ladquisici o dels vehicles a tots els empleats (adquirisquen o no vehicle) m es 300 euros per cada vehicle adquirit. d ) La covari` ancia entre lajuda i el salari.

SOLUCIONS (1) a) yj xi 4 5 6 7 8 9 10 n j 1 2 1 8 10 0 1 2 1 2 4 2 3 4 3 2 1 3 3 5 6 7 8 9 10 ni 1 3 2 7 6 5 1 25

b ) 84 %, 84 %, 88 % c ) No s on independents. e) rxy = 0.8782

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

59

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

59

c UJI

(2) a.1) yj xi 3 5 6 7 8 9 11 14 n j a.2) 21.43 % b.1) Mireu la taula anterior. b.2) 23 b.3) 23 c) y(5)j 2 7 11 19 (3) a ) sxy = 10 20 b ) suz = 3 n(5)j 2 4 3 2 1 2 1 2 1 1 4 3 2 1 4 14 5 5 1 3 1 2 2 1 2 7 11 19 ni 1 2 1 3 11 6 3 1 28

(4) sxy = 4.6, rxy = 0.8 (5) a ) 10 % b ) sxy = 5.4 c ) 550 e d ) 1620 e

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

60

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

60

c UJI

TEMA 4 I CORRELACIO LINEAL REGRESSIO


METODE ` 4.1. INTRODUCCIO. DELS M INIMS QUADRATS En el tema anterior v` arem veure que el diagrama de dispersi o o n uvol de punts ens permet visualitzar la relaci o entre dues variables X i Y . En representar el diagrama de dispersi o podem trobar les situacions seg uents: Distribucions estad stiques per a les quals el n uvol de punts es disposa de tal forma que existeix una funci o matem` atica els punts de la qual s on una part de la seua representaci o gr` aca. Distribucions estad stiques per a les quals el n uvol de punts, sense coincidir exactament amb la gr` aca duna funci o matem` atica, shi aproxima encara que siga poc. Distribucions estad stiques per a les quals el n uvol de punts presenta un aspecte de tal manera que no existeix concentraci o de punts pr` oxima a cap gr` aca duna funci o matem` atica, i es distribueix duna forma uniforme en una regi o del pla. En el primer cas es diu que hi ha una depend` encia funcional o exacta entre les variables X i Y , es a dir, existeix una funci o matem` atica de manera que Y = f (X ). En el segon cas es diu que hi ha una depend` encia estad stica o aproximada entre ambdues variables: Y f (X ). I en l ultim cas diem que les variables s on independents. Y

X Depend` encia funcional

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

61

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

61

c UJI

X Depend` encia estad stica

X Independ` encia entre variables

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4


Estad stica. Volum I - 2009/2010

62
62

Estadstica. Volum I - UJI


c UJI

Les t` ecniques de regressi o socupen del segon cas que hem citat anteriorment i tenen per objecte modelitzar, es a dir, trobar una funci o que aproxime el m` axim possible la relaci o de depend` encia estad stica entre variables i predir-ne els valors duna (Y ) a partir dels valors de laltra (o les altres): (X o X1 , X2 , . . . , Xn ). La variable (o variables) coneguda, lanomenarem variable(s) independent(s) o explicativa(ves), i la variable que volem predir, variable dependent o explicada. Anomenarem regressi o de Y sobre X la funci o que explica la variable Y (dependent) per a cada valor de la variable X (independent): Y f (X ). Diem que la regressi o es: Lineal, quan el model o funci o de regressi o seleccionada es una recta. En qualsevol altre cas lanomenarem regressi o no lineal. Simple, quan sols tenim una variable independent. M ultiple, quan tenim dues o m es variables independents. El procediment que seguirem per a efectuar la regressi o ser` a el seg uent: 1) Elegir un tipus de funci o o corba que creguem que millor relaciona ambdues variables. A c` o, ho podrem fer observant el n uvol de punts. 2) Obtindre lequaci o de la corba entre les innites daquest tipus que hi ha en el pla, que millor sadapte al conjunt de punts. Lobjectiu dobtindre aquesta equaci o es predir el valor de la variable Y per a un valor concret, x0 , de la variable X . 3) Obtindre una mesura del grau daquesta associaci o o correlaci o. A c` o ens d ona la abilitat de les prediccions que farem amb aquesta equaci o. Els dos primers passos sengloben dins del que es coneix com a teoria de la regressi o, mentre que el tercer es el que es coneix com a teoria de la correlaci o. El problema que planteja el segon pas, lobtenci o de la funci o, es coneix com a problema de lajustament, i es poden usar diferents m` etodes matem` atics per tal de resoldrel, com per exemple: el dels m nims quadrats, el dels polinomis ortogonals, el dels moments, el de la corba log stica, etc. Nosaltres sols desenvoluparem el primer. Nota 4.1 En aquest tema, nom es considerarem la mostra original, sense ordenar ni agrupar en una taula de freq u` encies, es a dir: X Y x1 y1 x2 y2
63

xn yn

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

63

c UJI

` 4.1.1. EL METODE DELS M INIMS QUADRATS Donats els punts (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ), suposem que hem elegit una funci o y = f (x/a1 , a2 , . . . , ar ) que volem ajustar a aquest conjunt de punts i en la qual intervenen r par` ametres (a1 , a2 , . . . , ar ). Considerem el n uvol de punts corresponent:

Y f (x/a1 , a2 , . . . , ar ) y = a1 x + a2
yi

yi

} e =y y
i i

xi

Per a cada valor xi de X , tenim dos valors de Y : El valor observat, yi , en la mostra (o en el n uvol de punts).
El valor te` oric, yi (en general distint de lanterior), que sobt e en substituir xi per x en la funci o, es a dir, yi = f (xi /a1 , a2 , . . . , ar ) (yi = a1 xi + a2 , en el cas lineal).

Aix , per a cada xi tenim una difer` encia entre tots dos valors de Y . Aquesta difer` encia sanomena residu(ei ):
ei = yi yi .

El m` etode dels m nims quadrats consisteix a determinar els par` ametres a (a1 , a2 , . . . , ar ) de tal forma que la suma dels residus al quadrat siga m nima. Es dir, busquem minimitzar lexpressi o: =
n i=1

e2 i

n i=1

(yi

2 yi )

n i=1

(yi f (xi /a1 , a2 , . . . , ar ))2 .

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

64

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

64

c UJI

Nota 4.2 Observeu que minimitzem la suma de les dist` ancies verticals dels punts a la funci o que pretenem aproximar, es a dir, les desviacions, al quadrat, dels valors yi que realment t e la variable respecte dels valors yi que ens subministra el model que volem aproximar. Es considera el quadrat daquesta difer` encia perqu` e les desviacions, realment, sumen i no es compensen les que es produeixen per defecte amb les que es produeixen per exc es. La teoria de lan` alisi matem` atica ens diu que la condici o necess` aria per a obtindre el m nim es que les primeres derivades parcials respecte a cada un dels par` ametres sanullen, es a dir: (a1 , a2 , . . . , ar ) =0 a1 (a1 , a2 , . . . , ar ) =0 a2 . . . (a1 , a2 , . . . , ar ) =0 ar Resolent aquest sistema, denominat sistema dequacions normals, queden determinats els par` ametres (a1 , a2 , . . . , ar ), aix com la funci o corresponent. LINEAL SIMPLE 4.2. MODEL DE REGRESSIO 4.2.1. RECTA DE REGRESSIO En el model de regressi o lineal simple la funci o elegida per a aproximar la relaci o entre les variables es una recta, es a dir, una funci o de la forma y = a + b x, on a i b s on els par` ametres que hem de determinar. Aquesta recta sanomena recta de regressi o de Y sobre X. A continuaci o, en deduirem lequaci o usant el m` etode dels m nims quadrats: donat un valor xi de X , tenim els corresponents valors de Y, lobservat yi , i el = a + b xi . Aix doncs, hem de minimitzar: te` oric yi =
n i=1

e2 i

Derivant respecte als par` ametres a i b i igualant a zero: n (a, b) = 2 (yi a b xi ) = 0, a i=1

n i=1

(yi

2 yi )

n i=1

(yi (a + bxi ))2 .

n (a, b) = 2 (yi a b xi ) xi = 0, b i=1


65 Estadstica. Volum I - UJI

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estad stica. Volum I - 2009/2010

65

c UJI

obtenim un sistema de dues equacions normals i dues inc` ognites a i b. Aquest sistema pot escriures com: n n n a+b xi = yi , i=1 i=1 i=1 (4.1) n n n xi + b x2 xi yi . i = a
i=1 i=1 i=1

A llant a de la primera equaci o i operant, sobt e que: na =


n i=1

yi b

n i=1

xi a =

1 1 yi b xi a = y b x. n i=1 n i=1

Substituint el valor obtingut per a a en la segona equaci o del sistema (4.1) i n tenint en compte que xi = n x, sobt e que:
i=1

(y b x) y
n i=1

n i=1

xi + b

n i=1

x2 i = x2 i

n i=1

xi y i ,

xi b x

n i=1

xi + b

n i=1

n i=1

xi y i ,

ynx bxnx + b n
i=1

n i=1

x2 i

n i=1

x2 i,

x2 i

nx

n i=1

x2 i nxy.

(4.2)

Dividint per n ambd os membres de (4.2) i operant: 1 2 x x2 n i=1 i


n

1 2 x xy n i=1 i

b s2 x = sxy b= sxy . s2 x

Per tant, la recta de regressi o de Y sobre X es: y = a + bx

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

66

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

66

c UJI

on: sxy s2 x

b=

a = y bx

El pendent de la recta de regressi o de Y sobre X (par` ametre b) es denomina coecient de regressi o de Y sobre X. Aplicant un raonament an` aleg a lanterior podem obtindre lexpressi o de la recta de regressi o de X sobre Y . En aquest cas, lequaci o quedaria establerta per: x = a + b y on: sxy s2 y

b =

a = x b y

El pendent de la recta de regressi o de X sobre Y (par` ametre b ) es denomina coecient de regressi o de X sobre Y .

Nota 4.3 La recta de regressi o de X sobre Y no sobt e a llant la X de la recta de regressi o de Y sobre X .

Exemple 4.1 La despesa dels consumidors dun pa s en b ens i serveis (Y ) i la renda corresponent (X ) (ambdues en milions deuros), en deu anys, han sigut:

xi yi

5.4

7.2 8.4

10.2 11.4 12.6 15 16.2 6 6.6 7.2 9 9.6

3.6 3.6 4.2 4.8 5.4

Per a calcular la recta de regressi o de la despesa dels consumidors (Y ) en funci o de la seua renda (X ), constru m la taula que apareix a continuaci o, a partir de la qual ens resultar` a m es senzill calcular els par` ametres dels quals dep en la recta de regressi o:
67

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

67

c UJI

xi 5.4 6 7.2 8.4 9 10.2 11.4 12.6 15 16.2 Sumes: 101.4

yi 3.6 3.6 4.2 4.8 5.4 6 6.6 7.2 9 9.6 60

x2 i 29.16 36 51.84 70.56 81 104.4 129.96 158.76 225 262.44

xi yi 19.44 21.6 30.24 40.32 48.6 61.2 75.24 90.72 135 155.52 x= s2 x =

101.4 = 10.14, 10

y=

60 =6 10

1149.08 (10.14)2 = 12.0884 10 677.88 10.14 6 = 6.948 10

sxy = b=

6.948 = 0.5748 12.0884

1149.08 677.88

a = 6 0.5748 10.14 = 0.1715

Aix , la recta de regressi o es: y = 0.1715 + 0.5748 x

Algunes propietats de les rectes de regressi o: Les dues rectes de regressi o es tallen en el punt (x, y ), el qual es denomina centre de gravetat de la distribuci o conjunta. Les seues equacions en la forma punt-pendent queden establertes per: Y sobre X : y y = sxy (x x) s2 x X sobre Y : x x = sxy (y y ) s2 y

Tant el signe de b com el de b coincideixen amb el signe de la covari` ancia (ja que les vari` ancies s on sempre positives). Una covari` ancia positiva ens conduir` a a dos coecients de regressi o positius i aix els pendents de les rectes de regressi o seran positius i donaran lloc a rectes creixents. Tanmateix, una covari` ancia negativa ens conduir` a a dos pendents negatius i aix les rectes de regressi o seran decreixents. En cas que la covari` ancia siga zero, aquestes seran paralleles als eixos coordenats i perpendiculars entre si. 4.2.2. MESURES DE LA BONDAT DAJUSTAMENT. CORRELACIO Recordem que per a cada valor xi de X podem calcular la difer` encia (el residu) entre el valor observat de Y , yi , en el n uvol de punts i el corresponent valor te` oric, yi , obtingut en la recta de regressi o. Si tots els punts del n uvol estan sobre la recta, els residus valen zero i, en conseq u` encia, la depend` encia es funcional i, per tant, el grau de depend` encia es el m` axim possible. A mesura que sallunyen els punts

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4 Estad stica. Volum I - 2009/2010

68

68

Estadstica. Volum I - UJI UJI c

observats de la funci o ( es a dir, a mesura que els residus augmenten) anem perdent intensitat en la depend` encia. En aquesta secci o denirem alguns par` ametres que ens donaran una mesura daquest grau dintensitat en la depend` encia. Denici o 4.1 Es deneix la vari` ancia residual com la mitjana aritm` etica de tots els residus elevats al quadrat: s2 e 1 1 2 = (yi yi ) = (yi a bxi )2 . n i=1 n i=1
n n

Si la vari` ancia residual es gran, els residus s on grans i la depend` encia es xicoteta. Per tant, lajustament es ro n. Si la vari` ancia residual es xicoteta (prop de zero), la depend` encia es gran i aleshores lajustament es bo. f` Nota 4.4 Es acil demostrar que la mitjana aritm` etica dels residus en la regressi o lineal de Y sobre X es zero, es a dir, e2 = 0. Per tant, la vari` ancia residual rep aquest nom per ser la vari` ancia dels residus. Denici o 4.2 Anomenarem vari` ancia deguda a la regressi o la vari` ancia dels valors te` orics, es a dir, dels yi . Tenint en compte que la mitjana aritm` etica daquests es la mateixa que la dels valors observats, es a dir: y = y , la vari` ancia deguda a la regressi o es: s2 y = i pot provar-se que: 1 (y y )2 n i=1 i
n

2 2 s2 y = s e + sy ,

es a dir, la vari` ancia total de la variable Y es la suma de dues vari` ancies: la vari` ancia de Y , que representa la part de la dispersi o o variabilitat de la variable Y explicada per la regressi o ( es a dir, per la relaci o lineal amb la variable X ), i la vari` ancia residual, que representa la part de la varibilitat no explicada per la regressi o. Aix doncs, quan augmenta la vari` ancia deguda a la regressi o, disminueix la vari` ancia residual i lajustament es bo. I al contrari, quan disminueix la vari` ancia deguda a la regressi o, augmenta la vari` ancia residual i lajustament es ro n. La vari` ancia deguda a la regressi o serveix per a veure en quina mesura millora la descripci o duna variable a trav es de laltra. El problema dutilitzar la vari` ancia residual es que queda afectada per les unitats de mesura i aix` o impossibilita la comparaci o de la depend` encia entre grups de variables. Tenint en compte la relaci o entre els difrents tipus de vari` ancies, podem obtindre una mesura relativa ( es a dir, que no depenga de les unitats) que estiga entre 0 i 1, per a la bondat dajustament dividint la vari` ancia deguda a la regressi o entre la vari` ancia total de Y . En la denici o seg uent, precisem amb m es detall aquest concepte:
69

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

69

c UJI

Denici o 4.3 Es deneix el coecient de determinaci o (R2 ) com: s2 y R = 2 sy


2

o b e, R2 = 1

s2 e . s2 y

El coecient de determinaci o (multiplicat per cent) representa el percentatge de la variabilitat de Y explicada per la recta de regressi o, es a dir, per la relaci o amb la variable X . Algunes propietats del coecient de determinaci o: 0 R2 1 Si R2 = 1, aleshores tots els residus valen zero i lajustament es perfecte; si R2 = 0, lajustament es inadequat. El coecient de determinaci o de la recta de regressi o de Y sobre X es el mateix que el de la recta de regressi o de X sobre Y , i es verica que: R2 = b b , es a dir, el coecient de determinaci o es una mesura del grau de relaci o lineal entre les variables.
Demostraci o: per denici o, yi = a + b xi . Aplicant les propietats de la vari` ancia:

2 2 s2 y = b sx

don: s2 s2 b2 s2 sxy x s2 y x x R = 2 = 2 = b 2 = b 2 = b b . sy sy sy sy
2 sxy

El coecient de determinaci o es el quadrat del coecient de correlaci o lineal, es a dir: 2 R2 = rxy . Demostraci o: sxy sxy R =bb = 2 2 = sx sy
2

sxy sx sy

2 = rxy .

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

70

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

70

c UJI

4.2.3. PREDICCIO Lobjectiu u ltim de la regressi o es la predicci o duna variable per a un valor determinat de laltra. La predicci o de Y per a X = x0 es, simplement, el valor obtingut en la recta de regressi o de Y sobre X en substituir el valor de x per x0 , es a dir: y0 = a + bx0 . Evidentment, la abilitat daquesta predicci o augmentar` a quan la correlaci o entre 2 les variables ho fa ca ( es a dir, quan R augmente).

Exemple 4.2 En lexemple anterior, determina la despesa per a enguany si la renda es de 45.3 milions deuros. D ona una mesura de la bondat de la predicci o. Quin es el percentatge de variabilitat en la despesa atribu ble a la renda dels consumidors? Soluci o Ja hem calculat la recta de regressi o de la despesa en funci o de la renda: y = 0.1715 + 0.5748 x. Com que la renda es mesura en milions deuros, la predicci o de la despesa ser` a: y (45.3) = 0.1715 + 0.5748 45.3 = 26.21 milions deuros. Una mesura de la bondat de la predicci o, ens la proporciona el coecient de correlaci o lineal entre ambdues variables: rxy = sxy 6.948 = = 0.9952 . sx s y 12.0884 4.320

Aix doncs, com que est` a pr` oxim a la unitat, la predicci o es molt able. El percentatge de variabilitat en la despesa atribu ble a la renda dels consumidors, ens el d ona el coecient de determinaci o:
2 R2 = rxy = 0.9904.

La bondat de la predicci o, tamb e sol expressar-se en termes de percentatge, en aquest cas seria un valor prop del 99 %. LINEAL MULTIPLE 4.3. REGRESSIO En aquesta secci o considerarem que estem estudiant p + 1 variables i que el nostre objectiu es obtindre una funci o que modelitze la relaci o de depend` encia duna daquestes variables (Y ), que anomenarem variable dependent o explicada com a funci o de les p restants (X1 , . . . , Xp ), que anomenarem variables independents o explicatives. Els valors de la mostra, ara estaran ordenats de la manera seg uent:
Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4 71 Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

71

c UJI

Y X1 X2 . . . Xp

y1 x11 x21 . . . xp1

y2 x12 x22 . . . xp2

yn x1 n x2 n . . .

xpn

Nom es estudiarem el cas en qu` e la funci o de regressi o considerada siga una funci o de tipus lineal, es a dir: y = b0 + b1 x1 + + bp xp , on b0 , b1 , . . . , bp s on els par` ametres. Aquesta equaci o es lequaci o dun hiperpl` a en p lespai R , anomenat hiperpl` a de regressi o de Y sobre X1 , . . . , Xp . Per a la deducci o de lhiperpl` a de regressi o usarem ` algebra matricial, denotarem per: y1 y2 y= . . . yn el vector de valors observats de la variable Y . Per: b0 b1 b= . . . bp el vector dels par` ametres. Per: 1 x11 1 x12 . . . . . . 1 x1n

la matriu en la qual tots els elements de la primera columna s on iguals a 1 i la resta de columnes contenen els valors observats de les variables explicatives X1 , . . . , Xp . Finalment, per: y1 y 2 y = . . . yn
Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4
Estad stica. Volum I - 2009/2010

X=

xp1 xp2 v xpn

72
72

Estadstica. Volum I - UJI


c UJI

el vector de valors te` orics, on:


yi = b0 + b1 x1i + + bp xpi .

Matricialment aquest vector pot escriures com: y = X b. Per a trobar el valor de b apliquem el m` etode dels m nims quadrats. En aquest cas, haurem de minimitzar la funci o: = (y y ) (y y )t = (y X b) (y X b)t , on usem el super ndex t per a representar la matriu transposada. Derivant en lexpressi o anterior respecte a b i igualant a 0, obtenim el vector dels par` ametres: b = (X t X )1 X t y Exemple 4.3 Les dades seg uents representen la formaci o xa del capital brut (Y ), el PIB a preus de mercat (X1 ) i la formaci on xa del capital brut dun any anterior (X2 ), per al per ode 81-85. Ajusteu un model lineal que explique la formaci o xa del capital brut dun any en funci o del PIB i de la formaci o xa del capital brut de lany anterior. Y 3.26 3.27 3.19 3.03 3.15 X1 15.2 15.4 15.6 15.9 16.3 X2 3.37 3.26 3.27 3.19 3.03 matrius seg uents: 3.37 3.26 3.27 , 3.19 3.03

Soluci o Utilitzant les dades de la taula constru m les 1 15.2 3.26 1 15.4 3.27 , 1 15.6 3.19 X = y= 1 15.9 3.03 1 16.3 3.15 a partir de les quals calculem: 5 78.4 16.12 X t X = 78.4 1230.06 252.55 , 16.12 252.55 52.0344
Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

(X t X )1

16354.92 -612.84 -612.84 23.20 = -2092.26 77.27

-2092.26 77.27 , 273.15


Estadstica. Volum I - UJI

73

Estad stica. Volum I - 2009/2010

73

c UJI

I aix , lequaci o del model es:

15.9 X t y = 249.196 , 51.2879

19.242664 b = (X t X )1 X t y = -0.6580132 . -1.7795794

y = 19.242664 0.6580132 x1 1.7795794 x2 ` 4.3.1. VARIANCIA RESIDUAL. COEFICIENT DE DETERMINACIO MULTIPLE Una mesura de la bondat dajustament, tamb e en el cas de la regressi o lineal 2 m ultiple, es la vari` ancia residual (se ), que en aquest cas ser` a: s2 e 1 1 2 = (yi yi ) = (yi b0 b1 x1i bp xip )2 , n i=1 n i=1
n n

la qual podem expressar matricialment com: 1 t y y bt X t y n i t e el mateix signicat que en el cas de la regressi o lineal simple. s2 e = Perqu` e la mesura de la bondat dajustament no depenga de les unitats de mesura, denim, de la mateixa forma que en el cas de la regressi o simple, el coecient de determinaci o m ultiple: R2 = 1 s2 e , s2 y

que mesura el grau dassociaci o lineal simult` ania entre les p variables. Exemple 4.4 Considerem les dades de lexemple anterior, calculant: bt X t y = 50.59157235, Per tant, R2 = 1 0.00168552944 = 0.77822. 0.0076 y t y = 50.6 s2 e = 0.00168552944, s2 y = 0.0076.

Aix , la abilitat de lajustament ser` a del 77.82 %. 4.3.2. UN CAS PARTICULAR: EL PLA DE REGRESSIO En cas que h` agem de trobar el pla de regressi o de Y sobre X1 i X2 , podem obtindre els coecients en funci o de les mitjanes aritm` etiques, vari` ancies i covari` ancies de les variables que intervenen en el problema:

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4


Estad stica. Volum I - 2009/2010

74

Estadstica. Volum I - UJI


74 c UJI

b0 = y b1 x1 b2 x2 , b1 sx 1 y s2 x2 sx2 y sx1 x2 = , 2 2 s2 x1 sx2 sx1 x2 sx 2 y s2 x1 sx1y sx1 x2 = , 2 2 sx 1 s 2 x2 sx1 x2

b1

on el coecient de determinaci o m ultiple, en aquest cas es: R 2 = b1 sx1 y sx 2 y + b2 2 . 2 sy sy

NO LINEAL. COEFICIENT DE CORRELACIO 4.4. REGRESSIO GENERAL NO LINEAL SIMPLE 4.4.1. MODELS DE REGRESSIO El model lineal de regressi o es el m es senzill, per` o en ocasions el n uvol de punts ens pot indicar que no es adequat. Per tant, haurem de rec orrer a altres models, es a dir, a buscar altres funcions que ajusten millor les dades que tenim. Model potencial: busquem una funci o de regressi o de la forma: y = k xb , on k i b s on els par` ametres que cal determinar. Aquest model, podem reduir-lo al cas lineal prenent logaritmes: ln y = ln k + b ln x. Si ara fem el canvi de variables z = ln y i t = ln x i posem a = ln k , nom es hem de calcular la recta de regressi o de Z sobre T : z = a + bt i despr es, una vegada calculats els par` ametres a i b daquesta recta, obtindre els par` ametres buscats k i b, tenint en compte que: k = ea i b = b.

Model exponencial: busquem una funci o de regressi o de la forma: y = c kx,

Estad stica. Volum I - 2009/2010 Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

75 75

c Estadstica. Volum I - UJI UJI

on c i k s on els par` ametres que cal determinar. Aquest model, tamb e podem reduir-lo al cas lineal prenent logaritmes: ln y = ln c + (ln k ) x. Si ara fem el canvi de variable z = ln y i posem a = ln c i b = ln k , nom es hem de calcular la recta de regressi o de Z sobre X z = a + bx, i despr es, una vegada calculats els par` ametres a i b daquesta recta, obtindrem els par` ametres buscats c i k , tenint en compte que: c = ea i k = eb .

Model parab` olic: busquem una funci o de regressi o de la forma: y = a + b x + c x2 , on a, b i c s on els par` ametres que cal determinar. En aquest cas, utilitzarem el m` etode dels m nims quadrats per a la determinaci o dels par` ametres. Considerem:
ei = yi yi = yi a b xi c x2 i

i minimitzem: (a, b, c) =
n i=1

e2 i

n 2 = yi a b x i c x2 . i i=1

i simplicant, obtenim el sistema dequacions normals:


76

Derivant parcialment respecte de cadascuna de les variables daquesta equaci o (que s on els par` ametres que busquem) i igualant a zero: n (a, b, c) 2 = 2 yi a b xi c xi = 0 a i=1 n (a, b, c) 2 = 2 yi a b xi c xi xi = 0 b i=1 n (a, b, c) 2 2 = 2 yi a b xi c xi xi = 0 c i=1

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

76

c UJI

an + b a
n i=1

n i=1

xi + c
n i=1

n i=1

x2 i

que, una vegada resolt, ens proporciona la par` abola de regressi o de Y sobre X.

n n n n 2 3 4 2 xi = xi y i a xi + b xi + c
i=1 i=1 i=1 i=1 i=1 i=1

xi + b

x2 i

+c

n i=1

yi
n

x3 i

xi y i

4.4.2. MESURES DE LA BONDAT DAJUSTAMENT De nou, la bondat dajustament de cada un dels models analitzats, la mesurarem mitjan cant la vari` ancia residual: s2 e 1 2 = (yi yi ) n i=1 R2 = 1 larrel quadrada positiva del qual R= s2 e 2 sy
n

o mitjan cant el coecient de determinaci o general:

s2 e s2 y

rep el nom de coecient de correlaci o general de Pearson. Exemple 4.5 Donada la distribuci o xi yi 2 4 5 7 8 12 11 21 14 25

estima un model de regressi o parab` olic i calcula el coecient de correlaci o general. Soluci o Per tal dajustar una par` abola a aquestes dades, plantegem el sistema dequacions normals: n n n 2 an + b xi + c xi = yi i=1 i=1 i=1 n n n n 2 3 a xi + b xi + c xi = xi y i i=1 i=1 i=1 i=1 n n n n 2 3 4 2 a xi + b xi + c xi = xi y i
i=1 i=1 i=1 i=1
Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4
Estad stica. Volum I - 2009/2010

77

Estadstica. Volum I - UJI


c UJI

77

i per a aquest formem la taula seg uent: yi xi x2 i x3 i x4 i y i xi 8 35 96 231 350 720 yi x2 i 16 175 768 2541 4900 8400

4 2 7 5 12 8 21 11 25 14 Sumes: 69 40

4 8 16 25 125 625 64 512 4096 121 1331 14641 196 2744 38416 410 4720 57764

don obtenim el sistema: 5 a + 40 b + 410 c = 69 40 a + 410 b + 4720 c = 720 410 a + 4720 b + 57764 c = 8400 a = 1.057, b = 1.1105, c = 0.048,

que t e per soluci o:

don la par` abola de regressi o de Y sobre X es: y = 1.057 + 1.105 x + 0.048 x2

Per a calcular el coecient de correlaci o general, calcularem pr` eviament la vari` ancia residual. Per a aix` o formem una altra taula:

yi

xi

yi = 1.057 + 1.105 xi + 0.048 x2 i

ei = yi yi

e2 i 0.292681 0.611524 0.938961 3.920400 0.874225

2 yi

4 2 7 5 12 8 21 11 25 14 69

3.459 7.782 12.969 19.020 25.935

0.541 -0.782 -0.969 1.980 -0.935

16 49 144 441 625

6.637791 1275

a partir de la qual calculem: 69 1275 6.637791 = 13.8, s2 13.82 = 64.56, s2 = 1.327, y = e = 5 5 5 1.327 R= 1 = 0.9897 abilitat del 98.97 % . 64.56 y=
Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4 78 Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

78

c UJI

4.5. PROBLEMES PROPOSATS (1) El Ministeri de Turisme dun determinat pa s ha observat que el nombre de places hoteleres ocupades es diferent segons el preu de lhabitaci o. En la taula seg uent es detallen el total de places ocupades en un any amb els preus corresponents: Preu (en euros) 40 80 120 200 350 Nombre dhabitacions ocupades 4720 2615 1870 945 450

a ) Representa gr` acament les dades i comprovar que existeix una relaci o lineal entre el nombre dhabitacions ocupades i el preu per habitaci o. b ) Troba lequaci o de la recta de regressi o. Quantes habitacions socuparien a 275 e? c ) En quina mesura podem considerar que el nivell docupaci o dep en de lestructura dels preus?

(2) Donades les seg uents dades: xi yi 2 1 0 4 1 1 1 2 4

a ) Analitza-les gr` acament. Raona si escau o no fer-hi un ajustament lineal. b ) Ajusta el model no lineal m es adequat tenint en compte la representaci o gr` aca feta en lapartat anterior. c ) Interpreta la bondat dajustament.

(3) Donada la distribuci o xi 3 7 13 16 21 a ) Ajusta un model exponencial. b ) Calcula el coecient de correlaci o general de Pearson. yi 1 6 11 24 36

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

79

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

79

c UJI

(4) Un determinat partit pol tic es planteja el problema de ns a quin punt li poden compensar les despeses en publicitat de la pr` oxima campanya electoral segons el resultat obtingut. En els u ltims processos electorals les despeses en publicitat (en milers deuros) i el nombre de diputats elegits van ser: Despeses en publicitat 12 18 27 33 51 Diputats elegits 3 4 4 6 8

La comissi o electoral del partit est` a estudiant la possibilitat de realitzar una despesa de 60000 e en publicitat per a la pr` oxima campanya electoral. a ) Quin ser` a el nombre de diputats elegits daquest partit dacord amb el pressupost esmentat si la imatge del partit no varia respecte a les eleccions anteriors? b ) Amb quina conan ca pot esperar-se aquest resultat? c ) Quin ser` a el percentatge de causes diferents de la publicitat que inuiran en les eleccions?
2 (5) Coneixent les dades seg uents: x = 3, y = 2, s2 x = 6, sy = 8 i que la recta de regressi o de Y sobre X es y = 4 0.667 x, obteniu la recta de regressi o de X sobre Y.

SOLUCIONS

(1)

a ) Es representa el n uvol de punts b ) y = 3976.5 11.75 x, y (275) 745 habitacions c ) rxy = 0.86. Aix tenim un 86 % de abilitat a ) rxy = 0. Per tant, no existeix relaci o lineal entre les variables b ) y = x2 c ) Ajustament perfecte a ) y = 0.93 (1.21)x b ) R = 0.83 a ) 9 diputats b ) La predicci o es molt able, ja que rxy = 0.96 c ) 7.3 %

(2)

(3) (4)

(5) x = 4 0.5 y
80

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

80

c UJI

TEMA 5 NOMBRES INDEXS


5.1. INTRODUCCIO En moltes ocasions les variables socioecon` omiques com el volum dimportacions, el nombre de vendes duna empresa, o el valor del PIB, varien amb el temps i pot apar eixer la necessitat de fer comparacions en funci o de les dites variables per a diferents temps, tant per separat, com en grups o conjunts de les variables. En aquest tema tractarem el problema de la comparaci o duna s` erie dobservacions respecte a una situaci o inicial xada arbitr` ariament. Les mesures estad stiques que descriuen aquests canvis s on els nombres ndexs. Els exemples de nombres ndexs s on molt abundants: a m es dels m es coneguts, com poden ser l ndex de preus de consum (consulteu la p` agina web de lInstitut Nacional dEstad stica: http://www.ine.es/) o els indicadors de la borsa, nexisteixen daltres, menys coneguts popularment, per` o que tenen una gran inu` encia en leconomia mundial. En citarem dos, i indicarem algunes p` agines web on sen pot ampliar la informaci o. Per` o es necessari advertir que per a consultes posteriors a la publicaci o daquest text es convenient actualitzar les dates. Index de Conan ca de Mercats Emergents Poden consultar-se, per exemple, les p` agines web: http://www.iberglobal.com/Newsletter/alerta geo abril 2006.htm http://www.iberglobal.com/Newsletter/alerta geo abril 2007.htm Index de Conan ca dels Consumidors Consulteu: http://www.nanzas.com/id.4892123/noticias/noticia.htm http://www.iberglobal.com/ (busqueu not cies sobre el dit ndex)

http://economy.blogs.ie.edu/archives/2007/01/indice de con.php http://www.cincodias.com/ (buscar not cies sobre dit ndex) http://www.agendadeprensa.com/informes/ico enero08.pdf A continuaci o, formalitzarem el concepte de nombre ndex: Denici o 5.1 Nombre ndex es aquella mesura estad stica que ens permet estudiar els canvis que es produeixen en una magnitud simple o complexa respecte al temps. Anomenarem per ode base o per ode de refer` encia el per ode inicial, i la situaci o que volem comparar, lanomenarem per ode actual o per ode corrent.

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4


Estad stica. Volum I - 2009/2010

81

Estadstica. Volum I - UJI


81 c UJI

Els nombres ndexs poden ser: simples, si nom es comparem una variable, o complexos, si comparem un grup de variables. Aquests u ltims poden ser: ponderats o sense ponderar. 5.2. INDEXS SIMPLES I COMPLEXOS 5.2.1. INDEXS SIMPLES Denici o 5.2 Siga X una variable i siguen x0 i xt els valors de la dita variable mesurats en els per odes base i actual, respectivament. El nombre ndex simple I per a la magnitud citada es deneix com el quocient entre ambd os valors: xt t I = I0 = . x0 a dir: Es xt actual = actual . I = Ittbase xtbase El nombre ndex simple I mesura en tant per u la variaci o que ha experimentat la magnitud X entre els per odes considerats. De vegades es multipliquen per 100 i expressen percentatges. I > 1 (o 100) augment, I < 1 (o 100) disminuci o.

Exemple 5.1 Donats els preus de dos articles A i B per la taula seg uent: Anys Preus Article A 1994 1995 1996 10 12 15 Article B 20 25 28

els ndexs simples amb base en 1994 s on: Anys Indexs simples Article A 1994 1995 1996 1 1.2 1.5 Article B 1 1.25 1.4

on els valors dels ndexs shan obtingut aplicant la denici o. Per exemple, per a larticle A: 12 15 95 96 I0 = = 1.2, I0 = = 1.5. 10 10
82

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

82

c UJI

Els ndexs simples m es usuals s on: El preu relatiu: es la ra o entre el preu dun b e en el per ode actual (pt ) i el preu del mateix b e en el per ode base (p0 ): pt 0 = pt . p0

(Si seguim la notaci o anterior: X = P = preu dun b e, aleshores xt = pt i x0 = p0 ). La quantitat relativa: es el quocient entre la quantitat produ da o venuda dun b e en el per ode actual (qt ) i la quantita produ da o venuda del mateix b e en el per ode base (q0 ). qt t q0 = . q0 (Si posem: X = Q = quantitat produ da o venuda dun b e, aleshores xt = qt i x0 = q0 ). El valor relatiu: anomenarem valor dun b e en un per ode arbitrari el producte del preu daquest b e per la quantitat produ da (o venuda). Per tant, el valor relatiu (V0t ) es: V0t = pt q t . p 0 q0

Aix , el valor relatiu dun b e es igual al producte del seu preu relatiu per la seua quantitat relativa, es a dir:
t V0t = pt 0 q0 ,

ja que: V0t =

pt q t p t qt t = = pt 0 q0 . p0 q 0 p 0 q0

5.2.2. INDEXS SIMPLES EN CADENA Els ndexs en cadena s on un conjunt d ndexs per als quals la base es sempre el per ode precedent. Daquesta manera, cadascun representa una comparaci o percentual respecte al per ode anterior. Exemple 5.2 Per a les mateixes dades de lexemple anterior es t e que: Anys Indexs en cadena Article A 1994 1995 1996 1.2 1.25 Article B 1.25 1.12

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

83

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

83

c UJI

on, per exemple, per a larticle A:


95 I96 =

15 = 1.25. 12

5.2.3. INDEXS COMPLEXOS: NO PONDERATS I PONDERATS En la realitat succeeix que, generalment, no estem interessats a comparar preus, quantitats o valors de b ens individuals, sin o que les dites magnituds es comparen per a dir, habitualment ser` a grups. Es a necessari estudiar les variacions dun conjunt de N variables. Per exemple, analitzar levoluci o de preus dels quatre cereals b` asics a Espanya. Per a aquest , la informaci o subministrada pels ndexs simples de cadascuna de les variables sha de resumir en un u nic ndex que anomenarem ndex complex. Existeixen dos tipus d ndexs complexos: ponderats i no ponderats.
NOMBRES INDEXS COMPLEXOS NO PONDERATS

Per a resumir la informaci o obtinguda a trav es dels ndexs simples, el m es l` ogic es calcula dalguna forma la mitjana daquests. Segons el tipus de mitjana que sutilitze, apareixen els diferents nombres ndexs complexos. Considerem les variables X1 , X2 , . . . , XN que fan prendre els valors: Variable X1 . . . Xi . . . XN Per ode base x10 . . . xi0 . . . xN 0 Per ode actual Indexs simples x1t . . . xit . . . xN t I1 = x1 t x10

. . . xit Ii = xi0 . . . xN t IN = xN 0

A partir de la taula i prenent els ndexs simples, podem denir els seg uents ndexs complexos no ponderats. Per ordre dimport` ancia, considerarem: Index mitjana aritm` etica d ndexs simples: consisteix a calcular la mitjana aritm` etica simple dels ndexs de totes les variables:
N 1 I= Ii . N i=1

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

84

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

84

c UJI

Index mitjana agregativa: quan les mitjanes en qu` e estan expressades les variables siguen homog` enies, es poden comparar les mitjanes dels valors de les variables en cada per ode (base i actual):
N i=1

xit . xi0

IA =

N i=1

Index mitjana geom` etrica d ndexs simples: N N IG = Ii .


i=1

Index mitjana harm` onica d ndexs simples: IH = N . N 1


i=1

Ii

Exemple 5.3 Donada la producci o de tres tipus de c trics expressades en milions de quilograms, calculeu-ne els ndexs complexos, mitjana aritm` etica i mitjana agregativa amb base en 1994. Anys 1994 1995 1996 Taronges Mandarines 450 400 425 200 180 220 Pomelos 120 98 150

Soluci o: Indexs simples Taronges Mandarines 100 88.89 94.44 100 90 110 Pomelos 100 81.67 125 I I. C. 100 86.85 109.81 xit IA I. C. 100 88.05 103.25

Total c trics 770 678 795

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

85

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

85

c UJI

Els ndexs complexos no ponderats m es usuals s on: Index de preus de Sauerbeck: es l ndex mitjana aritm` etica dels preus relatius: N 1 Sp = Ii , N i=1 on Ii = pit . pi0

Index de preus Bradstreet-D utot: es l ndex mitjana agregativa dels preus relatius: N pit i=1 BDp = N . pi 0
i=1

Index de quantitats de Sauerbeck: es l ndex mitjana aritm` etica de les quantitats relatives: N 1 Sq = Ii . N i=1 on Ii = qit . qi0

Index de quantitats Bradstreet-D utot: es l ndex mitjana agregativa de les quantitats relatives: N qit i=1 BDq = N . qi 0
i=1

NOMBRES INDEXS COMPLEXOS PONDERATS

En els ndexs anteriors no hem tingut en compte la diferent import` ancia relativa que pot tindre cadascuna de les variables simples dins del conjunt. Es necessari de vegades que, als ndexs simples, sels assignen pesos o ponderacions (i ) que en consideren la import` ancia relativa. Daquesta forma obtindr em els seg uents ndexs complexos ponderats: Index mitjana aritm` etica ponderat:
N

I =

i Ii . i

i=1 N

i=1

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

86

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

86

c UJI

Index mitjana agregativa ponderat:


N

xit i . xi0 i

IA

i=1

i=1 N

Index mitjana geom` etrica ponderat: N i IG = Iii .


i=1

Index mitjana harm` onica ponderat:


N

i .
i Ii

IH

i=1

i=1 N

Els ndexs complexos ponderats m es usuals s on: Index de preus de Laspeyres: es la mitjana aritm` etica ponderada dels ndexs simples de preus usant els pesos i = pi0 qi0 (valor de la quantitat consumida del b e i-` esim en el per ode base, a preus del dit per ode):
N p N it pi0 qi0 pit qi0 i=1 pi0 i=1 Lp = = N . N pi0 qi0 pi0 qi0 i=1 i=1

Index de preus de Paasche: es la mitjana aritm` etica ponderada dels ndexs simples de preus usant els pesos i = pi0 qit (valor de la quantitat consumida del b e i-` esim en el per ode actual, a preus del per ode base):
N p N it pi0 qit pit qit i=1 pi0 i=1 Pp = = N . N pi0 qit pi0 qit i=1 i=1

L ndex de Paasche requereix calcular les ponderacions per a cada per ode corrent, per la qual cosa la seua elaboraci o es m es costosa; per aix` o sutilitza menys que el de Laspeyres.
Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4 87 Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

87

c UJI

Index de preus dEdgeworth: es la mitjana agregativa ponderada dels preus, amb pesos i = qi0 + qit (quantitat total consumida del b e i-` esim en el per ode base i en lactual):
N

pit (qi0 + qit ) . pi0 (qi0 + qit )

Ep =

i=1

Index de preus de Fisher: es la mitjana geom` etrica dels ndexs de preus de Laspeyres i Paasche, es a dir: Fp = Lp Pp .

i=1 N

Index de quantitats de Laspeyres: es la mitjana aritm` etica ponderada dels ndexs simples de quantitats usant els pesos i = pi0 qi0 , i t e lexpressi o seg uent:
N

Lq =

i=1

Index de quantitats de Paasche: es la mitjana aritm` etica ponderada dels ndexs simples de quantitats usant els pesos i = pit qi0 (valor de la quantitat consumida del b e i-` esim en el per ode base, a preus actuals):
N

i=1 N

pi0 qit pi0 qi0

Pq =

i=1

Index de quantitats dEdgeworth: es la mitjana agregativa ponderada amb pesos i = pi0 + pit , i t e lexpressi o seg uent:
N

i=1 N

pit qit pit qi0

qit (pi0 + pit ) . qi0 (pi0 + pit )

Eq =

i=1

Index de quantitats de Fisher: es la mitjana geom` etrica dels ndexs de quantitat de Laspeyres i Paasche, es a dir: Fq = Lq P q .

i=1 N

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

88

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

88

c UJI

Exemple 5.4 Donats els preus i les quantitats de tres articles de consum des de 1990 ns a 1994, calculeu els ndexs complexos ponderats de preus de Laspeyres i Paasche prenent com a base 1990. Soluci o: Anys Article A P. C. 1990 1991 1992 1993 1994 on, per exemple: L91 90 = 38+45+23 50 28+55+23 47 = = 1.1405, L92 = = 1.3823, 90 = 28+35+13 34 28+35+13 34 37+46+23 51 2 10 + 5 6 + 2 5 60 92 = = 1.4571, P90 = = 1.3953 . = 27+36+13 35 2 10 + 3 6 + 1 5 43 2 3 2 4 5 8 7 10 12 11 Article B P. C. 3 4 5 7 8 5 6 6 7 8 Article C P. C. 1 2 2 4 5 3 3 5 8 10 Indexs Lp 100 147.06 138.23 232.35 279.41 Pp 100 145.71 139.53 243.40 302.78

91 P90 =

5.3. PROPIETATS DELS NOMBRES INDEXS Existeixen una s` erie de propietats que han de ser vericades pels nombres ndexs; aquestes s on: Exist` encia: tot nombre ndex ha dexistir i ha de tindre un valor nit distint de zero, es a dir: < I < +. I = 0. Aquesta propietat, no la compleixen els ndexs complexos mitjana geom` etrica i mitjana harm` onica. Identitat: si es fan coincidir el per ode base i el per ode actual, el nombre 0 ndexs m es usuals ndex ha de ser igual a la unitat, es a dir, I0 = 1. Tots els ho veriquen.
t Inversi o: si denotem per I0 un ndex amb base 0 i per ode actual t, en 1 0 0 ndex es: It = t . Aix` intercanviar els per odes entre si (It ) el nou o implica I0 t = 1. Aquesta propietat, la compleixen els ndexs simples i entre que It0 I0 els complexos, els de Bradstreet-D utot, Edgeworth i Fisher.

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

89

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

89

c UJI

Proporcionalitat: si en el per ode actual totes les magnituds experimenten una variaci o proporcional, el nombre ndex ha de quedar afectat per aquesta variaci o. Aquesta propietat, la compleixen tots els ndexs simples: suposem que els valors xt experimenten una variaci o proporcional dordre k , i en el per ode t s on xt = k xt , aleshores el nou ndex simple ser` a: I = xt k xt = = k I. x0 x0

Els ndexs complexos m es usuals compleixen aquesta propietat. Exemple 5.5 Vejam que l ndex de preus de Paasche compleix aquesta pro pietat. Siguen pit = k pit , aleshores:
i=1 N N

Pp

pit qit pi0 qit

i=1

i=1 N

k pit qit pi0 qit

=k

i=1

i=1

i=1 N

pit qit pi0 qit

= k Pp .

Per` o en el cas dels ndexs de Paasche, Edgeworth i Fisher es pot plantejar una objecci o de tipus econ` omic: en variar els preus en qualsevol proporci o es dif cil mantindre el sup` osit que les quantitats romanguen constants, o en el cas variar les quantitats, que els preus romanguen constants. Aix doncs, entre els ndexs complexos ponderats, l ndex de Laspeyres es l unic que compleix adequadament la propietat de proporcionalitat i es, per tant, el que m es sutilitza. Homogene tat: un nombre ndex no ha de veures afectat per les unitats de mesura. Circular: si considerem els per odes 0, t, t , t , sha de complir que:
t t t I0 It = I0 ,

Itt Itt = Itt

t t t t I0 It It = I0 .

A c` o, ho compleixen tots els ndexs simples i el de Bradstreet-D utot.

5.4. ALGUNS PROBLEMES EN LA CONSTRUCCIO DELS NOMBRES I LA UTILITZACIO INDEXS Variables: en ndexs simples les variables seran les donades; per` o si selaboren ndexs complexos, de primer cal plantejar-se quines seran les variables que se seleccionaran. El m es habitual es prendre una subpoblaci o integrada pels productes que es consideren m es rellevants. En lexemple que hem vist dels c trics: taronges, mandarines i pomelos.
90 Estadstica. Volum I - UJI

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estad stica. Volum I - 2009/2010

90

c UJI

Per ode de temps pres com a base: sen sol elegir un de no allunyat excessivament del per ode corrent, o l ndex perdr` a representativitat, es quedar` a obsolet. Per aix` o cal renovar peri` odicament la informaci o relativa a lany base. Renovaci o de l ndex: canvi de base i enlla c: En els ndexs simples el canvi del per ode pres com a base es fa per la propietat circular, igualant a 1 (o 100) el valor, preu o quantitat del nou any base. Si representem per h el nou per ode base:
t Ih =

1 t I0 , h I0

t.

El problema que es planteja t e m es dicultat en els ndexs complexos, sobretot en els ponderats, ja que shan de canviar les ponderacions, encara m es quan per a ponderar magnituds actuals sutilitzen pesos relatius referits al per ode base. En aquest cas la nova s` erie ha de ser recalculada. Daltra banda, per a poder relacionar s` eries d ndexs referits a diferents per odes base, cal enlla car ambdues s` eries, lantiga i la nova. Loperaci o denlla c es molt senzilla matem` aticament; de nou, nhi ha prou dassignar al nou any base l ndex 1 (o 100, en percentatges), i aplicar la propietat circular a la s` erie d ndexs antiga. Si representem per h el nou per ode base:
t Ih =

1 t I0 , h I0

t < h.

Daquesta forma ambdues s` eries senllacen num` ericament, encara que sempre cal tindre en compte, en fer les comparacions, les ponderacions que veritablement es van utilitzar en la construcci o de l ndex.

Exemple 5.6 Suposem que per a un conjunt de b ens tenim les dades seg uents: Anys 1980 1981 1982 1983 1984 1985 1986
i

pit qi0

5 5.5 6 6.5

pit qi 0

8 9 10 10.5

Calcula els ndexs de preus de Laspeyres corresponents sobre la base dels anys 1980 i 1983. Calcula tamb e els ndexs de preus dels per odes 80, 81 i 82 sobre la base de lany 1983.
91 Estadstica. Volum I - UJI

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estad stica. Volum I - 2009/2010

91

c UJI

Soluci o: Els ndexs de preus de Laspeyres s on: L80 80 = L83 82 = 5 5.5 6 = 100 %, L81 = 110 %, L82 = 120 %, 80 = 80 = 5 5 5 L83 80 = 6.5 = 130 %, 5

8 9 10 10.5 = 100 %, L84 = 112.5 %, L85 = 125 %, L86 = 131.25 %, 83 = 83 = 83 = 8 8 8 8

i els ndexs de preus dels per odes 80, 81 i 82 sobre la base de lany 1983: L80 83 = L80 100 % 80 = = 76.9 %, 83 L80 130 %

81 80 L81 83 = L80 L83 = 110 % 76.9 % = 84.6 %, 82 80 L82 83 = L80 L83 = 120 % 76.9 % = 92.3 %.

5.5. DEFLACIO Una de les aplicacions m es importants dels nombres ndexs es la possibilitat de ben provocar deaci o en les s` eries (de preus, de valors, de rendes, de sous, etc.). Es conegut de tots que el poder adquisitiu dels diners varia amb el temps. El fenomen es coneix com a inaci o. Anomenarem preus constants els preus que regeixen un determinat per ode x, i preus corrents els preus que regeixen al llarg de diversos per odes. Si es t e una variable en moneda corrent de cada any (euros, d` olars, etc.) dif cilment sen pot analitzar el creixement o el decreixement real. El mateix ocorreria si es desitja establir comparacions amb altres variables expressades en unitats monet` aries distintes. A c` o es degut que lactivitat econ` omica t e un fort component monetari, per la qual cosa les variacions que reecteixen les s` eries, a m es de tindre increments o decrements reals, estan inu des per efectes monetaris molt importants que cal eliminar si es pret en estudiar levoluci o en termes reals duna economia. Loperaci o de convertir les s` eries monet` aries en valors reals (constants) sanomena deaci o. Per a expressar una s` erie donada en diners corrents, en diners constants dun any T, cal dividir la s` erie primitiva entre els ndexs de preus adequats xt (eliminem la inu` encia dels preus), prenent com a base lany T , es a dir: t . IT Nota 5.1 L ndex ha destar expressat en tant per u, i si ho necessitem, podem 1 t utilitzar la relaci o IT = T. It
Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4 92 Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

92

c UJI

Si volem obtindre una f ormula de f` acil aplicaci o, en aquests casos, podem denir les variables seg uents: xt = quantitat amb valor en diners de lany t, xT = quantitat xt amb valor en diners corrents de lany T . Aix obtenim: xT = xt t IT i xT = xt ItT .

L ndex utilitzat per a aquesta operaci o es denomina deactor. Podem usar com a deactors els ndexs de preus m es usuals, el de Laspeyres i el de Paasche. En general, el que se sol utilitzar es l ndex de preus de consum.

Exemple 5.7 La mitjana dels sous que una empresa ha pagat mensualment als empleats, durant els anys que sindiquen en la taula, ha sigut: Any 1982 1983 1984 1985 1986 1987 Sou mitj` a Sou mitj` a en PTA constant de 1982 98735 113940 131373 147663 162282 178834 98735 101641.39 105266.83 108735.64 109872.71 114931.88

Sabent que l Index de Preus de Consum corresponent a aquest per ode est` a donat per la taula seg uent: Any 1982 1983 1984 1985 1986 1987 IPC (base 1972) 463.3 519.4 578.1 629.0 684.4 720.7

determina levoluci o dels sous a preus constants de 1982.

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

93

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

93

c UJI

Soluci o:
t IPC (base 1972) I0 t IPC (base 1982) Ih =T

Any 1982 1983 1984 1985 1986 1987

463.3 519.4 578.1 629.0 684.4 720.7

463.3:463.3=1.00 519.4:463.3=1.121 578.1:463.3=1.248 629.0:463.3=1.358 684.4:463.3=1.477 720.7:463.3=1.556

i usant aquesta taula per a provocar deaci o en els sous resulta que: Any 1982 1983 1984 1985 1986 1987 Sou (en PTA constant de 1982) 98735:1.00=98735 113940:1.121=101641 131373:1.248=105267 147663:1.358=108736 162282:1.477=109873 178834:1.556=114932

5.6. INDEX DE PREUS DE CONSUM I ALTRES INDEXS ELABORATS A ESPANYA 5.6.1. INDEX DE PREUS DE CONSUM L Index de Preus de Consum, IPC, es un dels ndexs de m es import` ancia en lactualitat. Shi pret en analitzar levoluci o en el temps de la despesa en consum privat a preus constants (dun any pres com a base) per a un determinat estrat de poblaci o. A Espanya lelabora lInstitut Nacional dEstad stica (INE). Al nostre pa s va comen car a publicar-se en 1939 sobre la base de 1936 i ha experimentat diverses renovacions sobre les bases de 1958, 1964, 1976, 1983, 1992, 2001 i 2006. Per a elaborar-lo se selecciona una s` erie de b ens. Aquests b ens, una selecci o de 491 articles, formen el que sanomena cistell de consum. Els componentes del cistell de consum es determinen a trav es de lEnquesta de Pressupostos Familiars i s on el conjunt de b ens i serveis que les fam lies adquireixen normalment; canvien amb el temps en funci o dels usos de consum. Es publica cada mes i es pren com a base la mitjana aritm` etica simple dels ndexs mensuals de lany 2006. Una vegada determinat el cistell de consum, es valoren les quantitats corresponents consumides a preus del per ode base i de lactual. L ndex de preus utilitzat
94

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

94

c UJI

en la majoria dels pa sos, i en particular a Espanya, es l ndex de Laspeyres encadenat amb actualitzaci o de ponderacions anuals. Aquesta actualitzaci o anual t e els avantatges seg uents: LIPC sadapta als canvis del mercat i dels h` abits de consum en un termini molt breu de temps. En lIPC es poden incloure nous b ens o serveis quan apareixen en el mercat, aix com eliminar els que es consideren poc signicatius. Es calculen dotze ndexs independents, per a dotze grups de b ens i serveis de consum en qu` e sestructura el cistell de consum: aliments i begudes no alcoh` oliques, begudes alcoh` oliques i tabac, vestit i cal cat, habitatge, parament, medicina, transport, comunicacions, cultura i oci, ensenyament, hotels, caf es i resturants, altres b ens i serveis. A l ndex poden desagregar-se tantes variables com es vulga. LINE elabora aquest ndex a escala general o global, per a comunitats aut` onomes, per a capitals de prov ncia, per a nuclis urbans i per a ` arees rurals. Com que es obvi que en lestudi no poden incloures totes les fam lies, shi pren un conjunt de la forma m es ` amplia possible i representativa, anomenat estrat de ref` erencia. 5.6.2. ALTRES INDEXS Index de preus de consum harmonitzat (IPCA): es un indicador estad stic que proporciona una mesura comuna de la inaci o entre els pa sos de la Uni o Europea. En la p` agina web de lINE en podem trobar la metodologia i els resultats detallats. Indexs impl cits de preus: mesuren levoluci o dels preus i es deriven de la Comptabilitat Nacional (valors del producte nacional, despeses de consum i inversi o, estalvi, etc.). Aquests valors contenen, impl citament, les variacions en els preus de les magnituds macroecon` omiques. Els ndexs que shi calculen s on ndexs de preus de Paasche. Susen tamb e per a la deaci o de s` eries de valors. Indexs de producci o industrial: hi ha dues s` eries d ndexs de producci o industrial de periodicitat mensual: luna recull les variacions de loferta industrial dins de la majoria de les branques de lactivitat industrial i laltra especica les variacions en la producci o de b ens dequipament. Indexs de preus industrials: mesuren levoluci o dels preus dels b ens dequipament. Susen per a provocar deaci o en les s` eries de valors industrials. Indexs de preus agr coles: selaboren dos ndexs, l ndex de preus pagats (pels b ens i serveis que es necessiten) i l ndex de preus percebuts. La s` erie formada pel quocient daquests ndexs sanomena relaci o de paritat i mostra les variacions del poder adquisitiu del sector agr cola.
95

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

95

c UJI

Indexs de lactivitat comercial: selaboren ndexs que reecteixen levoluci o del comer c interior del pa s, com ara els ndexs de vendes de preus al detall i de lengr` os. El comportament del comer c exterior sestudia amb els ndexs de preus i de quantitats dexportacions i importacions. El quocient entre l ndex de preus dimportacions i exportacions rep el nom de relaci o real dintercanvi i permet con eixer levoluci o del poder de compra dun pa s davant de lestranger. Indexs dactivitat nancera: selabora una gran quantitat d ndexs: ndexs de cotitzacions de borsa, ndexs de fons dinversi o, etc. Generalment sutilitza l ndex mitjana aritm` etica ponderat, on les ponderacions s on el volum de contractaci o negociat de cada t tol en lany base.

5.7. PROBLEMES PROPOSATS (1) Donada lestad stica sobre la contractaci o efectiva de les borses espanyoles, en milions de pessetes: Anys 1972 1973 1974 1975 1976 1977 Madrid Barcelona 67993 100049 113385 102500 131180 74279 28878 43360 40685 31116 35426 17253 Bilbao 12179 19782 21198 23582 14350 16724 Val` encia 2817 3865 6892 6837 4775 7839

a ) Calcula els ndexs simples sobre la base de 1972. b ) Calcula els ndexs de Sauerbeck i de Bradstreet-D udot.

(2) Les quantitats emprades en jocs datzar a Espanya, en milions de pessetes, durant el per ode 1982-1987, han sigut: Any Quantitat 1982 1983 1984 1985 1986 1987

1700470 1829785 2011267 2147043 2238579 2518765

Expressa aquesta s` erie en pessetes constants de 1982 tenint en compte que lIPC sobre la base de 1980 ha sigut: Any IPC (base 1980) 1982 1983 1984 1985 1986 1987

131.1 147.0 163.6 178.0 193.7 204.0

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

96

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

96

c UJI

(3) Si tenim la informaci o seg uent sobre un conjunt de nombres ndexs simples 81 83 83 85 I83 = 0.95, I85 = 0.8, quant valdran I81 i I81 ? (4) Les relacions entre dos pa sos, Libert` onia i Esl` avia, queden reectides en les taules seg uents: Libert` onia va exportar a Esl` avia 2000 Producte E1 E2 E3 Preu 20 7 12 Quantitat 800 1500 200 Preu 32 11 14 2006 Quantitat 1400 600 500

Libert` onia va importar dEsl` avia 2000 Producte C1 C2 C3 C4 Calcula: a ) Els ndexs de preus de Laspeyres i Paasche per a lexportaci o i per a la importaci o sobre la base de lany 2000. b ) Els corresponents ndexs de quantitats. c ) La ra o real dintercanvi. (5) El propietari dun apartament t e pactat, en 2002, un lloguer amb el seu inquil de 300 e mensuals. Es vol revisar el lloguer sobre la base de lIPC grup habitatge. Quant caldr` a que pague en els anys 2003, 2004 i 2005? Anys IPC grup habitatge (base 2001) (Font: INE, Espanya ) 2002 2003 2004 2005 Preu 4 10 11 8 Quantitat 200 100 50 320 Preu 5 9 15 10 2006 Quantitat 410 300 100 150

102.257 105.215 108.895 114.689

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

97

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

97

c UJI

SOLUCIONS

(1)

a) Anys 1972 1973 1974 1975 1976 1977 Madrid 1 1.47 1.67 1.51 1.93 1.09 Barcelona 1 1.50 1.41 1.08 1.23 0.60 Bilbao 1 1.62 1.74 1.94 1.18 1.37 Val` encia 1 1.37 2.45 2.43 1.70 2.78

74 77 b ) Sp 73 72 = 1.49, Sp 72 = 1.82, Sp 74 = 0.75, .... BD73 = 1.493, BD74 = 1.628 ....

(2) Anys 1982 1983 1984 1985 1986 1977


83 85 (3) I81 = 1.0526, I81 = 1.315

Quantitat en milions de pessetes de lany 1982 1700470 1631843 1611721 1581376 1515113 1618640

(4)

a ) Per a lexportaci o: Lp = 155.4 %, Pp = 152.9 % Per a la importaci o: Lp = 119.1 %, Pp = 111.7 % b ) Per a lexportaci o: Lq = 132.2 %, Pq = 130.1 % Per a la importaci o: Lq = 141.3 %, Pq = 132.5 %
2006 c ) R2000 = 1.37

(5) Caldr` a que pague 308.68 e en 2003, 319.45 e en 2004, i 336.44 e en 2005.

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

98

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

98

c UJI

TEMA 6 ` SERIES TEMPORALS


6.1. INTRODUCCIO Una s` erie temporal consisteix, t picament, en un conjunt dobservacions duna variable Y , preses al llarg del temps en intervals regulars (cada dia, cada mes, etc.), i es, per tant, un conjunt de dades de la forma: {yt : t = 1, 2, , n} en el qual el sub ndex t indica el temps en qu` e la dada yt va ser observada. El seu estudi permet analitzar levoluci o que en el transcurs del temps ha experimentat la variable, tant per a descriuren les propietats com per a caracteritzarne els trets principals i poder predir-ne els valors futurs. Aquesta descripci o pot consistir en mesures descriptives i representacions gr` aques. Normalment, en problemes destad stica b` asica, les observacions s on m utuament independents, per` o en estudiar variables mesurades en el temps, les observacions s on clarament no independents. Cadascuna tendeix a un valor que est` a m es prop al de les observacions m es pr` oximes que al de les m es allunyades. Aquest tipus de comportament sanomena correlaci o serial. Exemple 6.1 Xifres ocials de poblaci o espanyola des de 1997 ns a 2007, segons la revisi o anual del padr o municipal de l1 de gener de cada any. Any 1997 1998 1999 2000 2001 2002 Poblaci o 39669394 39852651 40202160 40499791 41116842 41837894 Any 2003 2004 2005 2006 2007 Poblaci o 42717064 43197684 44108530 44708964 45200737

Exemple 6.2 Consum delectricitat: en la taula seg uent tenim el consum mensual delectricitat a Espanya en el per ode 2002-2006. Cal destacar que no hi estan incloses les energies renovables ja que no nexisteixen dades mensuals. Les dades estan expressades en milers de TEP (tona equivalent de petroli, es una unitat denergia equivalent a lenergia que hi ha en un tona de petroli). (Fonts: INE, Ministeri dInd ustria, Turisme i Comer c)

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4


Estad stica. Volum I - 2009/2010

99
99

Estadstica. Volum I - UJI


c UJI

Any Mes Gener Febrer Mar c Abril Maig Juny Juliol Agost Setembre Octubre Novembre Desembre

2002

2003

2004

2005

2006

1.616 1.424 1.483 1.433 1.450 1.463 1.555 1.406 1.434 1.492 1.497 1.552

1.691 1.570 1.554 1.438 1.499 1.596 1.695 1.589 1.542 1.585 1.587 1.691

1.711 1.640 1.732 1.544 1.566 1.634 1.746 1.619 1.640 1.617 1.694 1.770

1.880 1.762 1.782 1.614 1.631 1.740 1.829 1.676 1.664 1.645 1.743 1.899

1.964 1.782 1.842 1.579 1.720 1.759 1.942 1.750 1.765 1.731 1.730 1.920

GRAFICA ` 6.2. REPRESENTACIO Tota an` alisi duna s` erie temporal ha diniciar-se amb una representaci o gr` aca daquesta; en leix dabscisses cal posar el temps i en el dordenades, els valors de la s` erie. A c` o ens permet detectar les caracter stiques m es importants del fenomen, com ara el moviment a llarg termini, lamplitud de les oscillacions, la possible exist` encia de cicles, les ruptures, els valors an` omals, etc. Mirem els gr` acs de les s` eries temporals que hem vist en els exemples. Exemple 6.3 Xifres de poblaci o. Vegeu la gura 6.1. Exemple 6.4 Consum delectricitat. Vegeu la gura 6.2. ` 6.3. CARACTER ISTIQUES DUNA SERIE TEMPORAL Una de les formes m es senzilles danalitzar una s` erie temporal es descompondrela en una suma de quatre sumands: yt = mt + st + ct + ut on mt rep el nom de tend` encia i recull el component de la s` erie que representa levoluci o a llarg termini de la s` erie; st representa un component estacional x, per exemple aquelles oscillacions duna s` erie temporal que es completen dins dun any (o un per ode inferior a un any); ct representa el component c clic x, per exemple les oscillacions que es produeixen en un per ode superior a un any i que es deuen principalment a lalternan ca detapes de prosperitat i de depressi o en lactivitat econ` omica. Per a acabar, ut recull la variaci o residual i representaria la part aleat` oria, la deguda a latzar. El component c clic es molt dif cil dobtindre i es necessita una s` erie temporal molt llarga per a poder separar-lo de la resta.

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4


Estad stica. Volum I - 2009/2010

100
100

Estadstica. Volum I - UJI


c UJI

Nota 6.1 En lexemple 6.1 observem que nom es hi ha tend` encia; en lexemple 6.2 podem veure tend` encia i estacionalitat.

4.5107 4.4107 4.3107 4.2107 4.1107 4.0107 1997 1999 2001 2003 2005 2007

Poblaci o

Any Figura 6.1: Xifres de poblaci o a Espanya des de 1997 ns 2007

1.9

Consum delectricitat

1.8 1.7 1.6 1.5 1.4 2002 2003 2004 2005 2006 2007

Any

Figura 6.2: Dades de consum delectricitat en milers de TEP per mesos


101

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

101

c UJI

` ` 6.4. ANALISI DE LA TENDENCIA En aquest apartat estudiem procediments per a a llar la tend` encia i les variacions estacionals. Es pot fer amb dos objectius diferents: estimaci o de la tend` encia amb objecte de con eixer quines s on les pautes de comportament al llarg del temps de la variable objecte destudi, o per a la predicci o de valors futurs. Existeixen molts m` etodes, entre els quals nestudiarem u nicament dos: un de global i un altre de local. ` 6.4.1. ANALISI SENSE COMPONENT ESTACIONAL Suposem que tenim una s` erie temporal que podem descompondre com: y t = mt + u t No tenim ni component estacional, ni component c clic. A continuaci o, veurem com calcular la tend` encia en aquest cas.
` POLINOMICA ` METODE DE REGRESSIO

Consisteix a ajustar un polinomi a les dades usant el m` etode dels m nims quadrats, es a dir, tractar yt com a variable resposta i t com a variable independent, com vam veure en el tema 4 (nom es hem vist p = 1 o p = 2). p En aquest cas, podrem expressar la tend` encia com mt = bj tj , on bj sestima a partir de les dades, minimitzant:
t=1

Nota 6.2 Recordem que en el tema 4 tamb e vam veure que prenent logaritmes en la s` erie podem usar una regressi o lineal per a estimar una tend` encia exponencial. El gran avantatge que representa aquest m` etode es que podem donar-hi una mesura de la bondat calculant el coecient de determinaci o i interpretant-lo de la manera ja coneguda. Exemple 6.5 Ajustament de la tend` encia de les dades de la poblaci o espanyola en el per ode 1996-2007: mt = 1.25824 1011 1.26241 108 t + 31675 t2 .

j =0

(yt mt )2 .

` ` METODE DE MITJANES MOBILS

Es basa en la suavitzaci o de la s` erie a partir del c` alcul reiterat de valors mitjans. Una mitjana m` obil duna s` erie temporal yt es una s` erie temporal denida per:
p 1 xt+j mt = 2p + 1 j =p

on p es un enter positiu. 2p + 1 sanomena ordre de la mesura m` obil.

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

102

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

102

c UJI

Nota 6.3 Observeu que el valor de mt est` a indenit prop del principi i del nal de la s` erie. Una forma de completar aquesta denici o, per als valors extrems, es deixar que la suma vaja des de m` ax(p, 1 t) ns a m n(p, n t) i dividir entre el nombre dels sumands corresponents.

Exemple 6.6 Calculem les mitjanes m` obils dordre 5 (p = 2) amb les dades de lexemple 6.1. Any 1997 1998 1999 2000 2001 2002 Tend` encia (mt ) 39908068 40055999 40268168 40701868 41274750 41873855 Any 2003 2004 2005 2006 2007 Tend` encia (mt ) 42595603 43314027 43986596 44303979 44672744

4.4107 4.3107

Poblaci o

4.2107 4.1107 4.0107 1998 2000 2002 2004 2006

Any Figura 6.3: S` erie de poblaci o despr es dhaver-hi aplicat el m` etode de les mitjanes m` obils
Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4 103 Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

103

c UJI

` 6.4.2. ANALISI AMB COMPONENT ESTACIONAL Els m` etodes utilitzats per a eliminar la tend` encia poden adaptar-se duna forma natural quan necessitem eliminar tant la tend` encia com lestacionalitat, es a dir, quan tenim: y t = m t + st + u t . Nota 6.4 Observeu que, per la denici o de component estacional, existeix un d (per ode que tarda a completar-se una oscillaci o) de tal manera que st = st+d i d sj = 0. (Per exemple, si lestacionalitat es anual, aleshores d = 12.)
j =1

` ` METODE DE LES MESURES MENSUALS (TENDENCIA LINEAL)

Suposem que la tend` encia es lineal, es a dir: mt = a + b t. Aleshores: (1) Estimem aquesta tend` encia usant les mesures anuals de les dades observades:
d

anual y j

k=1

yj 1)d+k d

j = 1, . . . , N

on N =

n es el nombre de per odes o anys, i hi ajustem una recta d


anual y j = a + bj

pel m` etode dels m nims quadrats (tema 4). (2) Calculem les mitjanes mensuals:
N 1 y k = y(j 1)d+k N j =1

k = 1, . . . , d .

(3) Per a a llar el component estacional de la variaci o deguda exclusivament al pas del temps restem a cada mitjana mensual la proporci o que hi correspon de lincrement anual:
y k =y k

b(k 1) d

k = 1, . . . , d .

(4) Finalment, per a estimar-ne el component estacional, restem a cada mitjana mensual corregida la mitjana global corregida:
s k = y k

1 y . d k=1 k
104 Estadstica. Volum I - UJI

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

Estad stica. Volum I - 2009/2010

104

c UJI

Exemple 6.7 Apliquem aquest m` etode per a estimar el component estacional de les dades de lexemple 6.2. (1) Mitjanes anuals: Any Mitjana 2002 (1) 1.48 2003 (2) 1.59 2004 (3) 1.66 2005 (4) 1.74 2006 (5) 1.79

Ajustant una recta a aquestes dades obtenim b = 0.08. (2) Mitjanes mensuals: Mes Mitjana Gener 1.77 Febrer Mar c Abril 1.64 1.68 1.52 Maig 1.57 Juny Juliol 1.64 1.75

Mes Mitjana

Agost 1.61

Setembre Octubre 1.61 1.61

Novembre Desembre 1.65 1.77

(3) Mitjanes mensuals corregides: Mes Mitjana Gener 1.77 Febrer Mar c Abril 1.63 1.66 1.50 Maig 1.54 Juny Juliol 1.60 1.71

Mes Mitjana

Agost 1.56

Setembre Octubre 1.56 1.55

Novembre Desembre 1.58 1.69

(4) Component estacional: Mes Component Gener 0.15 Febrer Mar c Abril 0.01 0.05 -0.11 Maig -0.07 Juny Juliol -0.01 0.09

Mes Component

Agost -0.05

Setembre Octubre -0.06 -0.06

Novembre Desembre -0.03 0.08

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

105

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

105

c UJI

0.15

Component estacional

0.10 0.05 0.00 -0.05 -0.10 2002 2003 2004 2005 2006 2007

Any

Figura 6.4: Component estacional de lexemple 2 amb el m` etode de les mitjanes mensuals

` ` METODE DE LES MITJANES MOBILS

(1) Es tracta, en primer lloc, daplicar una mitjana m` obil per a suavitzar la tend` encia (prenem tots els valors i mitjanem), distingint si el per ode es parell o imparell. Aix doncs:
q 1 a ) Si d = 2q + 1 m t = yt+j . d j =q

q 1 1 b ) Si d = 2q m t = (0.5 ytq + yt+j + 0.5 yt+q ) q < t n q . d j =q +1

En el cas m es habitual de d = 12 i: m t = 1 (0.5 xt6 + xt5 + + xt+5 + 0.5 xt+6 ). 12

(2) El segon pas consisteix a estimar el component estacional. a ) Per a cada k = 1, . . . , d calculem la mitjana wk de les desviacions a dir: {yk+jd m k+jd : q < k + jd n q }. Es
N 1 1 wk = (yk+jd m k+jd ). N 1 j =1

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4


Estad stica. Volum I - 2009/2010

106
106

Estadstica. Volum I - UJI


c UJI

que ja sumen 0.

Com que aquestes mitjanes no sumen zero, estimem el component estacional com: d 1 s k = wk wi , k = 1, . . . , d d i=1

(3) Per a acabar, reestimem la tend` encia de {dt }, amb: dt = y t s t , utilitzant un ltre de mitjanes m` obils per a dades sense estacionalitat (vist anteriorment), o ajustant un polinomi a les {dt }. Exemple 6.8 Apliquem aquest m` etode per a estimar el component estacional de les dades de lexemple 2: Mes Component Mes Component Gener 0.15 Febrer Mar c Abril 0.02 0.05 -0.13 Maig -0.08 Juny Juliol -0.01 0.07

Agost Setembre Octubre -0.03 -0.05 -0.05

Novembre Desembre -0.01 0.07

0.15

Component estacional

0.10 0.05 0.00 -0.05 -0.10 2002 2003 2004 2005 2006 2007

Any

Figura 6.5: Component estacional de lexemple 2 amb el m` etode de les mitjanes m` obils

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

107

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

107

c UJI

6.5. PROBLEMES PROPOSATS (1) Amb quin component duna s` erie temporal associar eu cadascun dels fets seg uents: a ) Una vaga de treballadors. b ) Un increment de la producci o del blat a causa de la incorporaci o de noves t` ecniques de conreu. c ) Un augment de les vendes dautom` obils durant el mes de maig. d ) Una recessi o en el volum de construcci o dhabitatges durant tres anys. (2) En la gura 6.6 veiem la representaci o gr` aca de cinc s` eries temporals recollides en estudis independents. Identica els components de cadascuna sabent que es corresponen amb els estudis seg uents: a ) S` erie temporal dexportacions anuals de taulells a It` alia (en milers de metres quadrats) des de 1990 ns a 2003. b ) S` erie del nombre mensual dautom` obils matriculats a Espanya en el per ode de 1998-2003. c ) Dades mensuals proporcionades per lINE sobre el consum de gasolina a Espanya, des de gener de lany 2000 ns gener de 2007. (Les dades estan en milers de tones.) d ) La Conselleria de Medi Ambient de la Generalitat Valenciana, desenvolupa una campanya de vigil` ancia dels nivells de contaminaci o per oz o en latmosfera. Per a aquest disposa de diverses estacions de mesurament repartides per tota la comunitat. En la gura 6.6 es consideren les dades recollides di` ariament en lestaci o meteorol` ogica de Penyeta Roja (Castell o), durant els anys 2006 i 2007. e ) Dades de vendes mensuals duna empresa durant els u ltims anys. (3) El volum de facturaci o (en milers deuros) dun hipermercat durant els 15 anys que est` a obert, ha seguit levoluci o seg uent: Anys Facturaci o Anys Facturaci o 1 2500 9 6500 2 3400 10 6200 3 3800 11 7500 4 4200 12 8200 5 4700 13 9000 6 5200 14 9300 7 5500 15 9000 8 6000

a ) Estima quin ser` a el volum de facturaci o daquest hipermercat dac a3 anys a trav es de la recta de tend` encia. b ) Calcula el coecient que mesura el grau de bondat dajustament i comenta el resultat obtingut.

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

108

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

108

c UJI

(4) Shan recollit dades de levoluci o de les despeses en vestit i en cal cat per persona i dia durant els anys 2005, 2006 i 2007: Any 2005 2006 2007 Trimestre 1r 2n 3r 4t 8 11 6 16 9 14 8 18 11 16 9 19

a ) Identica si aquesta s` erie temporal presenta tend` encia i component estacional. b ) Calcula els components que hages identicat en lapartat anterior. (5) LInstitut Nacional dEstad stica, en lapartat Estad stica de Transport de Viatgers, publica les dades de milers de viatgers que han utilitzat el ferrocarril com a mitj` a de transport interurb` a. Les dades estan presentades amb mesures mensuals, des de lany 1996 ns a nal de 2007. En la gura 6.7 veiem la representaci o daquestes dades. A continuaci o es detallen les dades dels quatre u ltims anys: Anys 2004 2005 2006 2007 Gener 47424 49220 50808 51067 Febrer 46820 47225 50012 49175 Mar c 50148 49305 52291 54683 Abril 45446 52144 48557 49288 Maig 50141 52769 53890 53762 Juny 49013 50978 51260 50565

Anys 2004 2005 2006 2007

Juliol 45578 46700 49034 48489

Agost 35083 37162 38196 35856

Set. 47275 48535 48593 46582

Oct. 51468 52693 55246 53909

Nov. 50495 51913 52961 51133

Des. 45820 48215 48000 45980

a ) Quins components pots identicar en aquesta s` erie temporal? Utilitza el m` etode de les mitjanes m` obils per a calcular el component estacional daquesta s` erie. Dibuixa-la. b ) Resta a cada dada el seu component estacional. Dibuixa la s` erie resultant. c ) Ajusta un model lineal a la s` erie obtinguda en lapartat anterior.

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

109

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

109

c UJI

(a)

(b)

(c)

(d)

(e)

Figura 6.6: S` eries temporals del problema 2


Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4 110 Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

110

c UJI

Figura 6.7: S` erie temporal del problema 5. Milers de viatgers (per mesos) que utilitzen el tren per als trajectes interurbans

SOLUCIONS (1) a ) Variaci o residual b ) Tend` encia c ) Component estacional d ) Component c clic (2) a ) Tend` encia b ) Component estacional c ) Tend` encia i estacionalitat d ) Variaci o residual e ) Tend` encia, estacionalitat i un componente c clic de 2 anys de duraci o (3) a ) mt = 2229.52 + 479.64 t. Predicci o: 10863.10 milers deuros b ) 0.98 (4) a ) Tend` encia component estacional b ) Pel m` etode de les mitjanes mensuals (en aquest cas trimestrals) Tend` encia: yt = 8.58 + 1.75 t Component estacional: 1.6875, 0.9375, 4.4375, 5.1875
Estad stica. Volum I - 2009/2010

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

111

111

Estadstica. Volum I - UJI c UJI

(5)

a ) Tend` encia i component estacional b) Mes Component estacional 1087.63 524.54 2763.35 642.41 4076.98 1526.56 1640.54 12014.18 789.20 4095.78 2646.13 1870.38

Gener Febrer Mar c Abril Maig Juny Juliol Agost Setembre Octubre Novembre Desembre

c ) yt = 47292.81 + 60.25 t

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

112

Estadstica. Volum I - UJI

Estad stica. Volum I - 2009/2010

112

c UJI

BIBLIOGRAFIA
[1] Calot, G., Curso de Estad stica Descriptiva, Paraninfo, 1988. [2] Canavos, G. C., Probabilidad y Estad stica, McGraw-Hill, 1988. [3] Dur a, J. M. y L opez, J. M., Fundamentos de Estad stica, Ariel, 1992. [4] Escuder Vall es, R., M etodos Estad sticos Aplicados a la Econom a, Ariel, 1987. [5] Garc a Barbancho, A., Estad stica Elemental Moderna, Ariel, 1992. [6] L opez de la Manzanera, J., Problemas de Estad stica, Pir amide, 1989. [7] Mart n Guzm an, P. y Mart n-Pliego J., Curso B asico de Estad stica Econ omica, A.C., 1993. [8] Mart n Pliego, F. J., Curso pr actico de estad stica econ omica, A.C., 1987. [9] Mart n Pliego, F. J., Introducci on a la Estad stica Econ omica y Empresarial, A.C., 1994. [10] Mendenhall, W. y Reinmuth, J., Estad stica para Administraci on y Econom a, Grupo Editorial Iberoam erica, 1981. [11] Montiel, A. M., Rius, F. y Bar on, F. J., Elementos B asicos de Estad stica Econ omica y Empresarial, Prentice Hall, 1997. [12] Murgui, J. S., Aybar, C., Casino, A., Colom, C., Cruz, M. y Yag ue, R., Estad stica para Econom a y Administraci on de Empresas: Aplicaciones y Ejercicios, Puchardes, 1992. [13] Newbold, P., Estad stica para los negocios y la Econom a, Prentice Hall, 1997. [14] Pe na, D., Estad stica: modelos y m etodos, Vol. 1 (Fundamentos), Alianza Universidad, 1991. [15] Spiegel, M. R., Estad stica, McGraw Hill, 1997. [16] Tomeo Perucha, V. y U na Ju arez, I., Lecciones de Estad stica Descriptiva. Curso te orico-pr actico, Thomson, 2003.

Estad stica. Volum I - 2009/2010

Castell / Ibez / Martnez / Sim - ISBN: 978-84-692-9048-4

113
113

Estadstica. Volum I - UJI

c UJI

You might also like