You are on page 1of 42

MATEMTICASI

1Bachillerato
Captulo9:Estadstica

LibrosMareaVerde.tk
www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro

Ilustraciones:BancodeImgenesdeINTEF

393

Estadstica

ndice

1.ESTADSTICADESCRIPTIVAUNIDIMENSIONAL
1.1.INTRODUCCIN
1.2.MTODOESTADSTICO
1.3.CONCEPTOSBSICOS
1.4.TIPOSDEVARIABLES
1.5.DISTRIBUCIONESDEFRECUENCIAS
1.6.TABLAODISTRIBUCINDEFRECUENCIASDEUNAVARIABLE
1.7.DISTRIBUCIONESDEFRECUENCIASAGRUPADAS
1.8.GRFICOS
1.9.PARMETROSESTADSTICOSDEPOSICIN
1.10.PARMETROSESTADSTICOSDEDISPERSIN

2.ESTADSTICADESCRIPTIVABIDIMENSIONAL
2.1.INTRODUCCIN
2.2.DISTRIBUCINDEFRECUENCIASCONJUNTAS
2.3.DISTRIBUCINDEFRECUENCIASMARGINALES
2.4.DISTRIBUCINDEFRECUENCIASCONDICIONADAS
2.5.INDEPENDENCIAESTADSTICA
2.6.DIAGRAMADEDISPERSIN.NUBEDEPUNTOS

3.COVARIANZA
3.1.IDEACORRELACIN.COVARIANZA
3.2.COEFICIENTECORRELACINLINEAL
3.3.RECTAREGRESINLINEAL
3.4.PREDICCINYCAUSALIDAD

Resumen
En esta unidad vamos a repasar todos los conceptos de estadstica unidimensional aprendidos en
cursosanteriores,revisandolastablasdefrecuencias,calculandolasmedidasdecentralizacin,media,
medianaymodaylasmedidasdedispersin,varianzaydesviacintpica.
Elestudiounidimensionalloampliaremosalanlisisconjuntodedosvariables,estudiobidimensional,
utilizandolastablasdedobleentradaparaestudiarlarelacinentreellasyanalizandocadaunadelas
variables por separado desde las tablas, obteniendo as las distribuciones que ahora llamaremos
marginales.
Hay parejas de variables que, aunque no puedan relacionarse por medio de una frmula, s que hay
entreellasunadeterminadarelacinestadstica.Lavisualizacinpormediodelasnubesdepuntosnos
permitirhacernosunaidearazonablesobreestacorrelacinentrelasvariables.
Unabuenaformademarcarlastendenciasdelasnubesdepuntoseshaciendousodeunasrectasque
llamaremosrectasderegresin.
Cuandolacorrelacinesfuerte,lospuntosestnmuyprximosalarecta.Enestoscasoslarectade
regresin resultar muy til para hacer previsiones, conociendo un valor de una variable podremos
calculareldelaotraconrazonableseguridad.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

394

Estadstica

1.ESTADSTICADESCRIPTIVAUNIDIMENSIONAL
Yaconocesde3y4deESOmuchosobreEstadstica,recuentodedatos,tablasygrficas,parmetros
comomedia,mediana,moda.Vamosarevisarestosconocimientos.

1.1.Introduccin
LaEstadsticaeslaCienciaqueseencargadelarecopilacin,representacinyelusodelosdatossobre
unaovariascaractersticasdeinterspara,apartirdeellos,tomardecisionesoextraerconclusiones
generales.
Ejemplo1:
Elgobiernodeseaaveriguarsielnmerodehijosporfamiliahadescendidorespectoaladcada
anterior. Para ello ha entrevistado a 50 familias y les ha preguntado por el nmero de hijos
obteniendolossiguientesdatos:
24231242302223262322323343345203203212322314232433221.

Ejemplo2:
Un nuevo hotel va a abrir sus puertas en nuestra ciudad. Antes de decidir el precio de sus
habitaciones, el gerente investiga los precios por habitacin de los 40 hoteles de la misma
categoraquehaycercadenuestraciudad.Losdatosobtenidosson:
394737564349506151455339435060475142445833394350604751424458334341
5844386143534540543947334547424548.

1.2.Mtodoestadstico
LaEstadsticadescriptivaeslapartedelaestadsticaqueseencargadeorganizar,resumirydaruna
primeradescripcin(sinconclusionesgenerales)delosdatos.
En Estadstica se sigue un mtodo estadstico que est formado por distintas fases segn se trata la
informacinrecibida.
0. Planteamientodelproblemaentrminosprecisos:mbitodeaplicacin(poblacin)y
caractersticasaestudio(variables).
1. Recogidadedatosdelapoblacindeinters:Muestreo.
2. Organizacin, presentacin y resumen de los datos (o de la muestra): Estadstica
descriptiva.
3. Modelosmatemticos:Teoraprobabilidad.
4. Obtenerconclusionesgeneralesoverificarhiptesis.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

395

Estadstica

1.3.Conceptosbsicos
Poblacin.Eselconjuntodeindividuosoentessujetosaestudio.
Ejemplo1:
Conjuntodetodaslasfamiliasespaolas
Ejemplo2:
Todosloshotelesdeestacategoradelascercanas.
Algunas poblaciones son finitas y pueden conocerse en su totalidad, otras en cambio pueden ser
infinitasyabstractas.

Muestra:Eselnmerodedatosquetomamosdelapoblacinpararealizarnuestroestudio.
Ejemplo1:
Las50familiasalasquesehapreguntadoporelnmerodehijos
Ejemplo2:
Los40hoteles.

Tamaomuestral:Nmerodeobservacionesenlamuestra.
Habitualmentesedenotarporn.
Ejemplo1:
n=50.
Ejemplo2:
n=40.
Dato:Cadavalorobservadodelavariable.
Ejemplo1:
24231242302223262322323343345203203212322314232433221.
Ejemplo2:
39473756434950615145533943506047514244583339435060475142445833
43415844386143534540543947334547424548.
Variable:Caractersticaqueestamosmidiendo.
Ejemplo1:
Nmerodehijos.
Ejemplo2:
Preciodelahabitacin.
LasvariablessuelendenotarseporlasletrasmaysculasX,Y..
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

396

Estadstica

1.4.Tiposdevariables
Cualitativas o categricas: Aquellas que no son medibles, es decir aquellas cuyas observaciones no
tienencarcternumrico.Expresancualidadesocategoras.
Ejemplos:
Sexo,profesin,estadocivil
Cuantitativas:Aquellasquesonmedibles,esdecir,susobservacionestienencarcternumrico.Estas
sedividenen:
Discretas:Tomanvaloresnumricosfijos.
Ejemplos:
Nmero de habitaciones, nmero de hijos de una familia, nmero de trabajadores de una
fbrica
Continuas:Tomanvaloresenintervalosdenmeros
Ejemplos:
Peso,estatura,cuandoseorganizanlosdatosenintervalos.

1.5.Distribucionesdefrecuencias
Observando los datos del ejemplo es fcil adivinar cul ser el primer paso en la organizacin de los
datos,consistirenagruparlosdatosqueserepitenvariasveces.
Tenemoslassiguientesdefiniciones:
Frecuenciaabsoluta(ni):Eselnmerodevecesqueserepiteenlamuestraundeterminadovalor(xi)
delavariable.
Ejemplo:
Paraeldatox1=0,n1=2;paraeldatox4=3,n4=15.
Propiedad:
Lasumadetodaslasfrecuenciasabsolutasesigualaltamaomuestral.
ni n

Frecuencias relativas (fi): Es igual a la frecuencia absoluta dividida por el nmero total de datos, es
decirporeltamaomuestral.
fi

ni

Ejemplo:
2
15
0'04 f 4
0'3
50
50
Propiedad:
Lasumadetodaslasfrecuenciasrelativasesiguala1.
f1

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

397

Estadstica

Frecuencias acumuladas (Ni): Nos dice el nmero de datos que hay igual o inferiores a uno
determinado.
Secalculasumandoelnmerodefrecuenciasabsolutasquehayanterioresallegaralaquequeremos
calcular.
Ejemplo:
N1=2N4=42.
Propiedad:
Laltimafrecuenciaacumuladaesigualaltamaomuestral,alnmerototaldedatos.
Frecuenciarelativaacumulada(Fi):Eselresultadodedividircadafrecuenciaacumuladaporelnmero
totaldedatos.
Fi

Ni

Ejemplo:
F1 0'04 F4

42
0'84
50

Propiedad:
Laltimafrecuenciarelativaacumuladaessiempre1.

1.6.Tablaodistribucindefrecuenciasdeunavariable
Llamamosasaunatablaconteniendoelconjuntodediferentesvaloresquehatomadouna variable
(losdatossinrepetir)ordenadosdemenoramayorconsuscorrespondientesfrecuencias.

Actividadesresueltas
Latabladevaloresdelejemplo1delnmerodehijos

xi

ni

fi

Ni

Fi

004

004

008

012

21

042

27

054

15

03

42

084

012

48

096

002

49

098

002

50

Culeselnmerodefamiliasquetienecomomximodoshijos?
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

398

Estadstica

Miramoslacolumnasegundani:2+4+21=27omiramoslacolumnacuarta,tercerafila:Ni:nosda27
Cuntasfamiliastienenmsdeunhijoperocomomximo3?
Miramos la columna segunda: 21 + 15 = 36 o miramos la columna cuarta y restamos las filas cuarta
menossegunda426=36.
Quporcentajedefamiliastienemsde3hijos?
Miramosenlacolumnatercera:012+002+002=01616%oenlacolumnasquintarestandoala
ltimafilalacuartafila,esdecir,1084=01616%.

1.7.Distribucionesdefrecuenciasagrupadas
Ahoravamosatrabajarconunadistribucindefrecuenciasagrupadasconelejemplodelpreciodeuna
habitacindehotel.
Ejemplo2:
xi

ni

fi

Ni

Fi

36

005

005

37

0025

0075

38

0025

01

39

0075

0175

40

0025

02

41

0025

0175

42

005

11

02

43

01

15

0225

44

005

17

0275

45

01

21

0375

47

01

25

0425

48

0025

26

0525

49

0025

27

0625

50

005

29

0650

51

005

31

0675

53

0725

54

..

0775

..
..
..
..

..
..
.
..

..
.
..
..

56
1
58
2
60
1
61
2
Estatablaesdemasiadograndeymuypocooperativa.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

399

Estadstica

Cuandolavariabletomamuchosvalores,latablaqueseobtieneesdemasiadograndeyportantopoco
clarificadora,estonosvaaocurrirfrecuentementeenelcasoenquelavariableaestudiarseacontinua.
La solucin a este problema est en agrupar los diferentes valores de la variable en intervalos o
intervalos de clase. Teniendo en cuenta que lo que ganamos en manejabilidad lo perdemos en
informacin,esdecirlosresultadossernaproximados.

Agrupar en intervalos de clase consiste en agrupar los datos en nmeros relativamente pequeo de
intervalosquecumplan:
Nosesuperponganentres,deformaquenoexistaambigedadconrespectoalaclaseaque
perteneceunaobservacinparticular.
Cubrantodoelrangodevaloresquetenemosenlamuestra.

Llamaremos:
A las fronteras del intervalo, lmites inferior y superior de clase y los denotaremos por li, Li
respectivamente.
Marcadeclase(ci)alpuntomediodelintervalo,esdecir,alpromedioaritmticoentreellmite
L l
inferioryelsuperior: ci i i .Eselvalorquetomaremoscomorepresentativodelintervalo
2
oclase.
Amplitud(ai)esladiferenciaentreelextremosuperioreinferior:ai = Li li.
Alnmerodeobservacionesdeunaclaseselellamafrecuenciadeclase(ni)sidividimosesta
frecuenciaporelnmerototaldeobservaciones,seobtienelafrecuenciarelativadeclase(fi),y
delmismomodoquelohacamosparadatossinagrupardefiniramos(Ni)y(Fi).

Cmoconstruirunadistribucindefrecuenciasagrupadaenintervalos
1. Empezamosdeterminandoelrecorridodelavariable(Re)orangodevaloresquetenemosenla
muestra.Sedefinecomoladiferenciaentreelmayoryelmenorvalordelavariable.
2. Nmerodeclases.Dependedeltamaodelamuestra.ParamuestrasdetamaomoderadoN
menor que 50, se suele elegir un nmero de clases o intervalos igual a n . Para muestras
mayoresseutilizalafrmuladeSturges

log( n )
1 ,engeneralelnmerodeintervalosnodebe
log( 2 )

sobrepasarde15o20,encasosdemuestrasmuygrandes.
3. Determinamoslaamplituddelosintervalos.Esmscmodoquelaamplituddetodaslasclases
sealamisma(siemprequeseaposibleyexceptoelprimeroyelltimo),siesasai=a= Re/n
intervalos.
4. Tomaremoscomoreglageneral,anoserqueseindiquelocontrario,hacerqueelintervaloest
cerradoporlaizquierdayabiertoporladerecha(exceptoelltimointervalo).
Ejemplo:
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

400

Estadstica

Representaladistribucindefrecuenciasagrupadasparalosdatosdelejemplodelpreciodelas
habitacionesdeunhotel.

Recorrido:Elmenorvalores33yelmayores61,ladiferenciaes28yportantoelrecorridoes:Re=28.
Nmero de clases: N=40,hacemosquelatablatenga6clases,pues 40 6.
Amplitud:a=28/6=467
Comolaamplitudnossaleunnmerocondecimaleslosintervalosnosvanaquedarrarosportanto
hacemoselarreglosiguiente:
Paraquelosintervalosnosquedenconamplitud5tomamoscomoprimervalorel325enlugardel33y
comoltimoel625enlugardel61.
Amplitud:a=5.
Aspueslatablaqueda:
[li, Li[

c i

ni

fi

Ni

Fi

[325,375[

35

0075

0075

[375,425[

40

02

11

0275

[425,475[

45

14

035

25

0625

[475,525[

50

015

31

0775

[525,575[

55

01

35

0875

[575,625[

60

0125

40

Cuntoshotelestienenunprecioentre325y375euros?
3
Cuntoshotelestienenunpreciosuperiora475?
15
Quporcentajedehotelescuestancomomucho425?
275%.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

401

Estadstica

Actividadespropuestas
1. Completalosdatosquefaltanenlatabla.
xi

ni

fi

Ni

Fi

10

005

005

13

01

015

16

16

04

19

15

22

015

37

0925

25

2. Completalosdatosquefaltanenlatabla.
[li, Li[

ni

fi

Ni

[0,10[

60

60

[10,20[

04

[20,30[

30

170

[30,40[

01

[40,50]

200

1.8.Grficos
Laformadeladistribucindefrecuenciassepercibemsrpidamenteyquizsseretienedurantems
tiempoenlamemoriasilarepresentamosgrficamente.

Diagramadebarras
Es la representacin grfica usual para las variables cuantitativas sin agrupar o para variables
cualitativas. En el eje de abscisas representamos los diferentes valores de la variable xi. Sobre cada
valorlevantamosunabarradealturaigualalafrecuencia(absolutaorelativa).

Nmerodehijos
25
20
15
10
5
0
0

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

402

Estadstica

Diagramadesectoresopastel
Eselmsusualenvariablescualitativas.Serepresentanmediantecrculos.Acadavalordelavariable
seleasociaelsectorcircularproporcionalasufrecuencia.
Parahallarelngulousamosunaregladetres:
n360o1360
ninguloifinguloi
Ejemplo3:
Enunasvotacionesdeunacomunidaddevecinosparadecidirsicambialaantenadetelevisin
delacomunidad,de50vecinos25votanafavor,15encontray10seabstienen.Representalos
datosmedianteundiagramadesectores.

xi

fi

Afavor

05

Encontra

03

Abstencin

01

votaciones
afavor
encontra
abstencin

Histogramas
Es la representacin grfica equivalente al diagrama de barras para datos agrupados. En el eje de
ordenadasrepresentamoslasclasesylevantamossobrecadaclaserectngulosunidosentresdealtura
n
igualalafrecuenciadelaclase(absolutasorelativas)sitodaslasclasestienenlamismaamplitudy i
ai
o

fi
sitienendistintasamplitudes.
ai

En cualquier caso, observa que, en un histograma el rea de los rectngulos es proporcional a la


frecuenciarepresentada.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

403

Estadstica

Preciodehabitacindehotel
16
14
12
10
8
6
4
2
0
]32.5,37.5]

]37.5,42.5]

]42.5,47.5]

]47.5,52.5]

]52.5,57.5]

]57.5,62.5]

El histograma o diagrama de barras proporcionan mucha informacin respecto a la estructura de los


datos (y si la muestra es representativa de la poblacin, respecto a la estructura de la poblacin): el
valorcentraldeladistribucin,sudispersinylaformadeladistribucin.

Polgonodefrecuencias
Es la representacin habitual para datos cuantitativos agrupados de las frecuencias (absolutas o
relativas,acumuladasabsolutasorelativas),mediantepuntosserepresentanlasfrecuenciaseneleje
deordenadasylamarcadeclaseeneldeabscisas.Despusseunenestospuntosporsegmentosde
rectas.

Preciodehabitacindehotel
16
14
12
10
8
6
4
2
0
35

40

45

50

55

60

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

404

Estadstica

1.9.Parmetrosestadsticosdeposicin
Paradatoscualitativos,ladistribucindefrecuenciasproporcionaunresumenconcisoycompletodela
muestra, pero para variables cuantitativas puede complementarse este resumen utilizando medidas
descriptivasnumricasextradasdelosdatos.Estasmedidassonvaloresnumricoscalculadosapartir
delamuestrayquenosresumenlainformacincontenidaenella.

Mediaaritmtica
Eselpromedioaritmticodelasobservaciones,esdecir,elcocienteentrelasumadetodoslosdatosy
el nmero de ellos. (Teniendo en cuenta que si un valor se repite hay que considerar estas
repeticiones).
x

k
i xi ni
xi f i
n
i 1

Silosdatosestnagrupadosenintervalosutilizaremoslasmarcasdeclase,ci,envezdexi.
Eslamedidadecentralizacinmsimportante.
Ejemplo1.
Nmeromediodehijos.
x

0 2 1 4 2 21 3 15 4 6 5 1 6 1 126

2'52 hijos.
50
50

Utilizandolosdatosdelasfrecuenciasrelativas.

x 0 0'04 1 0'08 2 0'42 3 0'043 4 0'12 5 0'02 6 0'02 2'52 hijos.


Ejemplo2.
Preciomedio.
Comotenemoslosdatosagrupadosenintervalosutilizamoslasmarcasdeclase:
x

35'3 40'8 45'14 50'6 55'4 60'5 1875

46'875
40
40

Oequivalentemente:

x 35 0'075 40 0'2 45 0'35 50 0'15 55 0'1 60 0'125 4'6875.

Propiedades.
1. Siatodoslosvaloresdeunavariablelessumamosunaconstante,lamediaaritmtica
quedaaumentadaenesaconstante.
2. Siatodoslosvaloresdeunavariablelosmultiplicamosporunaconstante,lamedia
aritmticaquedamultiplicadaporlamismaconstante.
3. Siconsideramosyi = a + bxisiendoaybdosconstantescualesquiera,lanuevamedia
aritmticaquedara y a bx
4. Lasumadetodoslosvaloresdelavariablerestndoleslamediaescero.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

405

Estadstica

Mediana
Esaquelvalorque,alordenarlasobservacionesdemenoramayor,ocupaellugarcentral,dividiendoal
conjuntodeobservacionesendospartesiguales.Esdecir,quedejaasuderechayasuizquierdael50
porcientodelasobservaciones.
Si el tamao de la muestra, n, es impar, necesariamente existe un dato que ocupa el lugar central,
concretamenteeldatoquealordenarlosestenlaposicin(n+1)/2;perosinespar,sondoslosdatos
queencontramosenellugarcentral,losqueocupanloslugaresn/2y(n/2)+1,calculandoentoncesla
medianacomoelpuntomedioentreambosdatos.

Ejemplo4:
Si tenemos los datos de 30 valores sobre el peso de los estudiantes de 1 de bachillerato
ordenadosdemenoramayor.
261428604541489552355244560056745729577958345944651065856826
683468476924714874827837814381728184836286628782919392789697
Comon=30espar,lamedianaserelvalormediodelosvaloresqueocupanlasposiciones15y16en
latabla:68266834
Mediana=Me=(6826+6834)/2=683kg.

Ejemplo5:
Las 13 primeras observaciones correspondientes al nmero de chocolatinas consumidas en un
daporlosestudiantesdeunaclaseson:
0122222223333.
Eldatoqueocupaelvalorcentral,eselqueocupaellugarsptimoyaquehay13valores,esedatoesla
medianaportantolamedianaes2.
Me=2.

Moda
Esaquelvalorquetienemayorfrecuencia.
Enelcasodelasfrecuenciasagrupadasenintervalossetomaelintervaloquemsvecesserepitecomo
lamoda

Ejemplo5:
Paralavariableconsumodechocolatinasdelejemplo5lamodaesMo=2
Ejemplo2:
Paralosdatosdelejemplo2eselintervalo[425,475).
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

406

Estadstica

Percentiles
Elpercentilpsimoesaquelvalorqueverificalacondicindequeelp%delosdatossonmenoreso
igualesal.
As,elpercentil70suponequeel70%delosdatossonmenoresoigualesal.
Ejemplo:
Queremoscalcularelpercentil30delosdatosdelejemplo5,tendremosencuentaqueel30%
de 30 datos que hay es 9, as buscamos el dato que ocupa esa posicin en la ordenacin del
ejemplo5,quees5729.
Siqueremoscalcularelpercentil15,tenemosencuentaqueel15%de30es45,perocomoeste
datonoperteneceaningunaposicintomamoslaaproximacinporexceso,oseatomamosel
dato que ocupa la posicin 5 por tanto el percentil 15 seria el dato 5235. Tambin es posible
aproximarlomejormedianteunainterpolacinlineal.
Nota:
Lospercentiles25,50y75recibenelnombredeprimercuartil,segundocuartilytercercuartil.
Ademselsegundocuartilqueeselpercentil50coincideconlamediana.
Si los datos estn ordenados en intervalos tomamos el intervalo correspondiente al porcentaje del
percentilcomovalordelpercentilcorrespondiente.

1.10.Parmetrosestadsticosdedispersin
Lasmedidasdeposicinestudiadasenelapartadoanterior,nosdanunainformacinincompleta,por
parcial,acercadelosdatos.
Veamosunejemplo:
SupongamoslasnotasdematemticasdelosestudiantespertenecientesadosclasesdistintasclaseAy
claseB,con10estudiantescadauna.
ClaseA4,3,5,6,4,5,5,7,5,6
ClaseB1,4,3,5,6,8,2,7,5,9

ClaseA

ClaseB

2,5

1,5

0,5
0

0
3

En los dos casos la media, como podemos calcular es 5, pero sus diagramas de frecuencias son muy
distintos.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

407

Estadstica

Los diagramas de frecuencias anteriores nos muestran que los valores se distribuyen simtricamente
respectoalanota5,peroenlaclaseAexisteunamenordispersinqueenlaclaseB.Cmomedirla
distinta manera en que los valores se agrupan alrededor de la media? Las distintas medidas de
dispersinproporcionanestainformacin.Aligualqueocurreparalaposicin,existendiversasformas
para medir la dispersin, de entre ellas estudiaremos: rango, desviacin tpica, varianza y rango
intercuartlico.

Rango
Esladiferenciaentreeldatomayoryeldatomenor.
Asporejemplo
ElrangodelasnotasdelaclaseAvale73=4yelrangoenlaclaseBvale91=8,denotando
mayordispersindelavariableenlaclaseB.

Lavarianzayladesviacintpica
Puesto que se trata de medir cmo se agrupan los datos alrededor de la media, podramos utilizar
comocriteriolasdesviacionesdedichosdatosrespectosaquella,esdecir,lasdiferenciasentrelamedia
y los datos y ms concretamente la media de esas diferencias. Aunque a primera vista la sugerencia
puedaserbuena,vamosaaplicarlaalosvaloresdelasnotasdeclaseparaevidenciarelinconveniente
insalvablequeunamedidadeestetipotiene.
Enloscuadrosaparecenlasnotasdecadaclaseyencolumnassucesivassusdesviacionesrespectoala
mediayelcuadradodeestasdesviaciones,alquealudiremosmstarde.
Altratardeobtenerlamediadelasdiferencias,querecordemoseslasumadetodasellasdivididaspor
su nmero, nos encontramos que dicha media es 0 en ambos casos, porque existiendo desviaciones
positivasynegativas,unasanulanlosefectosdelasotras.
Enrealidadesonosocurrirconcualquierotroconjuntodedatos,porquepuededemostrarsequeesa
esunapropiedadquetienenlasdesviacionesrespectodelamedia.
ClaseA
Nota

xi x

di

ClaseB
Nota

xi x

di2

16

5
6
Suma

0
1
0

0
1
12

5
9
Suma

0
4
0

0
16
60

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

408

Estadstica

Enlastablasaparecenlasdesviacionesrespectodelamediaysuscuadradosparalasnotasdelasdos
clases.
Puesto que el uso de las desviaciones respecto de la media parece razonable, cmo resolver el
problemaquelassumasden0?Unasencillamaneradehacerloesutilizar,nolasdesviaciones,sinosus
cuadrados. Al ser stos cantidades positivas, su suma nunca podr ser cero. De acuerdo con esto la
varianzasedefineporlafrmula.

xi x ni
n

Varianza = s 2

suma del cuadrado de las desviaciones

i 1

xi ni
n

i 1

x2

Ladesviacintpicasedefinecomolarazcuadradadelavarianzayladesignaremospors.
s= Varianza

Ejemplo:
Paraelejemplodelasnotasdelasclases.
ClaseA

s2

12
1'33
9

s 1'33 1'15

ClaseB

s2

60
6'66
9

s 6'66 2'58

Queponendemanifiestoladiferentedistribucindelosvaloresenuncasoyenelotro.

Propiedaddeladesviacintpica
1. Aproximadamenteel68%delosdatosdistancomomuchounadesviacintpicadelamedia.
2. Aproximadamenteel95%delosdatosdistancomomuchodosdesviacionestpicasdelamedia.
3. Aproximadamentemsdel99%delosdatosdistancomomuchotresdesviacionestpicasdela
media.

Rangointercuartlico.
Sedefinecomoladiferenciaentreelterceryelprimercuartil.Elintervalointercuartlicoeselintervalo
definidoporloscuartilesprimeroytercero,cuyalongitudes,elrangointercuartlico.Esteintervaloas
definidocontieneel50%delosdatos.

Coeficientevariacin
Siqueremoscomparardossecuenciasdedatos,ydecirencualhaymayordispersin,sobretodoenel
caso en que sean datos expresados en diferentes unidades, con los parmetros definidos, desviacin
tpica,intervalointercuartlico,lotenemoscomplicado,poresosehacenecesariodefinirelcoeficiente
devariacincomo,
CV
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

s
100
x

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

409

Estadstica

Ejemplo:

En el ejemplo de las calificaciones de dos clases nos permite comparar las dos secuencias de
datos.
ClaseA
ClaseB

CV=(115/5)100=23%.
CV =(258/5)100=516%.

LlegandoalamismaconclusinquepercibamosenloshistogramasyaquelaclaseBtieneunamayor
dispersindelasnotas.

Actividadespropuestas
3. Clasificalassiguientesvariablescomocualitativasocuantitativas,yestasltimascomocontinuaso
discretas.
a)
b)
c)
d)
e)
f)
g)
h)

Intencindevotodeunpartido
Nmerodecorreoselectrnicosquerecibesenunmes.
Nmerodecalzados.
Nmerodekilmetrosrecorridosenfindesemana.
Marcasdecerveza
Nmerodeempleadosdeunaempresa
Altura
Temperaturadeunenfermo.

4. Muchas personas que invierten en bolsa lo hacen para conseguir beneficios rpidos, por ello el
tiempo que mantienen las acciones es relativamente breve. Preguntada una muestra de 40
inversores habituales sobre el tiempo en meses que han mantenido sus ltimas inversiones se
recogieronlossiguientesdatos:
105112991501141271651011271141166279831098138105117
8412511291104911341235911488748613614711511510998
12999
Construyeunatabladefrecuenciasquerecojaestainformacinyhazalgunarepresentacingrfica.
5. Investigadoslospreciosporhabitacinde50hotelesdeunaprovinciasehanobtenidolossiguientes
resultados.
703050405070407580505075307010015050751208040503050100
3040507050304070407050407010075708075707580707012080.
Determinar:
a) Distribucin de frecuencia de los precios, sin agrupar y agrupando en 5 intervalos de la misma
amplitud.
b) Porcentajedehotelesconpreciosuperiora75.
c) Cuntoshotelestienenunpreciomayoroigualque50peromenoroiguala100?
d) Representagrficamentelasdistribucionesdelapartadoa).
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

410

Estadstica

6. Elgobiernodeseasabersielnmeromediodehijosporfamiliahadescendidorespectoaladcada
anterior.Paraellosehaencuestadoa50familiasrespectoalnmerodehijosysehaobtenidolos
datossiguientes.
24231242302223262322323343345203212322314
232433221.
a) Construyelatabladefrecuenciasconestosdatos.
b) Cuntasfamiliastienenexactamente3hijos?
c) Quporcentajedefamiliastienenexactamente3hijos?
d) Quporcentajedefamiliasdelamuestratienemsdedoshijos?Ymenosdetres?
e) Construyeelgrficoqueconsideresmsadecuadoconlasfrecuenciasnoacumuladas.
f) Construyeelgrficoqueconsideresmsadecuadoconlasfrecuenciasacumuladas.

7. Enunhospitalsedeseahacerunestudiosobrelospesosdelosrecinnacidos.Paraelloserecogen
losdatosdelos40bebesysetiene:
3237424637302931304541383936323530252728304045
3535362932424341464245433237293135
a)Construyelatabladefrecuencias.
b) Si sabemos que los bebes que pesan menos de 3 kilos lo hacen prematuramente Qu
porcentajedeniosprematuroshannacidoentreestos40?
c)Normalmentelosniosquenacenprematurosquepesanmsde3kilosymediononecesitan
estarenincubadora.Puedesdecirqueporcentajedeniosestnenestasituacin?
d)Representagrficamentelainformacinrecibida.

8. EnunafincadevecinosdeBenicasim,serenenlacomunidaddevecinosparaversicontratanauna
personaparaquelesllevelacontabilidad.Elresultadodelavotacineselsiguiente:25vecinosa
favordelacontratacin,15vecinosencontray5vecinosseabstienen.Representalainformacin
medianteundiagramadesectores

9. Se toman ocho mediciones del dimetro interno de los anillos para los pistones del motor de un
automvil.Losdatosenmmson:
7400174003740157400074005740027400574004
Calculalamediaylamedianadeestosdatos. Calculatambinlavarianza,ladesviacintpicayel
rangodelamuestra.

10. Dadaladistribucindedatos38432384343384363843838440confrecuencias4,8,4,3,8,
hallalamediadeladistribucin.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

411

Estadstica

11. Ladistribucindelossalariosenlaindustriatursticaespaolaeslaquefiguraenlatabla.Calcula:
a) Elsalariomedioportrabajador(marcasdeclasedelltimointervalo20000
b) Elsalariomsfrecuente.
c) Elsalariotalquelamitaddelosrestantesseainferioral.
[li, Li[

ni

[0,1500[

2145

[1500,2000[

1520

[2000,2500[

840

[2500,3000[

955

[3000,3500[

1110

[3500,4000[

2342

[4000,5000[

610

[5000,10000[

328

10000

150

12. Calculalamediana,lamoda,primerytercercuartilynonagsimopercentildeladistribucin:
xi

ni

10

15

20

25

13. Sehandiseadodosunidadesgemelasdeplantaspilotosyhansidopuestasenfuncionamientoen
undeterminadoproceso.Losresultadosdelosdiezprimerosbalancesencadaunadelasunidades
hansidolossiguientes:
UnidadA97898910129881020990991100810091005
UnidadB9721005982983975999979968974972
a) Hazunarepresentacingrficadeestasmuestras.
b) Determinalasmediasylasvarianzas.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

412

Estadstica

14. En cierto barrio se ha encontrado que las familias residentes se han distribuido, segn su
composicindelaformasiguiente:
Composicin

Ndefamilias

02

110

24

200

46

90

68

75

810

25

a) Culeselnmeromediodepersonasporfamilia?
b) Culeseltamaodelafamiliamsfrecuente?
c) Sisolohubieraplazasdeaparcamientoparael75%delasfamiliasyestasseatendieran
porfamiliasdemayortamaoamenor,qucomponentestendraquetenerunafamilia
paraentrarenelcupo?
d) Nmerodemiembrosquetienencomomximoel85%delasfamilias.
15. Allanzar200vecesundadoseobtuvolasiguientedistribucindefrecuencias.
xi

ni

32

35

33

35

Hallalamedianaylamodadeladistribucin,sabiendoquelamediaaritmticaes36.
16. Lossiguientesdatossonmedidasdelacapacidadcranealdeungrupodehomnidos:
84,49,61,40,83,67,45,66,70,69,80,58,68,60,67,72,73,70,57,63,70,78,52,67,53,67,
75,61,70,81,76,79,75,76,58,31.
a) Calculalamediaylamedianamuestrales.
b) Hallaloscuartilesprimeroytercero.
c) Hallalospercentilescincuentaynoventa.
d) Calculaelrangomuestral.
e) Calculalavarianzamuestralyladesviacinestndarmuestral.
17. Lossiguientesdatosprocedendeunestudiodecontaminacindelaire.
6521444753264730498650494034564727242722525347
684153762421464330416142
a)Construyeunhistograma.
b)Determinaloscuartiles.
c)Calculalamediayladesviacintpica.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

413

Estadstica

2.ESTADSTICABIDIMENSIONAL
2.1.Introduccin
Ejemplo1:
Con el fin de hacer un estudio de aceptacin sobre dos modelos de impresoras 3D de reciente
fabricacin,seconsideraronelnmerodeventasefectuadoporundeterminadodistribuidordurante
25das.
ModeloA:

0222133334423333232422333

ModeloB:

2122311120111112211122221

En muchos procesos de la vida se hace necesario estudiar simultneamente dos caractersticas, dos
variables.Suestudioconjuntopermitedeterminarlasrelacionesentreellas.Supondremosinicialmente
que estamos observando dos variables aunque el tratamiento que se presenta se generaliza sin
dificultadacualquiernmerodevariables.
Notacin.
Continuandoconelejemplovamosallamar:
XnmerodeimpresorasdelmodeloAvendidasenunda.
YnmerodeimpresorasdelmodeloBvendidasenunda.
nnumerodeparesdeobservaciones.
xiCadadatodiferenteobservadoenlamuestradeX.
KnmerodevaloresdistintosdeX.
yjCadadatodiferenteobservadoenlamuestradeY.
hnmerodevaloresdistintosdeY.

2.2.Distribucindefrecuenciasconjuntas
Cuando queremos describir conjuntamente dos variables, el primer paso al igual que en el caso
univariante,serlarepresentacindelosdatosenunatabladefrecuencias.

Frecuenciaabsolutaconjunta(ni j)
NmerodevecesquesepresentaenlamuestraelvalorxidelavariableXconelvaloryjdelavariable
Y.
Ejemplo1:
Paraelpardevalores x1 =0,y3=2,n13 = 1
Propiedad:
Lasumadelasfrecuenciasabsolutasesigualan.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

414

Estadstica

Frecuenciarelativaconjunta
f ij

nij
n

Ejemplo1:
f13

1
0'04
25

Propiedad
Lasumadelasfrecuenciasrelativasesigualalaunidad.

Tabladefrecuenciasconjunta
Llamamosasaunatabladedobleentradadondeserepresentanenlaprimeracolumnalosdiferentes
valoresobservadosparalavariableXordenadosdemenoramayoryenlaprimerafilalosdiferentes
valores observados para la variable Y, y en el centro de la tabla sus correspondientes frecuencias
conjuntas,tantoabsolutascomorelativas.

Ejemplo1:
xi/yj

ni

f i

0/0

0/0

1/004

0/0

004

0/0

0/0

0/0

1/004

004

0/0

3/012

5/020

0/0

032

0/0

8/032

4/016

0/0

12

048

1/004

2/008

0/0

0/0

012

ni

13

10

25

f i

004

052

004

004

QuporcentajededasvenderemosunaimpresoradelmodeloAy3delmodeloB?
4%
QuporcentajededasvenderemosmsimpresorasdelmodeloBquedelmodeloA?
8%;004+004

NOTA:
En el caso en que las variables sean cualitativas la tabla de distribucin conjunta tambin recibe el
nombredetabladecontingencia.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

415

Estadstica

Ejemplosdetablasdecontingencia.

1.Sequiereestudiarelefectodetresfrmacoseneltratamientodeunaenfermedadinfecciosa.Para
ello se dispone de un grupo de pacientes infectados, distribuyndose al azar en tres grupos de
tratamiento.

TratamientoA

TratamientoB

TratamientoC

Total

Simejora

23

33

35

91

Nomejora

12

12

31

Total

35

40

47

122

2. En un estudio se ha aplicado durante un ao una terapia basada en la ejercitacin mental para


frenar el deterioro cognitivo observado en 3 enfermedades degenerativas, en la tercera edad. Para
evaluarelgradoenquelaterapiaesefectiva,sehanregistradolosresultadosobservadosalcabodeun
aodetratamientoencadatipodeenfermedad,teniendoencuentaquelaevolucinnaturalalcabo
deunao,deestasenfermedades,eselempeoramiento.

Empeora

Estable

Mejora

Total

Parkinsonsenil

34

25

17

76

Alzheimer

47

18

71

Demenciavascular

50

23

75

131

66

25

222

Total

2.3.Distribucindefrecuenciasmarginales
Para distinguir las frecuencias de cada variable al estudiarlas aisladamente llamaremos frecuencias
marginales a las de cada variable por separado. De esta forma tendramos dos distribuciones
unidimensionalesapartirdelasconjuntas.
Frecuenciaabsolutamarginal
ParalaX (xi)seraelnmerodevecesqueserepiteelvalorxisintenerencuentalosvaloresdeY,la
representamosporni.
ParalaY(yj)seraelnmerodevecesqueserepiteelvaloryjsintenerencuentalosvaloresdelaX,la
representamospornj.
Nota:
1.Con las definiciones de media, desviacin tpica y varianza del apartado de distribuciones
unidimensionales,utilizandoparalaXlosvaloresxiyelnmerodevecesqueserepiteniyNelnmero
totaldeparesobservados,yparalaYlosvaloresyjyelnmerodevecesqueserepitenjyNelnmero
total de pares observados, calcularemos las medias marginales, desviaciones tpicas marginales y
varianzasmarginales.
2. Sinosfijamosbienpodemosrelacionarelnombredefrecuenciasmarginalesconelhechodeque
tantolosvaloresdelasvariables,xieyjcomolasvecesqueaparececadaunodeestosdatos,niynjlos
encontramosenlosmrgenesdelatabladedistribucinconjunta.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

416

Estadstica

Frecuenciasrelativasmarginales

Apartirdelasanteriores,ydelmismomodo,seconstruirnestasfrecuenciasfiyfj.
La distribucin de frecuencias marginales puede colocarse en una tabla separadamente. Pero si
deseamostenertodalainformacinenunamismatablaloquesesuelehacerescolocar:
En la ltima columna de la tabla conjunta, las frecuencias marginales de X es decir, ni,
aadiendotantascolumnascomootrostiposdefrecuenciasmarginalessedeseeaadir.
En la ltima fila de la tabla conjunta, las frecuencias marginales de Y, es decir, nj aadiendo
tantasfilascomootrostiposdefrecuenciasmarginalessedeseeaadir.

2.4.Distribucindefrecuenciascondicionadas
A partir de la distribucin de frecuencias conjuntas podemos definir otro tipo de distribuciones
unidimensionales,tantoparaXcomoparaY.Estasdistribucionesseobtendrnalfijarelvalordelaotra
variableyrecibenelnombrededistribucionescondicionadas.
Frecuencia absoluta condicionadaparaX(xi)dadoqueY(yj)eselnmerodevecesqueserepiteel
valor xiteniendoencuentasoloaquellosvaloresenqueY(yj);asesni(j) = nijparatodoi =1,2,,k.
Frecuencia absoluta condicionada para Y (yj) dado que X (xi) es el nmero de veces que se repite el
valoryjteniendoencuentasoloaquellosvaloresenqueX (xi);asesn(i)j = nijparatodoj=1,2,,h.
Enlasdistribucionescondicionadasnosesuelenutilizarlasdistribucionesabsolutas,puestoquecomo
sabemos, estas dependen del nmero de datos y el nmero de datos ser diferente para cada
distribucin,puesdependerdelafrecuenciadelvalorquefijamosdelaotravariable.Sonmuchoms
tileslasfrecuenciascondicionadasquesedefinen:
FrecuenciarelativacondicionadaparaXdadoqueY =yj es
fi ( j )

nij
nj

FrecuenciarelativacondicionadaparaYdadoqueX =xies
f (i ) j

nij
ni

Ejemplo:
DistribucindefrecuenciasdeXcondicionadaaY =1
xi
ni(2)

fi(2)

023

061

015

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

417

Estadstica

Nota:

Si la tabla resulta muy grande deberemos agrupar una o las dos variables en intervalos de clase del
mismo modo que lo hacamos en el apartado de una variable. En este caso todas las definiciones se
aplicantalcomolashemosvistoendichoapartado.

2.5.Independenciaestadstica
Definicin1:
Dos variables X e Y se dice que son independientes estadsticamente cuando la frecuencia relativa
conjuntaesigualalproductodelasfrecuenciasrelativasmarginales,esdecir,paratodoi,j:
f ij

nij
n

fi f j

ni n j

n n

Definicin2:
Dos variables X e Y se dicen que son independientes estadsticamente cuando todas las frecuencias
relativascondicionadassonigualesasuscorrespondientesfrecuenciasmarginales,esdecir:
fi(j)=fiparatodojyf(i)j = fjparatodoi.

2.6.Diagramadedispersin.Nubedepuntos
Se obtiene representando cada par observado (xi, yj), como un punto del plano cartesiano. Se utiliza
conlosdatossinagruparysobretodoparavariablescontinuas.Silosdatosestnagrupadossetoman
lasmarcasdeclase.Esmstilporquenospermitevervisualmentelarelacinentrelasdosvariables.
norelacin

relacinlinealdirecta

relacinlinealinversa

3,5

3,5

2,5

2,5

2,5
2

1,5

1,5

1,5

1
1

0,5

0,5

0,5

0
0

0
0

0
0

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

418

Estadstica

3.COVARIANZA
3.1.Ideacorrelacin.Covarianza
Alanalizardosvariablescuantitativasdeformaconjunta,elobjetivoquesepretendees,porlogeneral,
determinar si existe o no algn tipo de variacin conjunta o covarianza entre ellas: si una variable
aumenta,laotratambinolocontrario.
LacantidadsedenominacovarianzaSxyytienelasiguienteexpresin:
S xy

i j ( xi x ) ( yi y ) nij i j xi yi nij

xy
n
n

Ayudaaanalizarlacovarianzaentredosvariablesdelaformasiguiente:
Cuandoelresultadoespositivo,hayunatendenciaaqueamayoresobservacionesdeX
correspondanmayoresobservacionesdeY.
Porejemplo
Amayorcantidaddeaguadelluviaenunao,suelecorresponderunamejorcosecha.
Cuando el resultado es negativo, la tendencia resulta contraria; es decir a mayores
valoresdelavariableXsolemosencontrarmenoresvaloresdelavariableY.
Porejemplo,
Amayorrentapercpitaenlospasessueleencontrarseunamenormortalidadinfantil.

3.2.Coeficientecorrelacinlineal
El valor de la covarianza depender de los valores de las variables, por tanto de sus unidades. Para
podereliminarlasunidadesytenerunamedidaadimensionalutilizamoselcoeficientedecorrelacin
rxy:
rxy

S xy
sx s y

Siendotambininvariantefrenteatrasformacioneslineales(cambiodeorigenyescala)delasvariables.
Citamoslassiguientespropiedades:
Esuncoeficienteadimensional.
Tomavaloresentre1y1.
Sihayrelacinlinealpositivaelvalorserpositivoyprximoa1.
Sihayrelacinlinealnegativaelvalorsernegativoyprximoa1.
Sinohayrelacinelvalorseaproximaacero.
SiXeYsonindependienteelvalordelcoeficienteescero.Peronoalcontrario.Puedeocurrir
queelcoeficientedecorrelacinvalgaceroylasvariablesseandependientes.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

419

Estadstica

3.3.Rectaregresinlineal
EldiagramadedispersinonubedepuntosnospermitavisualizarlarelacinentredosvariablesXeY.
Alrepresentareldiagramadedispersinpodemosencontrarlassiguientessituaciones:
Distribuciones estadsticas para las que la nube de puntos se dispone de tal forma que existe
unafuncinmatemticacuyospuntossonunapartedesurepresentacingrfica.
Sincoincidirsuspuntosconlosdeunagrficadeunafuncinmatemtica,seaproximanaella
conmayoromenorintensidad.
Lanubedepuntospresentaunaspectotalquenoexisteconcentracindepuntoshacianinguna
graficamatemtica,distribuyndosedeunaformauniformeenunaregindelplano.
EnelprimercasosedicequeexisteunadependenciafuncionaloexactaentrelasvariablesXeY,es
decir existe una funcin matemtica tal que y = f(x). En el segundo caso se dice que existe una
dependencia estadstica o aproximada entre las dos variables, Y aproxima f(x). Y en el ltimo caso
decimosquelasvariablessonindependientes.
Eselsegundocasodelqueseocupalateoraderegresin.
Lastcnicasderegresintienenporobjetomodelar,esdecir,encontrarunafuncinqueaproximelo
mximoposiblelarelacindedependenciaestadsticaentrevariablesypredecirlosvaloresdeunade
ellas: Y (variable dependiente o explicada) a partir de los valores de la otra (u otras): X (variable
independienteoexplicativa).
LlamamosregresinYsobreXalafuncinqueexplicalavariableY(dependiente)paracadavalordela
X(independiente).
LlamamosregresindeXsobreYalafuncinqueexplicalavariableX(dependiente)paracadavalorde
laY(independiente).
Larectaderegresinqueestudiamosesunafuncinlinealporqueelmodelodefuncinderegresin
seleccionadoesunarecta.
RectaderegresinYsobreXesy = a + bxdonde a y bx yb =

S xy
sx 2

RectaderegresindeXsobreYesx = a + bydonde a ' x b' y yb=

S xy
sy

Losvaloresdebybsonloscorrespondientescoeficientesderegresinparacadaunadelasrectas.
Hayquetenerencuentaquelarectaderegresindexsobreynoseobtienedespejandoxdelarecta
deregresindeysobrex.

3.4.Prediccinycausalidad
Elobjetivoltimodelarectaderegresineslaprediccindeunavariableparaunvalordeterminado
delaotra.LaprediccindeYparaX = x0,sersimplementeelvalorobtenidoenlarectaderegresin
deYsobreXalsustituirelvalordexporx0.
Esclaroquelafiabilidaddeestaprediccinsertantomayorcuantomayorsealacorrelacinentrelas
variables,esdecirmayorseaelvalorderxy.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

420

Estadstica

Actividadespropuestas
18. Losdatossiguientessonlascalificacionesobtenidasporlosestudiantesdeungrupode25de1de
bachilleratoenlasasignaturasdeMatemticasyLengua.

Matemticas

Lengua

Matemticas

10

Lengua

10

10

10

a) Escribelatabladefrecuenciasconjunta.
b) Proporcindeestudiantesqueobtienemsdeuncincoenambasasignaturas,proporcinde
estudiantesqueobtienemsdeuncincoenMatemticas,proporcinestudiantesqueobtiene
msdeuncincoenLengua.
c) SonindependienteslascalificacionesdeMatemticasyLengua?
d) Representagrficamente.
e) Calculaelcoeficientecorrelacin.
19. Pararealizarunestudiosobrelautilizacindeunaimpresoraenundeterminadodepartamento,se
midienundalosminutostranscurridosentrelassucesivasutilizacionesXyelnmerodepginas
impresasY,obtenindoselossiguientesresultados.
X

10

15

10

12

12

10

10

12

10

10

12

12

12

12

20

20

20

12

20

20

a) Escribeladistribucindefrecuenciasconjunta.Porcentajedevecesquetranscurrenmsde
nueveminutosdesdelaanteriorutilizacinyseimprimenmenosdedocepginas.Nmero
de veces que se imprimen menos de doce pginas y transcurren nueve minutos desde la
utilizacinanterior.
b) Frecuencias marginales. Veces que se imprimen como mucho doce pginas. Nmero de
pginasqueseimprimenenel80%delasocasiones.
c) Calculaladistribucindelnmerodepginasimpresascondicionadaaquehantranscurrido
nueveminutosentresucesivasutilizaciones.
d) Dibujaeldiagramadedispersin.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

421

Estadstica

20. Lasestaturasdelos30niosnacidosenunamaternidadduranteunasemanafueronlossiguientes:
Estatura 50

51

53

50

51

48

50

49

52

52

49

50

52

51

52

Peso

32

41

45

30

36

29

38

38

36

39

30

38

41

35

40

49

50

51

52

53

52

52

51

50

51

54

50

51

51

51

31

33

39

37

41

42

35

38

36

34

46

35

36

31

40

a) Construyeunatabladedobleentrada,agrupandolospesosenintervalosde05kg.
b) Eslaestaturaindependientedelpeso?
21. Enelexamendeunaasignaturaqueconstadepartetericayparteprctica,lascalificacionesde
nuevealumnosfueron:

Teora

Prctica

Calcula la covarianza y el coeficiente de correlacin lineal. Dibuja la nube de puntos.


Comentalosresultados.

22. Se desea investigar el ganado caprino y el ganado ovino de un pas. En la tabla de doble entrada
adjunta se presentan los resultados de un estudio de 100 explotaciones ganaderas, seleccionadas
aleatoriamente del censo agropecuario. Se proporcionan las frecuencias conjuntas del nmero de
cabezas(enmiles)decabrasXyovejasYqueposeenlasexplotaciones.
X / Y

10

a) Hallalasmedias,varianzasydesviacionestpicasmarginales.
b) Hallaelnmeromediodeovejascondicionadoaqueenlaexplotacinhay2000cabras.
c) Hallaelnmeromediodecabrasquetienenaquellasexplotacionesquesabemosqueno
tienenovejas.
d) Hallalacovarianzayelcoeficientedecorrelacinentreambasvariables.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

422

Estadstica

23. Elvolumendeahorroylarentadelsectorfamiliasenmilloneseneurosconstantesde2005parael
periodo20052014fueron.

Aos

05

06

07

08

09

10

11

12

13

14

Ahorro

19

18

20

21

19

20

22

23

27

30

Renta

205

208

212

217

221

223

222

226

231

235

a) Rectaregresindelahorrosobrelarenta.
b) Rectaderegresindelarentasobreelahorro.
c) Paraelao2015sesuponequelarentaerade24.1millonesdeeuros.culserel
ahorroesperadoparaelao2015?
d) Estudiarlafiabilidaddelaprediccinanterior.
24. Semidieltiempoensegundosquetardaronengrabarselosmismos24ficherosenunlpizUSBX
yenundiscoduroexteriorY.
X

12

11

05

11

15

14

14

13

04

03

13

11

12

04

12

14

11

16

16

15

04

03

03

15

14

11

12

12

04

05

13

15

12

02

03

16

13

11

13

11

04

04

14

16

09

03

a) Construyelatabladefrecuenciasconjunta.Culeselporcentajedeficherosquetardan
menosde15segundosenelprimertipoymsde14enelsegundo?Cuntosficheros
tardan en grabarse entre 06 y 12 segundos en el primer tipo de memoria? Cunto
tiempotardancomomuchoengravarsealmenosel90%delosficherosenelsegundo
tipodememoria?
b) Hallalatabladefrecuenciascondicionadasdelostiemposdelsegundotipodememoria
de aquellos programas que tardaron 12 en el primer tipo de memoria. Cul es la
proporcin de estos programas que tardan en grabarse ms de 15 segundos en el
segundotipodememoria?
c) Representagrficamentelosdatosycomentaelresultadoobtenido.
d) Si un fichero tarda 08 segundos en grabarse en el primer tipo de memoria, cuantos
segundos tardara en grabarse en el segundo tipo? Dar una medida de fiabilidad.
Confirmaestamedidalocomentadoenelapartadoc)?

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

423

Estadstica

25. Deunmuellesecuelganpesosyobtenemoslosalargamientossiguientes.

PesogrX

10

30

60

90

120

150

200

250

350

AlargamientocmY

05

65

102

125

18

EncuentralarectaderegresindeYsobreXyestimaelalargamientoqueseconseguirconpesosde
100y500gr.Culdelasdosestimacionesesmsfiable?
26. La tabla siguiente muestra el nmero de grmenes patgenos por centmetro cubico de un
determinadocultivosegneltiempotranscurrido.
Nmerodehoras

Nmerodegrmenes

20

26

33

41

47

53

a) Calcula la recta de regresin para predecir el nmero de grmenes por centmetro


cubicoenfuncindeltiempo.
b) Qu cantidad de grmenes por centmetro cubico es previsible encontrar cuando
transcurran6horas?Esbuenaestaprediccin?
27. Enundepsitocilndrico,laalturadelaguaquecontienevaraamedidaquepasaeltiemposegn
losdatosrecogidosenlatabla:
Tiempo:h

22

27

33

50

Altura:m

17

14

12

11

a) Encuentraelcoeficientecorrelacinentreeltiempoylaaltura.Daunainterpretacindel.
b) Qualturasealcanzaracuandohayantranscurrido40horas?
c) Cuandolaalturaalcanza2msuenaunaalarma.Cuntotiempotienequepasarparaquesuene
laalarma?
28. LaevolucindelIPC(ndicedepreciosalconsumo)ylatasadeinflacinenlosmesesindicadosde
undeterminadoao,vaser:

Enero

Febrero

Marzo

Abril

Mayo

Junio

IPC

07

11

17

19

19

Tasainflacin

63

62

58

49

a) Representalanubedepuntos.
b) CalculaelcoeficientedecorrelacinentreelIPCylatasadeinflacin.
c) SepuedeestimarlatasadeinflacinapartirdelIPC?

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

424

Estadstica

CURIOSIDADES.REVISTA

ELEFECTOPLACEBOYELEFECTONOCEBO
Antesdequeunmedicamentopuedacomercializarsedebesuperaruna
serie de estrictas pruebas que arrojen seguridad acerca de su eficacia
curativa.
Unadelaspruebasmscomunesconsisteenseleccionarunamuestra
deenfermosydividirlosaleatoriamenteendosgrupos;ungruporecibe
elmedicamento,yelotro,sinsaberlo,unasustanciaenaparienciaigual,
perosinningnpoderteraputico:unplacebo.
De esta forma, al final del ensayo pueden compararse los resultados
entrelosdosgruposydeterminarlaeficaciadelmedicamento.Paraello
seempleanherramientasestadsticascomolacorrelacin.
Sorprendentemente, hay un nmero significativo de pacientes que,
habiendo recibido el placebo, mejoran de forma ostensible. Por
ejemplo, esta contrastado que, en muchas enfermedadesrelacionadas
con el dolor, entre el 10 % y el 15 % de los pacientes experimenta un
alivio notable habiendo seguido un tratamiento exclusivamente de
placebo.

RELACIONFUNCIONAL CORRELACIN
Silanzamosunapiedrahaciaarriballegarmsaltocuandomsfuertesea
lanzada.Existeunafrmulaquenospermitecalcular,exactamentelaaltura
conseguidaenfuncindelavelocidadconqueeslanzada.Estamosanteuna
relacinfuncional.
Laspersonas,engeneral,pesanmscuandomsaltosson.Peronosepuede
darunafrmulaquenospermitadarelpesodeunapersonaconexactitud
conociendosualtura,slopodremosconseguirunafrmulaquenosdun
valoraproximadoyconocerlaeficaciadeesafrmula.Larelacinentrelas
variables pesoestatura es una relacin estadstica. Diremos que hay una
correlacinentreestasvariables.

Tambinvamosaencontrarcorrelacinentreladistanciaaqueunjugador
debaloncestosecolocadelacestayelnmerodecestasqueconsigue.Pero
enestecaso,alcontrariodelanterior,hayunacorrelacinnegativa,yaquea
msdistancia,menornmerodecestas.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

425

Estadstica

CONTRALASUPERSTICIN,ESTADSTICA

Vivimosenunmundodominadoporlacienciaylatecnologa,a

pesardeellolassupersticionesylascreenciasseudocientficas
siguendominandoentrelapoblacingeneral,inclusomsque
en otras pocas. La Estadstica es un arma importante para
desenmascarar algunas afirmaciones que circulan
impunementeyquemuchagentecree,comolasderivadasde
la astrologa. Existen cientos de estudios que prueban que
aunque existan coincidencias entre el signo astrolgico de las
personas y sus formas de ser, gustos, comportamientos,
profesiones, etc. stas estn siempre en torno a la media
estadstica.
Unacreenciamuyhabitualesquelosnacimientosseproducen
con mayor frecuencia durante los das, y especialmente las
noches, de luna llena. Resultara sencillo coger los registros
civiles y comprobar si eso es verdad, pero los que afirman
semejantedatonuncasemolestanenhacerlo.Recientemente
sehapuestodemanifiestomedianteelanlisisdelosdatosde
un conjunto de estudios al respecto que las variaciones de
nacimientos entre fases lunares son de apenas un 1 %, sin
embargo tambin el mismo estudio ha puesto de manifiesto
que el 60 % de los nacimientos se producen entre las 6 de la
maana y las seis de la tarde, mostrando as una diferencia
mucho ms significativa que suele tener su explicacin en la
organizacindeloshospitales.

Estadstica
El nombre de Estadstica proviene del s. XIX, sin embargo ya se
utilizaban representaciones grficas y otras medidas en pieles,
rocas, palos de madera y paredes de cuevas para controlar el
nmero de personas, animales o ciertas mercancas desde la
Prehistoria. Los babilonios usaban ya envases de arcilla para
recopilar datos sobre la produccin agrcola. Los egipcios
analizabanlosdatosdelapoblacinylarentadelpasmuchoantes
de construir las pirmides. Los antiguos griegos realizaban censos
cuyainformacinseutilizabahacia600aC.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

426

Estadstica

RESUMEN

Histograma

Ejemplos

Representacingrficadelosdatosagrupadosenintervalos.

Media
aritmtica
Mediana
Moda

k
i xi ni
xi f i
n
i 1

0 21 42 21315465161 126
2'52
50
50

Valortalqueenladistribucinhaytantosdatosmenores
quelcomomayoresquel.
Datoconmayorfrecuencia,elquemsvecesserepite.

Varianza

xi x
n

s 2 i 1

Desviacintpica
Covarianza
Coeficiente
correlacin
Dependencia
lineal

2
xi fi
n

i 1

x2

s= Varianza

S xy

i j ( xi x ) ( yi y ) nij i j xi yi nij

xy
n
n
rxy

S xy
sx s y

1r1

r =1dependenciafuncionallinealnegativa

1<r<0dependencianegativa
r=0noexistedependencialineal,nifuncional
0< r<1dependenciapositiva
r=1dependenciafuncionallinealpositiva

Rectaregresin
YsobreX

y y

S xy
sx

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

(x x)

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

427

Estadstica

EJERCICIOSYPROBLEMAS
Estadsticadescriptivaunidimensional
1. Seconoceelvolumensemanalderesiduosslidosrecogidosenm3durante10semanas,en
unmunicipiopequeo:
25'5,27'1,31'8,34'2,38'9,21'3,28'7,33'2,36'5,39'6
Calcula:
a) Lasmedidasdecentralizacin:lamedia,mediana,moda
b) Las medidas de dispersin: desviacin tpica, varianza, coeficiente de variacin, valor mnimo,
valormximo,recorrido,primercuartil,tercercuartileintervalointercuartlico.
c) Haz una representacin grfica en serie temporal, que permita observar tendencias, ciclos y
fluctuaciones. Recuerda que en una serie temporal, en el eje de abscisas est el tiempo de
observacinyenelejedeordenadaslamagnituddeobservacin.
2. Unacompaadesegurosdeseaestablecerunaplizadeaccidentes.Paraello,seleccionaal
azar a 100 propietarios y les pregunta cuntos euros han gastado en reparaciones del
automvil.Sehanagrupadoenintervaloslosvaloresdelavariableobtenidos:
Euros
Nmerodepersonas

[0,100) [100,200) [200,400) [400,600) [600,800)


20

20

10

20

20

[800,3000)

10

a) Calcula las marcas de clase y escribe en tu cuaderno una tabla de frecuencias absolutas,
frecuenciasrelativas,frecuenciasacumuladasabsolutasyfrecuenciasrelativasacumuladas.
b) Representalosdatosenundiagramadebarras,otrodelneasyunodesectores.
c) Representaunhistogramadefrecuenciasrelativas.Cuidado:Losintervalosnosontodosiguales.
d) Calculalamediayladesviacintpica.
e) Calculalamedianayloscuartiles.
3. Sehapreguntadoa40alumnosporelnmerodehermanosquetena,ysehaobtenido
Nmerodehermanos

6oms

Nmerodeveces

15

a) Representa un diagrama de barras de frecuencias absolutas y un diagrama de lneas de


frecuenciasrelativas.
b) Calculalamedia,lamedianaylamoda.
4. Sehapreguntadoa50estudiantesde1deBachilleratoporelnmerodehermanosquetena,yse
haobtenido:
Nmerodehermanos

6oms

Nmerodeveces

19

a) Representa los datos en un diagrama de barras de frecuencias absolutas, en un diagrama de


lneasdefrecuenciasrelativas,yenundiagramadesectores.
b) Hazunhistograma.
c) Calculalamedia,lamedianaylamoda.Calculaloscuartiles.
d) Calculalavarianza,ladesviacintpica,elrecorridoyelintervalointercuartlico.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

428

Estadstica

Utilizaunahojadeclculoconelordenador
Seconoceelvolumensemanalderesiduosslidosrecogidosenm3durantelas52semanasdeunao,
enunmunicipiopequeo:
25'5,27'1,31'8,34'2,38'9,21'3,28'7,33'2,36'5,39'6,25'2,24'7,23'2,23'3,22'2,26'4,26'7,29'6,31'3,
30'5,28'3,29'1,26'7,25'2,24'5,23'7,25'4,27'2,31'7,34'5,38'4,21'2,28'1,33'7,36'8,39'9,31'7,34'4,
38'2,21'9,28'1,33'5,25'2,24'7,23'2,23'3,22'2,26'4,25'9,24'1,23'2,23'6,26'4.
Calcula,utilizandoExceluotrahojadeclculo:
5. Parmetrosestadsticos
a) Lasmedidasdecentralizacin:lamedia,mediana,moda
b) Lasmedidasdedispersin:desviacintpica,varianza,coeficientedevariacin,valormnimo,valor
mximo,recorrido,primercuartil,tercercuartileintervalointercuartlico.
c) Otroscoeficientes:coeficientedeasimetraycoeficientedecurtosisqueencuentres.Investigalas
posibilidadesdelordenadorparaobtenerparmetrosestadsticos.
d) Haz una representacin grfica en serie temporal, que permita observar tendencias, ciclos y
fluctuaciones. Recuerda que en una serie temporal, en el eje de abscisas est el tiempo de
observacinyenelejedeordenadaslamagnituddeobservacin.
Paraello,escribeenlacasillaA12,1,enA13,2,yarrastraparaescribirelordendelassemanas,hasta
queaparezcael52.EscribeenlacolumnaBelvolumenrecogidocadasemana.
EnlacasillaA11unttulo,porejemplo,Residuosslidos.
En la casilla C12 escribe Media, y en la casilla D12 calclala usando la funcin PROMEDIO. De igual
formacalculalosotrosparmetros.
Observauntrozodepantallaconalgunosresultados:

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

429

Estadstica

6. Los datos de la prctica anterior se quieren representar en un histograma para mejor


determinarsudistribucin.Paraello:
a) Indicaelnmerototaldedatos,N,elmenorvalor:Xm,elmayorvalor,XM,yelrecorridoR.
b) Lacantidaddebarrasdelhistograma,k,sesueletomar,paramenosde50datos,entre5y7.ParaN
entre50y100,entre6y10.ParaNentre100y250,
entre7y12.YparaNmayorde250,entre10y20.En
estecasoNesiguala52,luegoelnmerodebarras
podra ser entre 6 y 10. Al dividir R entre 10 se
obtiene 1,87 que sera el intervalo de clase. Para
facilitar la divisin en clases fijamos el intervalo de
clase,h,en2,yelnmerodebarras,k,en10.Parano
tenervaloresenloslmitesdeclasetomamoselinicio
del primer intervalo en 20. As, los intervalos son: (20, 22), de valor central: 21; [22, 24), de valor
central23...Ahorayasepuedeconstruirlatabladefrecuenciasydibujarelhistograma.
c) Calculayrepresentaenelhistogramalospuntosm, m s, m 2s, m 3s,dondemyssonlamediay
ladesviacintpica,respectivamente
7. Vamosainvestigarquocurrealhaceruncambiodevariables.Dijimosquesiconsideramos
yi = a + bxi siendo a y b dos constantes cualesquiera, la nueva media aritmtica quedara
y a bx .
a) AbreExcel.Introducelosdatos:X=255,271,318,342,389,...enlacolumnaA,apartirdelafila11.
Qucambiodevariablesehahecho?Observa:x = X/10.
b) EnlacolumnaC,apartirdelafila11escribeloslmitesdeclase,enlacolumnaDelvalormedio,en
lacolumnaEvamosacontarlasfrecuenciasabsolutasyenlacolumnaFlasfrecuenciasacumuladas.
UtilizalafuncinCONTAR.SIparacontar.Porejemplo,escribeenE11,CONTAR.SI(A11:A63;<220).En
F11escribe=E11.EnE12escribeCONTAR.SI(A11:A63;<240)F11.Completalatabladefrecuencias.
Escribettulosenlafila10.
c) Calcula la media y la desviacin tpica. Para ello escribe en la fila 3 y 4, columna B, las funciones
=PROMEDIO(A11:A63)y=DESVEST(A11:A63).Escribelosresultadoscon2decimales.
d) Cmo obtienes ahora la media y la desviacin tpica de los datos reales? Cmo deshaces el
cambio?Sinolorecuerdas,onotienesseguridad,investgalo.Calculalamediayladesviacintpica,
antesydespusdelcambio.Escribeesteresultado,engeneral,parauncambiodevariableslinealy
= ax+b.
e) Dibujaelhistograma.Noolvidesnuncaindicarlasunidadesenambosejes,ytodalainformacinque
ayudeacomprenderelgrfico.Aadesiempreeltamao,N,ylosvaloresdelamediayladesviacin
tpica.
f) Discuteelresultado.Esgrandeladispersin?Ladistribucin,essimtrica?
8. Otrainvestigacin:Vamosainvestigarladistribucindelamedia.Paraellovamosatomar
muestrasdetamao5.UtilizalacolumnaG.EnG11escribe=PROMEDIO(B11:B15),enG12la
mediadeB16aB20,yashastaelfinal.Tenemoscalculadaslas10mediasdemuestrasde
tamao 5. Calcula la media y la desviacin tpica de estas medias. Compara con los
resultadosanteriores.Escribeentucuadernolasconclusiones.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

430

Estadstica

Estadsticadescriptivabidimensional
9. Enunamuestrade10personasmiramossucolordeojosypeloyencontramosquehay5
morenosdeojosmarrones,1morenodeojosverdes,3rubiosdeojosazulesy1rubiode
ojosverdes.A)Representaenunatabladedobleentradaestasituacin.B)Escribelatabla
de frecuencias relativas. C) Escribe las frecuencias absolutas y relativas marginales. D)
Escribeladistribucindefrecienciascondicionadas.
10. Lolahacalculadoloscoeficientesdecorrelacindelastresnubesdepuntosadjuntas,yha
obtenido:08,085y003,peroahoranorecuerdaculesdecadauna.Puedesayudara
decidirqucoeficientecorrespondeconcadanube?
A

10

10

0
0 1 2 3 4 5 6 7 8 9 10

14
12
10

4
2
0
2 3 4 5 6 7 8 9 10

2 3 4 5 6 7 8 9 10

11. Enunatiendaquierenestudiarlasventasdelpandemoldeenfuncindelprecio.Paraello
pruebancadasemanaconunpreciodistintoycalculanlasventasrealizadas.Hanobtenido
lossiguientesdatos:
Precio(euros)

05

07

12

13

Ventas(medias)

202 192 181 153 116

15

17

18

a) Representalosdatosenundiagramadedispersin(nubedepuntos)eindicaaquconclusiones
creesquesevaallegar.
b) Calculalacovarianza,elcoeficientedecorrelacinylarectaderegresin.
c) Decidenponerunpreciode14euros,culesopinasqueseranlasventasmediassemanales?
12. Preguntamosa10estudiantesde1deBachilleratoporsuscalificacionesenMatemticas,
porelnmerodeminutosdiariosquevenlatelevisin,porelnmerodehorassemanales
quededicanalestudio,yporsuestaturaencentmetros.Losdatosserecogenenlatabla
adjunta.
CalificacionesdeMatemticas
10
3
8
8
5
10
10
8
5
8
MinutosdiariosquevelaTV
0
90
30
20
70
10
0
20
60
30
Horassemanalesdeestudio
15
0
10
10
10
15
15
10
5
5
Estatura(encm)
175 166 155 161 161 177 182 177 167 172
Queremos estudiar la relacin entre las calificaciones de Matemticas y las otras tres variables. Para
ello dibuja los diagramas de dispersin, y calcula los coeficientes de correlacin y las rectas de
regresin.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

431

Estadstica

13. UnacompaaarearealizaunestudiosobrelarelacinentrelasvariablesX,tiempodeun
vuelo,enhoras;eY,consumodecombustible(gasleo)paradichovuelo,enlitros,ysehan
obtenidolossiguientesdatos.
X(horas)

05

Y(litros) 2250

15

25

3950

5400

7300

8500

10300

a) Representalosdatosenundiagramadedispersin.
b) Calculalacovarianzayelcoeficientedecorrelacinentreambasvariables.Interpretalosresultados.
c) Calculalaecuacindelasrectasderegresin.
14. Haz un trabajo. Pasa una encuesta a tus compaeros y compaeras de clase. Elige una
muestra de 10 personas y hazles dos preguntas con datos numricos, como por ejemplo,
cuntomidesumano,qunmerodezapatocalza,elnmerodelibrosqueleeenunmes,
el nmero de horas que ve la televisin a la semana, dinero que gasta al mes en comprar
msica, la calificacin en Matemticas de su ltimo examen Representa los datos
obtenidos en una tabla de doble entrada. Haz un estudio completo. Puedes utilizar el
ordenador:
a) Escribe en tu cuaderno una tabla de doble entrada de frecuencias absolutas, frecuencias
relativas.Obtnlasdistribucionesmarginalesycondicionadas.
b) Conlasdistribucionesunidimensionales,dibujalosdiagramasdebarras,diagramasdelneasy
diagramas de sectores. Calcula las medias, medianas y modas. Calcula las varianzas y las
desviacionestpicas.Calculaloscuartilesylosintervalosintercuartlicos.
c) Con las distribuciones bidimensionales, dibuja un diagrama de dispersin, y calcula la
covarianza,elcoeficientedecorrelacinylarectaderegresin.
d) Reflexionasobrelosresultadosyescribeuninforme.

Utilizaunahojadeclculoconunordenador
15. Elobjetivodeestaprcticaesestudiarladispersinentredosvariables,medianteunanube
depuntosodiagramadedispersin,elcoeficientedecorrelacinylarectaderegresin.
En10pasesseanotanlosingresosmedios,eneuros,porhabitanteyao,yelporcentajemedioenlos
residuosslidosdecomida.
Seobtiene:
xi() 750

5000 7000 2000 5500 1000 500

6000 4000 3000

yi(%) 85

65

30

20

25

45

70

40

50

a) Abreunahojadeclculo.Copialosdatos.Calculalamediayladesviacintpicadelasx,ylamedia
yladesviacintpicadelasy.
b) Representa la nube de puntos. Selecciona los datos,
incluyendo a las medias. Aprieta el botn de asistente
de grficos y elige XY (Dispersin). En ttulos escribe
como Ttulo del grfico Correlacin, en Eje de valores
(X) describe la variable x sin olvidar decir las unidades,
escribe: Ingresos/habitante (), en Eje de valores (Y)
describe la variable y sin olvidar decir las unidades,
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

432

Estadstica

escribe:PorcentajederesiduosdecomidaenlosRSU(%).EnLeyendaeligenomostrarleyenda.
c) Observaquesix x ey y tienenelmismosignoquedanenloscuadrantesIyIIIysilotienen
distintoenIIyIV.CuentalospuntosquequedanenloscuadrantesIyIII,cuentalosquequedanen
loscuadrantesIIyIV.Nospuededarunaideadelacorrelacin.Vaaserpositivaonegativa?Es
unacorrelacinfuerteodbil?Entrequevalorespuedevariarelcoeficientedecorrelacin?Estima
aojounvalorparaesacorrelacin.
d) OrganizaenExcelunahojadeclculoquetepermitacalcularlacorrelacin.Escribelosdatosenlas
filas 3 y 4. En L3 y L4 calcula las medias utilizando la funcin PROMEDIO. En M3 y M4 calcula la
desviacin tpica utilizando la funcin DESVEST. En N3 calcula el coeficiente de correlacin,
utilizandolafuncin:
COEF.DE.CORREL(B3:K3;B4:K4)
e) Ahoravamosamejorarnuestrogrfico.Observaquesicolocasalratnencimadeunpuntoindica
lascoordenadas.Trazalasrectasx= x ,y= y queindicanlasmedias.Utilizaparaellolapaletade
dibujo.Dibjalasencolorrojo.
f) Larectaderegresineslarectaquehacemnimaslasdistanciasdelanubedepuntos.Eslarecta:y
s
= y + y (x x ).CalculaenN4lapendientedelarecta.Escribelaecuacindelarecta.Observael
sx
grfico.Cmolahabrasestimadoaojo?Evalalapendienteylaordenadaenelorigen.
16. Serecogeenunatablalaaltura(enmetros)deunpadreydeladesuhijocon15aosde
edad.
Padre

17

16

17

165

19

19

181

Hijo

175

19

17

18

16

188

195

a)Utilizaelordenadorpara
representareldiagramade
dispersin. Copia los datos
en una hoja de clculo en
las columnas A y B. Seala
las dos series y elige
insertar
grfico
de
dispersin. Automticamente vers que aparece el
diagramadedispersin(nubedepuntos).Juegaconlas
opciones para modificar el ttulo, el formato, la escala
delosejes
b)Dibujalarectaderegresin.Pinchasobreunpuntodelanube,
yeligeAgregarlneadetendencia.Paraquedibujeelordenador
la recta de regresin la lnea de tendencia debe ser Lineal. En la
pantalla que aparece marcamos la casilla que dice: Presentar
ecuacinenelgrficoylacasillaquedicePresentarelvalordeR
cuadrado en el grfico. Al final, si lo has hecho bien, el dibujo
debesermsomenosalgosimilaraesto:
c) Utiliza la recta para determinar que altura del hijo
corresponderaaunaalturadelpadrede175m.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

2,5

1,5

0,5

0
1,5

1,6

1,7

1,8

1,9

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

433

Estadstica

AUTOEVALUACIN
1. Realizamosunapruebaa20aspirantesaunpuestodegrabadorconsistenteenundictadocon
cierto tiempo de duracin (en minutos) y luego contar el nmero de errores cometidos al
transcribirloaordenador.Losresultadosfueron.
Tiempo 7 6 5 4 5 8 7 8 9 6 5 8 6 8 7 8 7 6 6 9
Errores 8

10 9

10 8

10 8

a)
b)
c)
d)

Construyelatablafrecuenciasconjuntaylastablasfrecuenciasmarginales.
Calculamedia,mediana,moda,varianza,desviacintpicaparalasvariablesmarginales.
Calculaelrecorridoparalasvariablesmarginalesylacovarianza.
Nmeromediodeerrorescondicionadoauntiempodedictadode6minutos.Porcentaje
aspirantesquecometenmenosde8erroresdeentrelosquesonsometidosaundictadode
msde6minutos.
e) Calculalarectaderegresinlinealdeltiemposobreelnmerodeerroresy,alavistadeella,
explicaladependenciaoindependenciadelasvariables.
2. Lasiguientetablamuestralatalladecalzadoylospesosde55estudiantes.
Talla
39 40 40 40 41 41 41 41 42 42 42 42 43 43 44
Peso

55

Nestudiantes 1

60

65

70

60

65

70

85

65

70

75

80

65

75

85

a) Calculalatabladefrecuenciasconjunta.
b) Sonindependienteselpesoylatalla?Calculalacovarianzaylarectaderegresin.
3. Dada la siguiente tabla de frecuencias conjunta, calcular el valor de a sabiendo que la media
condicionadadeYdadoX =1es3/5.
X/Y
0
1
1

4. LospreciosdiariosdelasaccionesXeYvaran,demaneraqueseestudianconjuntamenteesas
dosvariablesdurante10das,ysecalculanlosparmetros.

Media
Desviacin tpica
X

157

31

82

19

Covarianza095.
a) SiconocemoselvalordelaaccinXconanterioridadalvalordeY,calculalarectaderegresinque
permitaobtenerunaestimacindelpreciodeY,unavezconocidoelvalordeX.
b) Sera til usar este caso concreto de regresin lineal para predecir el valor de Y y aprovechar la
prediccinparatomardecisiones?Porqu?
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk

www.apuntesmareaverde.org.es

Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

You might also like