Professional Documents
Culture Documents
1Bachillerato
Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
393
Estadstica
ndice
1.ESTADSTICADESCRIPTIVAUNIDIMENSIONAL
1.1.INTRODUCCIN
1.2.MTODOESTADSTICO
1.3.CONCEPTOSBSICOS
1.4.TIPOSDEVARIABLES
1.5.DISTRIBUCIONESDEFRECUENCIAS
1.6.TABLAODISTRIBUCINDEFRECUENCIASDEUNAVARIABLE
1.7.DISTRIBUCIONESDEFRECUENCIASAGRUPADAS
1.8.GRFICOS
1.9.PARMETROSESTADSTICOSDEPOSICIN
1.10.PARMETROSESTADSTICOSDEDISPERSIN
2.ESTADSTICADESCRIPTIVABIDIMENSIONAL
2.1.INTRODUCCIN
2.2.DISTRIBUCINDEFRECUENCIASCONJUNTAS
2.3.DISTRIBUCINDEFRECUENCIASMARGINALES
2.4.DISTRIBUCINDEFRECUENCIASCONDICIONADAS
2.5.INDEPENDENCIAESTADSTICA
2.6.DIAGRAMADEDISPERSIN.NUBEDEPUNTOS
3.COVARIANZA
3.1.IDEACORRELACIN.COVARIANZA
3.2.COEFICIENTECORRELACINLINEAL
3.3.RECTAREGRESINLINEAL
3.4.PREDICCINYCAUSALIDAD
Resumen
En esta unidad vamos a repasar todos los conceptos de estadstica unidimensional aprendidos en
cursosanteriores,revisandolastablasdefrecuencias,calculandolasmedidasdecentralizacin,media,
medianaymodaylasmedidasdedispersin,varianzaydesviacintpica.
Elestudiounidimensionalloampliaremosalanlisisconjuntodedosvariables,estudiobidimensional,
utilizandolastablasdedobleentradaparaestudiarlarelacinentreellasyanalizandocadaunadelas
variables por separado desde las tablas, obteniendo as las distribuciones que ahora llamaremos
marginales.
Hay parejas de variables que, aunque no puedan relacionarse por medio de una frmula, s que hay
entreellasunadeterminadarelacinestadstica.Lavisualizacinpormediodelasnubesdepuntosnos
permitirhacernosunaidearazonablesobreestacorrelacinentrelasvariables.
Unabuenaformademarcarlastendenciasdelasnubesdepuntoseshaciendousodeunasrectasque
llamaremosrectasderegresin.
Cuandolacorrelacinesfuerte,lospuntosestnmuyprximosalarecta.Enestoscasoslarectade
regresin resultar muy til para hacer previsiones, conociendo un valor de una variable podremos
calculareldelaotraconrazonableseguridad.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
394
Estadstica
1.ESTADSTICADESCRIPTIVAUNIDIMENSIONAL
Yaconocesde3y4deESOmuchosobreEstadstica,recuentodedatos,tablasygrficas,parmetros
comomedia,mediana,moda.Vamosarevisarestosconocimientos.
1.1.Introduccin
LaEstadsticaeslaCienciaqueseencargadelarecopilacin,representacinyelusodelosdatossobre
unaovariascaractersticasdeinterspara,apartirdeellos,tomardecisionesoextraerconclusiones
generales.
Ejemplo1:
Elgobiernodeseaaveriguarsielnmerodehijosporfamiliahadescendidorespectoaladcada
anterior. Para ello ha entrevistado a 50 familias y les ha preguntado por el nmero de hijos
obteniendolossiguientesdatos:
24231242302223262322323343345203203212322314232433221.
Ejemplo2:
Un nuevo hotel va a abrir sus puertas en nuestra ciudad. Antes de decidir el precio de sus
habitaciones, el gerente investiga los precios por habitacin de los 40 hoteles de la misma
categoraquehaycercadenuestraciudad.Losdatosobtenidosson:
394737564349506151455339435060475142445833394350604751424458334341
5844386143534540543947334547424548.
1.2.Mtodoestadstico
LaEstadsticadescriptivaeslapartedelaestadsticaqueseencargadeorganizar,resumirydaruna
primeradescripcin(sinconclusionesgenerales)delosdatos.
En Estadstica se sigue un mtodo estadstico que est formado por distintas fases segn se trata la
informacinrecibida.
0. Planteamientodelproblemaentrminosprecisos:mbitodeaplicacin(poblacin)y
caractersticasaestudio(variables).
1. Recogidadedatosdelapoblacindeinters:Muestreo.
2. Organizacin, presentacin y resumen de los datos (o de la muestra): Estadstica
descriptiva.
3. Modelosmatemticos:Teoraprobabilidad.
4. Obtenerconclusionesgeneralesoverificarhiptesis.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
395
Estadstica
1.3.Conceptosbsicos
Poblacin.Eselconjuntodeindividuosoentessujetosaestudio.
Ejemplo1:
Conjuntodetodaslasfamiliasespaolas
Ejemplo2:
Todosloshotelesdeestacategoradelascercanas.
Algunas poblaciones son finitas y pueden conocerse en su totalidad, otras en cambio pueden ser
infinitasyabstractas.
Muestra:Eselnmerodedatosquetomamosdelapoblacinpararealizarnuestroestudio.
Ejemplo1:
Las50familiasalasquesehapreguntadoporelnmerodehijos
Ejemplo2:
Los40hoteles.
Tamaomuestral:Nmerodeobservacionesenlamuestra.
Habitualmentesedenotarporn.
Ejemplo1:
n=50.
Ejemplo2:
n=40.
Dato:Cadavalorobservadodelavariable.
Ejemplo1:
24231242302223262322323343345203203212322314232433221.
Ejemplo2:
39473756434950615145533943506047514244583339435060475142445833
43415844386143534540543947334547424548.
Variable:Caractersticaqueestamosmidiendo.
Ejemplo1:
Nmerodehijos.
Ejemplo2:
Preciodelahabitacin.
LasvariablessuelendenotarseporlasletrasmaysculasX,Y..
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
396
Estadstica
1.4.Tiposdevariables
Cualitativas o categricas: Aquellas que no son medibles, es decir aquellas cuyas observaciones no
tienencarcternumrico.Expresancualidadesocategoras.
Ejemplos:
Sexo,profesin,estadocivil
Cuantitativas:Aquellasquesonmedibles,esdecir,susobservacionestienencarcternumrico.Estas
sedividenen:
Discretas:Tomanvaloresnumricosfijos.
Ejemplos:
Nmero de habitaciones, nmero de hijos de una familia, nmero de trabajadores de una
fbrica
Continuas:Tomanvaloresenintervalosdenmeros
Ejemplos:
Peso,estatura,cuandoseorganizanlosdatosenintervalos.
1.5.Distribucionesdefrecuencias
Observando los datos del ejemplo es fcil adivinar cul ser el primer paso en la organizacin de los
datos,consistirenagruparlosdatosqueserepitenvariasveces.
Tenemoslassiguientesdefiniciones:
Frecuenciaabsoluta(ni):Eselnmerodevecesqueserepiteenlamuestraundeterminadovalor(xi)
delavariable.
Ejemplo:
Paraeldatox1=0,n1=2;paraeldatox4=3,n4=15.
Propiedad:
Lasumadetodaslasfrecuenciasabsolutasesigualaltamaomuestral.
ni n
Frecuencias relativas (fi): Es igual a la frecuencia absoluta dividida por el nmero total de datos, es
decirporeltamaomuestral.
fi
ni
Ejemplo:
2
15
0'04 f 4
0'3
50
50
Propiedad:
Lasumadetodaslasfrecuenciasrelativasesiguala1.
f1
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
397
Estadstica
Frecuencias acumuladas (Ni): Nos dice el nmero de datos que hay igual o inferiores a uno
determinado.
Secalculasumandoelnmerodefrecuenciasabsolutasquehayanterioresallegaralaquequeremos
calcular.
Ejemplo:
N1=2N4=42.
Propiedad:
Laltimafrecuenciaacumuladaesigualaltamaomuestral,alnmerototaldedatos.
Frecuenciarelativaacumulada(Fi):Eselresultadodedividircadafrecuenciaacumuladaporelnmero
totaldedatos.
Fi
Ni
Ejemplo:
F1 0'04 F4
42
0'84
50
Propiedad:
Laltimafrecuenciarelativaacumuladaessiempre1.
1.6.Tablaodistribucindefrecuenciasdeunavariable
Llamamosasaunatablaconteniendoelconjuntodediferentesvaloresquehatomadouna variable
(losdatossinrepetir)ordenadosdemenoramayorconsuscorrespondientesfrecuencias.
Actividadesresueltas
Latabladevaloresdelejemplo1delnmerodehijos
xi
ni
fi
Ni
Fi
004
004
008
012
21
042
27
054
15
03
42
084
012
48
096
002
49
098
002
50
Culeselnmerodefamiliasquetienecomomximodoshijos?
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
398
Estadstica
Miramoslacolumnasegundani:2+4+21=27omiramoslacolumnacuarta,tercerafila:Ni:nosda27
Cuntasfamiliastienenmsdeunhijoperocomomximo3?
Miramos la columna segunda: 21 + 15 = 36 o miramos la columna cuarta y restamos las filas cuarta
menossegunda426=36.
Quporcentajedefamiliastienemsde3hijos?
Miramosenlacolumnatercera:012+002+002=01616%oenlacolumnasquintarestandoala
ltimafilalacuartafila,esdecir,1084=01616%.
1.7.Distribucionesdefrecuenciasagrupadas
Ahoravamosatrabajarconunadistribucindefrecuenciasagrupadasconelejemplodelpreciodeuna
habitacindehotel.
Ejemplo2:
xi
ni
fi
Ni
Fi
36
005
005
37
0025
0075
38
0025
01
39
0075
0175
40
0025
02
41
0025
0175
42
005
11
02
43
01
15
0225
44
005
17
0275
45
01
21
0375
47
01
25
0425
48
0025
26
0525
49
0025
27
0625
50
005
29
0650
51
005
31
0675
53
0725
54
..
0775
..
..
..
..
..
..
.
..
..
.
..
..
56
1
58
2
60
1
61
2
Estatablaesdemasiadograndeymuypocooperativa.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
399
Estadstica
Cuandolavariabletomamuchosvalores,latablaqueseobtieneesdemasiadograndeyportantopoco
clarificadora,estonosvaaocurrirfrecuentementeenelcasoenquelavariableaestudiarseacontinua.
La solucin a este problema est en agrupar los diferentes valores de la variable en intervalos o
intervalos de clase. Teniendo en cuenta que lo que ganamos en manejabilidad lo perdemos en
informacin,esdecirlosresultadossernaproximados.
Agrupar en intervalos de clase consiste en agrupar los datos en nmeros relativamente pequeo de
intervalosquecumplan:
Nosesuperponganentres,deformaquenoexistaambigedadconrespectoalaclaseaque
perteneceunaobservacinparticular.
Cubrantodoelrangodevaloresquetenemosenlamuestra.
Llamaremos:
A las fronteras del intervalo, lmites inferior y superior de clase y los denotaremos por li, Li
respectivamente.
Marcadeclase(ci)alpuntomediodelintervalo,esdecir,alpromedioaritmticoentreellmite
L l
inferioryelsuperior: ci i i .Eselvalorquetomaremoscomorepresentativodelintervalo
2
oclase.
Amplitud(ai)esladiferenciaentreelextremosuperioreinferior:ai = Li li.
Alnmerodeobservacionesdeunaclaseselellamafrecuenciadeclase(ni)sidividimosesta
frecuenciaporelnmerototaldeobservaciones,seobtienelafrecuenciarelativadeclase(fi),y
delmismomodoquelohacamosparadatossinagrupardefiniramos(Ni)y(Fi).
Cmoconstruirunadistribucindefrecuenciasagrupadaenintervalos
1. Empezamosdeterminandoelrecorridodelavariable(Re)orangodevaloresquetenemosenla
muestra.Sedefinecomoladiferenciaentreelmayoryelmenorvalordelavariable.
2. Nmerodeclases.Dependedeltamaodelamuestra.ParamuestrasdetamaomoderadoN
menor que 50, se suele elegir un nmero de clases o intervalos igual a n . Para muestras
mayoresseutilizalafrmuladeSturges
log( n )
1 ,engeneralelnmerodeintervalosnodebe
log( 2 )
sobrepasarde15o20,encasosdemuestrasmuygrandes.
3. Determinamoslaamplituddelosintervalos.Esmscmodoquelaamplituddetodaslasclases
sealamisma(siemprequeseaposibleyexceptoelprimeroyelltimo),siesasai=a= Re/n
intervalos.
4. Tomaremoscomoreglageneral,anoserqueseindiquelocontrario,hacerqueelintervaloest
cerradoporlaizquierdayabiertoporladerecha(exceptoelltimointervalo).
Ejemplo:
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
400
Estadstica
Representaladistribucindefrecuenciasagrupadasparalosdatosdelejemplodelpreciodelas
habitacionesdeunhotel.
Recorrido:Elmenorvalores33yelmayores61,ladiferenciaes28yportantoelrecorridoes:Re=28.
Nmero de clases: N=40,hacemosquelatablatenga6clases,pues 40 6.
Amplitud:a=28/6=467
Comolaamplitudnossaleunnmerocondecimaleslosintervalosnosvanaquedarrarosportanto
hacemoselarreglosiguiente:
Paraquelosintervalosnosquedenconamplitud5tomamoscomoprimervalorel325enlugardel33y
comoltimoel625enlugardel61.
Amplitud:a=5.
Aspueslatablaqueda:
[li, Li[
c i
ni
fi
Ni
Fi
[325,375[
35
0075
0075
[375,425[
40
02
11
0275
[425,475[
45
14
035
25
0625
[475,525[
50
015
31
0775
[525,575[
55
01
35
0875
[575,625[
60
0125
40
Cuntoshotelestienenunprecioentre325y375euros?
3
Cuntoshotelestienenunpreciosuperiora475?
15
Quporcentajedehotelescuestancomomucho425?
275%.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
401
Estadstica
Actividadespropuestas
1. Completalosdatosquefaltanenlatabla.
xi
ni
fi
Ni
Fi
10
005
005
13
01
015
16
16
04
19
15
22
015
37
0925
25
2. Completalosdatosquefaltanenlatabla.
[li, Li[
ni
fi
Ni
[0,10[
60
60
[10,20[
04
[20,30[
30
170
[30,40[
01
[40,50]
200
1.8.Grficos
Laformadeladistribucindefrecuenciassepercibemsrpidamenteyquizsseretienedurantems
tiempoenlamemoriasilarepresentamosgrficamente.
Diagramadebarras
Es la representacin grfica usual para las variables cuantitativas sin agrupar o para variables
cualitativas. En el eje de abscisas representamos los diferentes valores de la variable xi. Sobre cada
valorlevantamosunabarradealturaigualalafrecuencia(absolutaorelativa).
Nmerodehijos
25
20
15
10
5
0
0
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
402
Estadstica
Diagramadesectoresopastel
Eselmsusualenvariablescualitativas.Serepresentanmediantecrculos.Acadavalordelavariable
seleasociaelsectorcircularproporcionalasufrecuencia.
Parahallarelngulousamosunaregladetres:
n360o1360
ninguloifinguloi
Ejemplo3:
Enunasvotacionesdeunacomunidaddevecinosparadecidirsicambialaantenadetelevisin
delacomunidad,de50vecinos25votanafavor,15encontray10seabstienen.Representalos
datosmedianteundiagramadesectores.
xi
fi
Afavor
05
Encontra
03
Abstencin
01
votaciones
afavor
encontra
abstencin
Histogramas
Es la representacin grfica equivalente al diagrama de barras para datos agrupados. En el eje de
ordenadasrepresentamoslasclasesylevantamossobrecadaclaserectngulosunidosentresdealtura
n
igualalafrecuenciadelaclase(absolutasorelativas)sitodaslasclasestienenlamismaamplitudy i
ai
o
fi
sitienendistintasamplitudes.
ai
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
403
Estadstica
Preciodehabitacindehotel
16
14
12
10
8
6
4
2
0
]32.5,37.5]
]37.5,42.5]
]42.5,47.5]
]47.5,52.5]
]52.5,57.5]
]57.5,62.5]
Polgonodefrecuencias
Es la representacin habitual para datos cuantitativos agrupados de las frecuencias (absolutas o
relativas,acumuladasabsolutasorelativas),mediantepuntosserepresentanlasfrecuenciaseneleje
deordenadasylamarcadeclaseeneldeabscisas.Despusseunenestospuntosporsegmentosde
rectas.
Preciodehabitacindehotel
16
14
12
10
8
6
4
2
0
35
40
45
50
55
60
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
404
Estadstica
1.9.Parmetrosestadsticosdeposicin
Paradatoscualitativos,ladistribucindefrecuenciasproporcionaunresumenconcisoycompletodela
muestra, pero para variables cuantitativas puede complementarse este resumen utilizando medidas
descriptivasnumricasextradasdelosdatos.Estasmedidassonvaloresnumricoscalculadosapartir
delamuestrayquenosresumenlainformacincontenidaenella.
Mediaaritmtica
Eselpromedioaritmticodelasobservaciones,esdecir,elcocienteentrelasumadetodoslosdatosy
el nmero de ellos. (Teniendo en cuenta que si un valor se repite hay que considerar estas
repeticiones).
x
k
i xi ni
xi f i
n
i 1
Silosdatosestnagrupadosenintervalosutilizaremoslasmarcasdeclase,ci,envezdexi.
Eslamedidadecentralizacinmsimportante.
Ejemplo1.
Nmeromediodehijos.
x
0 2 1 4 2 21 3 15 4 6 5 1 6 1 126
2'52 hijos.
50
50
Utilizandolosdatosdelasfrecuenciasrelativas.
46'875
40
40
Oequivalentemente:
Propiedades.
1. Siatodoslosvaloresdeunavariablelessumamosunaconstante,lamediaaritmtica
quedaaumentadaenesaconstante.
2. Siatodoslosvaloresdeunavariablelosmultiplicamosporunaconstante,lamedia
aritmticaquedamultiplicadaporlamismaconstante.
3. Siconsideramosyi = a + bxisiendoaybdosconstantescualesquiera,lanuevamedia
aritmticaquedara y a bx
4. Lasumadetodoslosvaloresdelavariablerestndoleslamediaescero.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
405
Estadstica
Mediana
Esaquelvalorque,alordenarlasobservacionesdemenoramayor,ocupaellugarcentral,dividiendoal
conjuntodeobservacionesendospartesiguales.Esdecir,quedejaasuderechayasuizquierdael50
porcientodelasobservaciones.
Si el tamao de la muestra, n, es impar, necesariamente existe un dato que ocupa el lugar central,
concretamenteeldatoquealordenarlosestenlaposicin(n+1)/2;perosinespar,sondoslosdatos
queencontramosenellugarcentral,losqueocupanloslugaresn/2y(n/2)+1,calculandoentoncesla
medianacomoelpuntomedioentreambosdatos.
Ejemplo4:
Si tenemos los datos de 30 valores sobre el peso de los estudiantes de 1 de bachillerato
ordenadosdemenoramayor.
261428604541489552355244560056745729577958345944651065856826
683468476924714874827837814381728184836286628782919392789697
Comon=30espar,lamedianaserelvalormediodelosvaloresqueocupanlasposiciones15y16en
latabla:68266834
Mediana=Me=(6826+6834)/2=683kg.
Ejemplo5:
Las 13 primeras observaciones correspondientes al nmero de chocolatinas consumidas en un
daporlosestudiantesdeunaclaseson:
0122222223333.
Eldatoqueocupaelvalorcentral,eselqueocupaellugarsptimoyaquehay13valores,esedatoesla
medianaportantolamedianaes2.
Me=2.
Moda
Esaquelvalorquetienemayorfrecuencia.
Enelcasodelasfrecuenciasagrupadasenintervalossetomaelintervaloquemsvecesserepitecomo
lamoda
Ejemplo5:
Paralavariableconsumodechocolatinasdelejemplo5lamodaesMo=2
Ejemplo2:
Paralosdatosdelejemplo2eselintervalo[425,475).
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
406
Estadstica
Percentiles
Elpercentilpsimoesaquelvalorqueverificalacondicindequeelp%delosdatossonmenoreso
igualesal.
As,elpercentil70suponequeel70%delosdatossonmenoresoigualesal.
Ejemplo:
Queremoscalcularelpercentil30delosdatosdelejemplo5,tendremosencuentaqueel30%
de 30 datos que hay es 9, as buscamos el dato que ocupa esa posicin en la ordenacin del
ejemplo5,quees5729.
Siqueremoscalcularelpercentil15,tenemosencuentaqueel15%de30es45,perocomoeste
datonoperteneceaningunaposicintomamoslaaproximacinporexceso,oseatomamosel
dato que ocupa la posicin 5 por tanto el percentil 15 seria el dato 5235. Tambin es posible
aproximarlomejormedianteunainterpolacinlineal.
Nota:
Lospercentiles25,50y75recibenelnombredeprimercuartil,segundocuartilytercercuartil.
Ademselsegundocuartilqueeselpercentil50coincideconlamediana.
Si los datos estn ordenados en intervalos tomamos el intervalo correspondiente al porcentaje del
percentilcomovalordelpercentilcorrespondiente.
1.10.Parmetrosestadsticosdedispersin
Lasmedidasdeposicinestudiadasenelapartadoanterior,nosdanunainformacinincompleta,por
parcial,acercadelosdatos.
Veamosunejemplo:
SupongamoslasnotasdematemticasdelosestudiantespertenecientesadosclasesdistintasclaseAy
claseB,con10estudiantescadauna.
ClaseA4,3,5,6,4,5,5,7,5,6
ClaseB1,4,3,5,6,8,2,7,5,9
ClaseA
ClaseB
2,5
1,5
0,5
0
0
3
En los dos casos la media, como podemos calcular es 5, pero sus diagramas de frecuencias son muy
distintos.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
407
Estadstica
Los diagramas de frecuencias anteriores nos muestran que los valores se distribuyen simtricamente
respectoalanota5,peroenlaclaseAexisteunamenordispersinqueenlaclaseB.Cmomedirla
distinta manera en que los valores se agrupan alrededor de la media? Las distintas medidas de
dispersinproporcionanestainformacin.Aligualqueocurreparalaposicin,existendiversasformas
para medir la dispersin, de entre ellas estudiaremos: rango, desviacin tpica, varianza y rango
intercuartlico.
Rango
Esladiferenciaentreeldatomayoryeldatomenor.
Asporejemplo
ElrangodelasnotasdelaclaseAvale73=4yelrangoenlaclaseBvale91=8,denotando
mayordispersindelavariableenlaclaseB.
Lavarianzayladesviacintpica
Puesto que se trata de medir cmo se agrupan los datos alrededor de la media, podramos utilizar
comocriteriolasdesviacionesdedichosdatosrespectosaquella,esdecir,lasdiferenciasentrelamedia
y los datos y ms concretamente la media de esas diferencias. Aunque a primera vista la sugerencia
puedaserbuena,vamosaaplicarlaalosvaloresdelasnotasdeclaseparaevidenciarelinconveniente
insalvablequeunamedidadeestetipotiene.
Enloscuadrosaparecenlasnotasdecadaclaseyencolumnassucesivassusdesviacionesrespectoala
mediayelcuadradodeestasdesviaciones,alquealudiremosmstarde.
Altratardeobtenerlamediadelasdiferencias,querecordemoseslasumadetodasellasdivididaspor
su nmero, nos encontramos que dicha media es 0 en ambos casos, porque existiendo desviaciones
positivasynegativas,unasanulanlosefectosdelasotras.
Enrealidadesonosocurrirconcualquierotroconjuntodedatos,porquepuededemostrarsequeesa
esunapropiedadquetienenlasdesviacionesrespectodelamedia.
ClaseA
Nota
xi x
di
ClaseB
Nota
xi x
di2
16
5
6
Suma
0
1
0
0
1
12
5
9
Suma
0
4
0
0
16
60
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
408
Estadstica
Enlastablasaparecenlasdesviacionesrespectodelamediaysuscuadradosparalasnotasdelasdos
clases.
Puesto que el uso de las desviaciones respecto de la media parece razonable, cmo resolver el
problemaquelassumasden0?Unasencillamaneradehacerloesutilizar,nolasdesviaciones,sinosus
cuadrados. Al ser stos cantidades positivas, su suma nunca podr ser cero. De acuerdo con esto la
varianzasedefineporlafrmula.
xi x ni
n
Varianza = s 2
i 1
xi ni
n
i 1
x2
Ladesviacintpicasedefinecomolarazcuadradadelavarianzayladesignaremospors.
s= Varianza
Ejemplo:
Paraelejemplodelasnotasdelasclases.
ClaseA
s2
12
1'33
9
s 1'33 1'15
ClaseB
s2
60
6'66
9
s 6'66 2'58
Queponendemanifiestoladiferentedistribucindelosvaloresenuncasoyenelotro.
Propiedaddeladesviacintpica
1. Aproximadamenteel68%delosdatosdistancomomuchounadesviacintpicadelamedia.
2. Aproximadamenteel95%delosdatosdistancomomuchodosdesviacionestpicasdelamedia.
3. Aproximadamentemsdel99%delosdatosdistancomomuchotresdesviacionestpicasdela
media.
Rangointercuartlico.
Sedefinecomoladiferenciaentreelterceryelprimercuartil.Elintervalointercuartlicoeselintervalo
definidoporloscuartilesprimeroytercero,cuyalongitudes,elrangointercuartlico.Esteintervaloas
definidocontieneel50%delosdatos.
Coeficientevariacin
Siqueremoscomparardossecuenciasdedatos,ydecirencualhaymayordispersin,sobretodoenel
caso en que sean datos expresados en diferentes unidades, con los parmetros definidos, desviacin
tpica,intervalointercuartlico,lotenemoscomplicado,poresosehacenecesariodefinirelcoeficiente
devariacincomo,
CV
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
s
100
x
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
409
Estadstica
Ejemplo:
En el ejemplo de las calificaciones de dos clases nos permite comparar las dos secuencias de
datos.
ClaseA
ClaseB
CV=(115/5)100=23%.
CV =(258/5)100=516%.
LlegandoalamismaconclusinquepercibamosenloshistogramasyaquelaclaseBtieneunamayor
dispersindelasnotas.
Actividadespropuestas
3. Clasificalassiguientesvariablescomocualitativasocuantitativas,yestasltimascomocontinuaso
discretas.
a)
b)
c)
d)
e)
f)
g)
h)
Intencindevotodeunpartido
Nmerodecorreoselectrnicosquerecibesenunmes.
Nmerodecalzados.
Nmerodekilmetrosrecorridosenfindesemana.
Marcasdecerveza
Nmerodeempleadosdeunaempresa
Altura
Temperaturadeunenfermo.
4. Muchas personas que invierten en bolsa lo hacen para conseguir beneficios rpidos, por ello el
tiempo que mantienen las acciones es relativamente breve. Preguntada una muestra de 40
inversores habituales sobre el tiempo en meses que han mantenido sus ltimas inversiones se
recogieronlossiguientesdatos:
105112991501141271651011271141166279831098138105117
8412511291104911341235911488748613614711511510998
12999
Construyeunatabladefrecuenciasquerecojaestainformacinyhazalgunarepresentacingrfica.
5. Investigadoslospreciosporhabitacinde50hotelesdeunaprovinciasehanobtenidolossiguientes
resultados.
703050405070407580505075307010015050751208040503050100
3040507050304070407050407010075708075707580707012080.
Determinar:
a) Distribucin de frecuencia de los precios, sin agrupar y agrupando en 5 intervalos de la misma
amplitud.
b) Porcentajedehotelesconpreciosuperiora75.
c) Cuntoshotelestienenunpreciomayoroigualque50peromenoroiguala100?
d) Representagrficamentelasdistribucionesdelapartadoa).
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
410
Estadstica
6. Elgobiernodeseasabersielnmeromediodehijosporfamiliahadescendidorespectoaladcada
anterior.Paraellosehaencuestadoa50familiasrespectoalnmerodehijosysehaobtenidolos
datossiguientes.
24231242302223262322323343345203212322314
232433221.
a) Construyelatabladefrecuenciasconestosdatos.
b) Cuntasfamiliastienenexactamente3hijos?
c) Quporcentajedefamiliastienenexactamente3hijos?
d) Quporcentajedefamiliasdelamuestratienemsdedoshijos?Ymenosdetres?
e) Construyeelgrficoqueconsideresmsadecuadoconlasfrecuenciasnoacumuladas.
f) Construyeelgrficoqueconsideresmsadecuadoconlasfrecuenciasacumuladas.
7. Enunhospitalsedeseahacerunestudiosobrelospesosdelosrecinnacidos.Paraelloserecogen
losdatosdelos40bebesysetiene:
3237424637302931304541383936323530252728304045
3535362932424341464245433237293135
a)Construyelatabladefrecuencias.
b) Si sabemos que los bebes que pesan menos de 3 kilos lo hacen prematuramente Qu
porcentajedeniosprematuroshannacidoentreestos40?
c)Normalmentelosniosquenacenprematurosquepesanmsde3kilosymediononecesitan
estarenincubadora.Puedesdecirqueporcentajedeniosestnenestasituacin?
d)Representagrficamentelainformacinrecibida.
8. EnunafincadevecinosdeBenicasim,serenenlacomunidaddevecinosparaversicontratanauna
personaparaquelesllevelacontabilidad.Elresultadodelavotacineselsiguiente:25vecinosa
favordelacontratacin,15vecinosencontray5vecinosseabstienen.Representalainformacin
medianteundiagramadesectores
9. Se toman ocho mediciones del dimetro interno de los anillos para los pistones del motor de un
automvil.Losdatosenmmson:
7400174003740157400074005740027400574004
Calculalamediaylamedianadeestosdatos. Calculatambinlavarianza,ladesviacintpicayel
rangodelamuestra.
10. Dadaladistribucindedatos38432384343384363843838440confrecuencias4,8,4,3,8,
hallalamediadeladistribucin.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
411
Estadstica
11. Ladistribucindelossalariosenlaindustriatursticaespaolaeslaquefiguraenlatabla.Calcula:
a) Elsalariomedioportrabajador(marcasdeclasedelltimointervalo20000
b) Elsalariomsfrecuente.
c) Elsalariotalquelamitaddelosrestantesseainferioral.
[li, Li[
ni
[0,1500[
2145
[1500,2000[
1520
[2000,2500[
840
[2500,3000[
955
[3000,3500[
1110
[3500,4000[
2342
[4000,5000[
610
[5000,10000[
328
10000
150
12. Calculalamediana,lamoda,primerytercercuartilynonagsimopercentildeladistribucin:
xi
ni
10
15
20
25
13. Sehandiseadodosunidadesgemelasdeplantaspilotosyhansidopuestasenfuncionamientoen
undeterminadoproceso.Losresultadosdelosdiezprimerosbalancesencadaunadelasunidades
hansidolossiguientes:
UnidadA97898910129881020990991100810091005
UnidadB9721005982983975999979968974972
a) Hazunarepresentacingrficadeestasmuestras.
b) Determinalasmediasylasvarianzas.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
412
Estadstica
14. En cierto barrio se ha encontrado que las familias residentes se han distribuido, segn su
composicindelaformasiguiente:
Composicin
Ndefamilias
02
110
24
200
46
90
68
75
810
25
a) Culeselnmeromediodepersonasporfamilia?
b) Culeseltamaodelafamiliamsfrecuente?
c) Sisolohubieraplazasdeaparcamientoparael75%delasfamiliasyestasseatendieran
porfamiliasdemayortamaoamenor,qucomponentestendraquetenerunafamilia
paraentrarenelcupo?
d) Nmerodemiembrosquetienencomomximoel85%delasfamilias.
15. Allanzar200vecesundadoseobtuvolasiguientedistribucindefrecuencias.
xi
ni
32
35
33
35
Hallalamedianaylamodadeladistribucin,sabiendoquelamediaaritmticaes36.
16. Lossiguientesdatossonmedidasdelacapacidadcranealdeungrupodehomnidos:
84,49,61,40,83,67,45,66,70,69,80,58,68,60,67,72,73,70,57,63,70,78,52,67,53,67,
75,61,70,81,76,79,75,76,58,31.
a) Calculalamediaylamedianamuestrales.
b) Hallaloscuartilesprimeroytercero.
c) Hallalospercentilescincuentaynoventa.
d) Calculaelrangomuestral.
e) Calculalavarianzamuestralyladesviacinestndarmuestral.
17. Lossiguientesdatosprocedendeunestudiodecontaminacindelaire.
6521444753264730498650494034564727242722525347
684153762421464330416142
a)Construyeunhistograma.
b)Determinaloscuartiles.
c)Calculalamediayladesviacintpica.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
413
Estadstica
2.ESTADSTICABIDIMENSIONAL
2.1.Introduccin
Ejemplo1:
Con el fin de hacer un estudio de aceptacin sobre dos modelos de impresoras 3D de reciente
fabricacin,seconsideraronelnmerodeventasefectuadoporundeterminadodistribuidordurante
25das.
ModeloA:
0222133334423333232422333
ModeloB:
2122311120111112211122221
En muchos procesos de la vida se hace necesario estudiar simultneamente dos caractersticas, dos
variables.Suestudioconjuntopermitedeterminarlasrelacionesentreellas.Supondremosinicialmente
que estamos observando dos variables aunque el tratamiento que se presenta se generaliza sin
dificultadacualquiernmerodevariables.
Notacin.
Continuandoconelejemplovamosallamar:
XnmerodeimpresorasdelmodeloAvendidasenunda.
YnmerodeimpresorasdelmodeloBvendidasenunda.
nnumerodeparesdeobservaciones.
xiCadadatodiferenteobservadoenlamuestradeX.
KnmerodevaloresdistintosdeX.
yjCadadatodiferenteobservadoenlamuestradeY.
hnmerodevaloresdistintosdeY.
2.2.Distribucindefrecuenciasconjuntas
Cuando queremos describir conjuntamente dos variables, el primer paso al igual que en el caso
univariante,serlarepresentacindelosdatosenunatabladefrecuencias.
Frecuenciaabsolutaconjunta(ni j)
NmerodevecesquesepresentaenlamuestraelvalorxidelavariableXconelvaloryjdelavariable
Y.
Ejemplo1:
Paraelpardevalores x1 =0,y3=2,n13 = 1
Propiedad:
Lasumadelasfrecuenciasabsolutasesigualan.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
414
Estadstica
Frecuenciarelativaconjunta
f ij
nij
n
Ejemplo1:
f13
1
0'04
25
Propiedad
Lasumadelasfrecuenciasrelativasesigualalaunidad.
Tabladefrecuenciasconjunta
Llamamosasaunatabladedobleentradadondeserepresentanenlaprimeracolumnalosdiferentes
valoresobservadosparalavariableXordenadosdemenoramayoryenlaprimerafilalosdiferentes
valores observados para la variable Y, y en el centro de la tabla sus correspondientes frecuencias
conjuntas,tantoabsolutascomorelativas.
Ejemplo1:
xi/yj
ni
f i
0/0
0/0
1/004
0/0
004
0/0
0/0
0/0
1/004
004
0/0
3/012
5/020
0/0
032
0/0
8/032
4/016
0/0
12
048
1/004
2/008
0/0
0/0
012
ni
13
10
25
f i
004
052
004
004
QuporcentajededasvenderemosunaimpresoradelmodeloAy3delmodeloB?
4%
QuporcentajededasvenderemosmsimpresorasdelmodeloBquedelmodeloA?
8%;004+004
NOTA:
En el caso en que las variables sean cualitativas la tabla de distribucin conjunta tambin recibe el
nombredetabladecontingencia.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
415
Estadstica
Ejemplosdetablasdecontingencia.
1.Sequiereestudiarelefectodetresfrmacoseneltratamientodeunaenfermedadinfecciosa.Para
ello se dispone de un grupo de pacientes infectados, distribuyndose al azar en tres grupos de
tratamiento.
TratamientoA
TratamientoB
TratamientoC
Total
Simejora
23
33
35
91
Nomejora
12
12
31
Total
35
40
47
122
Empeora
Estable
Mejora
Total
Parkinsonsenil
34
25
17
76
Alzheimer
47
18
71
Demenciavascular
50
23
75
131
66
25
222
Total
2.3.Distribucindefrecuenciasmarginales
Para distinguir las frecuencias de cada variable al estudiarlas aisladamente llamaremos frecuencias
marginales a las de cada variable por separado. De esta forma tendramos dos distribuciones
unidimensionalesapartirdelasconjuntas.
Frecuenciaabsolutamarginal
ParalaX (xi)seraelnmerodevecesqueserepiteelvalorxisintenerencuentalosvaloresdeY,la
representamosporni.
ParalaY(yj)seraelnmerodevecesqueserepiteelvaloryjsintenerencuentalosvaloresdelaX,la
representamospornj.
Nota:
1.Con las definiciones de media, desviacin tpica y varianza del apartado de distribuciones
unidimensionales,utilizandoparalaXlosvaloresxiyelnmerodevecesqueserepiteniyNelnmero
totaldeparesobservados,yparalaYlosvaloresyjyelnmerodevecesqueserepitenjyNelnmero
total de pares observados, calcularemos las medias marginales, desviaciones tpicas marginales y
varianzasmarginales.
2. Sinosfijamosbienpodemosrelacionarelnombredefrecuenciasmarginalesconelhechodeque
tantolosvaloresdelasvariables,xieyjcomolasvecesqueaparececadaunodeestosdatos,niynjlos
encontramosenlosmrgenesdelatabladedistribucinconjunta.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
416
Estadstica
Frecuenciasrelativasmarginales
Apartirdelasanteriores,ydelmismomodo,seconstruirnestasfrecuenciasfiyfj.
La distribucin de frecuencias marginales puede colocarse en una tabla separadamente. Pero si
deseamostenertodalainformacinenunamismatablaloquesesuelehacerescolocar:
En la ltima columna de la tabla conjunta, las frecuencias marginales de X es decir, ni,
aadiendotantascolumnascomootrostiposdefrecuenciasmarginalessedeseeaadir.
En la ltima fila de la tabla conjunta, las frecuencias marginales de Y, es decir, nj aadiendo
tantasfilascomootrostiposdefrecuenciasmarginalessedeseeaadir.
2.4.Distribucindefrecuenciascondicionadas
A partir de la distribucin de frecuencias conjuntas podemos definir otro tipo de distribuciones
unidimensionales,tantoparaXcomoparaY.Estasdistribucionesseobtendrnalfijarelvalordelaotra
variableyrecibenelnombrededistribucionescondicionadas.
Frecuencia absoluta condicionadaparaX(xi)dadoqueY(yj)eselnmerodevecesqueserepiteel
valor xiteniendoencuentasoloaquellosvaloresenqueY(yj);asesni(j) = nijparatodoi =1,2,,k.
Frecuencia absoluta condicionada para Y (yj) dado que X (xi) es el nmero de veces que se repite el
valoryjteniendoencuentasoloaquellosvaloresenqueX (xi);asesn(i)j = nijparatodoj=1,2,,h.
Enlasdistribucionescondicionadasnosesuelenutilizarlasdistribucionesabsolutas,puestoquecomo
sabemos, estas dependen del nmero de datos y el nmero de datos ser diferente para cada
distribucin,puesdependerdelafrecuenciadelvalorquefijamosdelaotravariable.Sonmuchoms
tileslasfrecuenciascondicionadasquesedefinen:
FrecuenciarelativacondicionadaparaXdadoqueY =yj es
fi ( j )
nij
nj
FrecuenciarelativacondicionadaparaYdadoqueX =xies
f (i ) j
nij
ni
Ejemplo:
DistribucindefrecuenciasdeXcondicionadaaY =1
xi
ni(2)
fi(2)
023
061
015
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
417
Estadstica
Nota:
Si la tabla resulta muy grande deberemos agrupar una o las dos variables en intervalos de clase del
mismo modo que lo hacamos en el apartado de una variable. En este caso todas las definiciones se
aplicantalcomolashemosvistoendichoapartado.
2.5.Independenciaestadstica
Definicin1:
Dos variables X e Y se dice que son independientes estadsticamente cuando la frecuencia relativa
conjuntaesigualalproductodelasfrecuenciasrelativasmarginales,esdecir,paratodoi,j:
f ij
nij
n
fi f j
ni n j
n n
Definicin2:
Dos variables X e Y se dicen que son independientes estadsticamente cuando todas las frecuencias
relativascondicionadassonigualesasuscorrespondientesfrecuenciasmarginales,esdecir:
fi(j)=fiparatodojyf(i)j = fjparatodoi.
2.6.Diagramadedispersin.Nubedepuntos
Se obtiene representando cada par observado (xi, yj), como un punto del plano cartesiano. Se utiliza
conlosdatossinagruparysobretodoparavariablescontinuas.Silosdatosestnagrupadossetoman
lasmarcasdeclase.Esmstilporquenospermitevervisualmentelarelacinentrelasdosvariables.
norelacin
relacinlinealdirecta
relacinlinealinversa
3,5
3,5
2,5
2,5
2,5
2
1,5
1,5
1,5
1
1
0,5
0,5
0,5
0
0
0
0
0
0
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
418
Estadstica
3.COVARIANZA
3.1.Ideacorrelacin.Covarianza
Alanalizardosvariablescuantitativasdeformaconjunta,elobjetivoquesepretendees,porlogeneral,
determinar si existe o no algn tipo de variacin conjunta o covarianza entre ellas: si una variable
aumenta,laotratambinolocontrario.
LacantidadsedenominacovarianzaSxyytienelasiguienteexpresin:
S xy
i j ( xi x ) ( yi y ) nij i j xi yi nij
xy
n
n
Ayudaaanalizarlacovarianzaentredosvariablesdelaformasiguiente:
Cuandoelresultadoespositivo,hayunatendenciaaqueamayoresobservacionesdeX
correspondanmayoresobservacionesdeY.
Porejemplo
Amayorcantidaddeaguadelluviaenunao,suelecorresponderunamejorcosecha.
Cuando el resultado es negativo, la tendencia resulta contraria; es decir a mayores
valoresdelavariableXsolemosencontrarmenoresvaloresdelavariableY.
Porejemplo,
Amayorrentapercpitaenlospasessueleencontrarseunamenormortalidadinfantil.
3.2.Coeficientecorrelacinlineal
El valor de la covarianza depender de los valores de las variables, por tanto de sus unidades. Para
podereliminarlasunidadesytenerunamedidaadimensionalutilizamoselcoeficientedecorrelacin
rxy:
rxy
S xy
sx s y
Siendotambininvariantefrenteatrasformacioneslineales(cambiodeorigenyescala)delasvariables.
Citamoslassiguientespropiedades:
Esuncoeficienteadimensional.
Tomavaloresentre1y1.
Sihayrelacinlinealpositivaelvalorserpositivoyprximoa1.
Sihayrelacinlinealnegativaelvalorsernegativoyprximoa1.
Sinohayrelacinelvalorseaproximaacero.
SiXeYsonindependienteelvalordelcoeficienteescero.Peronoalcontrario.Puedeocurrir
queelcoeficientedecorrelacinvalgaceroylasvariablesseandependientes.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
419
Estadstica
3.3.Rectaregresinlineal
EldiagramadedispersinonubedepuntosnospermitavisualizarlarelacinentredosvariablesXeY.
Alrepresentareldiagramadedispersinpodemosencontrarlassiguientessituaciones:
Distribuciones estadsticas para las que la nube de puntos se dispone de tal forma que existe
unafuncinmatemticacuyospuntossonunapartedesurepresentacingrfica.
Sincoincidirsuspuntosconlosdeunagrficadeunafuncinmatemtica,seaproximanaella
conmayoromenorintensidad.
Lanubedepuntospresentaunaspectotalquenoexisteconcentracindepuntoshacianinguna
graficamatemtica,distribuyndosedeunaformauniformeenunaregindelplano.
EnelprimercasosedicequeexisteunadependenciafuncionaloexactaentrelasvariablesXeY,es
decir existe una funcin matemtica tal que y = f(x). En el segundo caso se dice que existe una
dependencia estadstica o aproximada entre las dos variables, Y aproxima f(x). Y en el ltimo caso
decimosquelasvariablessonindependientes.
Eselsegundocasodelqueseocupalateoraderegresin.
Lastcnicasderegresintienenporobjetomodelar,esdecir,encontrarunafuncinqueaproximelo
mximoposiblelarelacindedependenciaestadsticaentrevariablesypredecirlosvaloresdeunade
ellas: Y (variable dependiente o explicada) a partir de los valores de la otra (u otras): X (variable
independienteoexplicativa).
LlamamosregresinYsobreXalafuncinqueexplicalavariableY(dependiente)paracadavalordela
X(independiente).
LlamamosregresindeXsobreYalafuncinqueexplicalavariableX(dependiente)paracadavalorde
laY(independiente).
Larectaderegresinqueestudiamosesunafuncinlinealporqueelmodelodefuncinderegresin
seleccionadoesunarecta.
RectaderegresinYsobreXesy = a + bxdonde a y bx yb =
S xy
sx 2
S xy
sy
Losvaloresdebybsonloscorrespondientescoeficientesderegresinparacadaunadelasrectas.
Hayquetenerencuentaquelarectaderegresindexsobreynoseobtienedespejandoxdelarecta
deregresindeysobrex.
3.4.Prediccinycausalidad
Elobjetivoltimodelarectaderegresineslaprediccindeunavariableparaunvalordeterminado
delaotra.LaprediccindeYparaX = x0,sersimplementeelvalorobtenidoenlarectaderegresin
deYsobreXalsustituirelvalordexporx0.
Esclaroquelafiabilidaddeestaprediccinsertantomayorcuantomayorsealacorrelacinentrelas
variables,esdecirmayorseaelvalorderxy.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
420
Estadstica
Actividadespropuestas
18. Losdatossiguientessonlascalificacionesobtenidasporlosestudiantesdeungrupode25de1de
bachilleratoenlasasignaturasdeMatemticasyLengua.
Matemticas
Lengua
Matemticas
10
Lengua
10
10
10
a) Escribelatabladefrecuenciasconjunta.
b) Proporcindeestudiantesqueobtienemsdeuncincoenambasasignaturas,proporcinde
estudiantesqueobtienemsdeuncincoenMatemticas,proporcinestudiantesqueobtiene
msdeuncincoenLengua.
c) SonindependienteslascalificacionesdeMatemticasyLengua?
d) Representagrficamente.
e) Calculaelcoeficientecorrelacin.
19. Pararealizarunestudiosobrelautilizacindeunaimpresoraenundeterminadodepartamento,se
midienundalosminutostranscurridosentrelassucesivasutilizacionesXyelnmerodepginas
impresasY,obtenindoselossiguientesresultados.
X
10
15
10
12
12
10
10
12
10
10
12
12
12
12
20
20
20
12
20
20
a) Escribeladistribucindefrecuenciasconjunta.Porcentajedevecesquetranscurrenmsde
nueveminutosdesdelaanteriorutilizacinyseimprimenmenosdedocepginas.Nmero
de veces que se imprimen menos de doce pginas y transcurren nueve minutos desde la
utilizacinanterior.
b) Frecuencias marginales. Veces que se imprimen como mucho doce pginas. Nmero de
pginasqueseimprimenenel80%delasocasiones.
c) Calculaladistribucindelnmerodepginasimpresascondicionadaaquehantranscurrido
nueveminutosentresucesivasutilizaciones.
d) Dibujaeldiagramadedispersin.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
421
Estadstica
20. Lasestaturasdelos30niosnacidosenunamaternidadduranteunasemanafueronlossiguientes:
Estatura 50
51
53
50
51
48
50
49
52
52
49
50
52
51
52
Peso
32
41
45
30
36
29
38
38
36
39
30
38
41
35
40
49
50
51
52
53
52
52
51
50
51
54
50
51
51
51
31
33
39
37
41
42
35
38
36
34
46
35
36
31
40
a) Construyeunatabladedobleentrada,agrupandolospesosenintervalosde05kg.
b) Eslaestaturaindependientedelpeso?
21. Enelexamendeunaasignaturaqueconstadepartetericayparteprctica,lascalificacionesde
nuevealumnosfueron:
Teora
Prctica
22. Se desea investigar el ganado caprino y el ganado ovino de un pas. En la tabla de doble entrada
adjunta se presentan los resultados de un estudio de 100 explotaciones ganaderas, seleccionadas
aleatoriamente del censo agropecuario. Se proporcionan las frecuencias conjuntas del nmero de
cabezas(enmiles)decabrasXyovejasYqueposeenlasexplotaciones.
X / Y
10
a) Hallalasmedias,varianzasydesviacionestpicasmarginales.
b) Hallaelnmeromediodeovejascondicionadoaqueenlaexplotacinhay2000cabras.
c) Hallaelnmeromediodecabrasquetienenaquellasexplotacionesquesabemosqueno
tienenovejas.
d) Hallalacovarianzayelcoeficientedecorrelacinentreambasvariables.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
422
Estadstica
23. Elvolumendeahorroylarentadelsectorfamiliasenmilloneseneurosconstantesde2005parael
periodo20052014fueron.
Aos
05
06
07
08
09
10
11
12
13
14
Ahorro
19
18
20
21
19
20
22
23
27
30
Renta
205
208
212
217
221
223
222
226
231
235
a) Rectaregresindelahorrosobrelarenta.
b) Rectaderegresindelarentasobreelahorro.
c) Paraelao2015sesuponequelarentaerade24.1millonesdeeuros.culserel
ahorroesperadoparaelao2015?
d) Estudiarlafiabilidaddelaprediccinanterior.
24. Semidieltiempoensegundosquetardaronengrabarselosmismos24ficherosenunlpizUSBX
yenundiscoduroexteriorY.
X
12
11
05
11
15
14
14
13
04
03
13
11
12
04
12
14
11
16
16
15
04
03
03
15
14
11
12
12
04
05
13
15
12
02
03
16
13
11
13
11
04
04
14
16
09
03
a) Construyelatabladefrecuenciasconjunta.Culeselporcentajedeficherosquetardan
menosde15segundosenelprimertipoymsde14enelsegundo?Cuntosficheros
tardan en grabarse entre 06 y 12 segundos en el primer tipo de memoria? Cunto
tiempotardancomomuchoengravarsealmenosel90%delosficherosenelsegundo
tipodememoria?
b) Hallalatabladefrecuenciascondicionadasdelostiemposdelsegundotipodememoria
de aquellos programas que tardaron 12 en el primer tipo de memoria. Cul es la
proporcin de estos programas que tardan en grabarse ms de 15 segundos en el
segundotipodememoria?
c) Representagrficamentelosdatosycomentaelresultadoobtenido.
d) Si un fichero tarda 08 segundos en grabarse en el primer tipo de memoria, cuantos
segundos tardara en grabarse en el segundo tipo? Dar una medida de fiabilidad.
Confirmaestamedidalocomentadoenelapartadoc)?
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
423
Estadstica
25. Deunmuellesecuelganpesosyobtenemoslosalargamientossiguientes.
PesogrX
10
30
60
90
120
150
200
250
350
AlargamientocmY
05
65
102
125
18
EncuentralarectaderegresindeYsobreXyestimaelalargamientoqueseconseguirconpesosde
100y500gr.Culdelasdosestimacionesesmsfiable?
26. La tabla siguiente muestra el nmero de grmenes patgenos por centmetro cubico de un
determinadocultivosegneltiempotranscurrido.
Nmerodehoras
Nmerodegrmenes
20
26
33
41
47
53
22
27
33
50
Altura:m
17
14
12
11
a) Encuentraelcoeficientecorrelacinentreeltiempoylaaltura.Daunainterpretacindel.
b) Qualturasealcanzaracuandohayantranscurrido40horas?
c) Cuandolaalturaalcanza2msuenaunaalarma.Cuntotiempotienequepasarparaquesuene
laalarma?
28. LaevolucindelIPC(ndicedepreciosalconsumo)ylatasadeinflacinenlosmesesindicadosde
undeterminadoao,vaser:
Enero
Febrero
Marzo
Abril
Mayo
Junio
IPC
07
11
17
19
19
Tasainflacin
63
62
58
49
a) Representalanubedepuntos.
b) CalculaelcoeficientedecorrelacinentreelIPCylatasadeinflacin.
c) SepuedeestimarlatasadeinflacinapartirdelIPC?
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
424
Estadstica
CURIOSIDADES.REVISTA
ELEFECTOPLACEBOYELEFECTONOCEBO
Antesdequeunmedicamentopuedacomercializarsedebesuperaruna
serie de estrictas pruebas que arrojen seguridad acerca de su eficacia
curativa.
Unadelaspruebasmscomunesconsisteenseleccionarunamuestra
deenfermosydividirlosaleatoriamenteendosgrupos;ungruporecibe
elmedicamento,yelotro,sinsaberlo,unasustanciaenaparienciaigual,
perosinningnpoderteraputico:unplacebo.
De esta forma, al final del ensayo pueden compararse los resultados
entrelosdosgruposydeterminarlaeficaciadelmedicamento.Paraello
seempleanherramientasestadsticascomolacorrelacin.
Sorprendentemente, hay un nmero significativo de pacientes que,
habiendo recibido el placebo, mejoran de forma ostensible. Por
ejemplo, esta contrastado que, en muchas enfermedadesrelacionadas
con el dolor, entre el 10 % y el 15 % de los pacientes experimenta un
alivio notable habiendo seguido un tratamiento exclusivamente de
placebo.
RELACIONFUNCIONAL CORRELACIN
Silanzamosunapiedrahaciaarriballegarmsaltocuandomsfuertesea
lanzada.Existeunafrmulaquenospermitecalcular,exactamentelaaltura
conseguidaenfuncindelavelocidadconqueeslanzada.Estamosanteuna
relacinfuncional.
Laspersonas,engeneral,pesanmscuandomsaltosson.Peronosepuede
darunafrmulaquenospermitadarelpesodeunapersonaconexactitud
conociendosualtura,slopodremosconseguirunafrmulaquenosdun
valoraproximadoyconocerlaeficaciadeesafrmula.Larelacinentrelas
variables pesoestatura es una relacin estadstica. Diremos que hay una
correlacinentreestasvariables.
Tambinvamosaencontrarcorrelacinentreladistanciaaqueunjugador
debaloncestosecolocadelacestayelnmerodecestasqueconsigue.Pero
enestecaso,alcontrariodelanterior,hayunacorrelacinnegativa,yaquea
msdistancia,menornmerodecestas.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
425
Estadstica
CONTRALASUPERSTICIN,ESTADSTICA
Vivimosenunmundodominadoporlacienciaylatecnologa,a
pesardeellolassupersticionesylascreenciasseudocientficas
siguendominandoentrelapoblacingeneral,inclusomsque
en otras pocas. La Estadstica es un arma importante para
desenmascarar algunas afirmaciones que circulan
impunementeyquemuchagentecree,comolasderivadasde
la astrologa. Existen cientos de estudios que prueban que
aunque existan coincidencias entre el signo astrolgico de las
personas y sus formas de ser, gustos, comportamientos,
profesiones, etc. stas estn siempre en torno a la media
estadstica.
Unacreenciamuyhabitualesquelosnacimientosseproducen
con mayor frecuencia durante los das, y especialmente las
noches, de luna llena. Resultara sencillo coger los registros
civiles y comprobar si eso es verdad, pero los que afirman
semejantedatonuncasemolestanenhacerlo.Recientemente
sehapuestodemanifiestomedianteelanlisisdelosdatosde
un conjunto de estudios al respecto que las variaciones de
nacimientos entre fases lunares son de apenas un 1 %, sin
embargo tambin el mismo estudio ha puesto de manifiesto
que el 60 % de los nacimientos se producen entre las 6 de la
maana y las seis de la tarde, mostrando as una diferencia
mucho ms significativa que suele tener su explicacin en la
organizacindeloshospitales.
Estadstica
El nombre de Estadstica proviene del s. XIX, sin embargo ya se
utilizaban representaciones grficas y otras medidas en pieles,
rocas, palos de madera y paredes de cuevas para controlar el
nmero de personas, animales o ciertas mercancas desde la
Prehistoria. Los babilonios usaban ya envases de arcilla para
recopilar datos sobre la produccin agrcola. Los egipcios
analizabanlosdatosdelapoblacinylarentadelpasmuchoantes
de construir las pirmides. Los antiguos griegos realizaban censos
cuyainformacinseutilizabahacia600aC.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
426
Estadstica
RESUMEN
Histograma
Ejemplos
Representacingrficadelosdatosagrupadosenintervalos.
Media
aritmtica
Mediana
Moda
k
i xi ni
xi f i
n
i 1
0 21 42 21315465161 126
2'52
50
50
Valortalqueenladistribucinhaytantosdatosmenores
quelcomomayoresquel.
Datoconmayorfrecuencia,elquemsvecesserepite.
Varianza
xi x
n
s 2 i 1
Desviacintpica
Covarianza
Coeficiente
correlacin
Dependencia
lineal
2
xi fi
n
i 1
x2
s= Varianza
S xy
i j ( xi x ) ( yi y ) nij i j xi yi nij
xy
n
n
rxy
S xy
sx s y
1r1
r =1dependenciafuncionallinealnegativa
1<r<0dependencianegativa
r=0noexistedependencialineal,nifuncional
0< r<1dependenciapositiva
r=1dependenciafuncionallinealpositiva
Rectaregresin
YsobreX
y y
S xy
sx
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
(x x)
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
427
Estadstica
EJERCICIOSYPROBLEMAS
Estadsticadescriptivaunidimensional
1. Seconoceelvolumensemanalderesiduosslidosrecogidosenm3durante10semanas,en
unmunicipiopequeo:
25'5,27'1,31'8,34'2,38'9,21'3,28'7,33'2,36'5,39'6
Calcula:
a) Lasmedidasdecentralizacin:lamedia,mediana,moda
b) Las medidas de dispersin: desviacin tpica, varianza, coeficiente de variacin, valor mnimo,
valormximo,recorrido,primercuartil,tercercuartileintervalointercuartlico.
c) Haz una representacin grfica en serie temporal, que permita observar tendencias, ciclos y
fluctuaciones. Recuerda que en una serie temporal, en el eje de abscisas est el tiempo de
observacinyenelejedeordenadaslamagnituddeobservacin.
2. Unacompaadesegurosdeseaestablecerunaplizadeaccidentes.Paraello,seleccionaal
azar a 100 propietarios y les pregunta cuntos euros han gastado en reparaciones del
automvil.Sehanagrupadoenintervaloslosvaloresdelavariableobtenidos:
Euros
Nmerodepersonas
20
10
20
20
[800,3000)
10
a) Calcula las marcas de clase y escribe en tu cuaderno una tabla de frecuencias absolutas,
frecuenciasrelativas,frecuenciasacumuladasabsolutasyfrecuenciasrelativasacumuladas.
b) Representalosdatosenundiagramadebarras,otrodelneasyunodesectores.
c) Representaunhistogramadefrecuenciasrelativas.Cuidado:Losintervalosnosontodosiguales.
d) Calculalamediayladesviacintpica.
e) Calculalamedianayloscuartiles.
3. Sehapreguntadoa40alumnosporelnmerodehermanosquetena,ysehaobtenido
Nmerodehermanos
6oms
Nmerodeveces
15
6oms
Nmerodeveces
19
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
428
Estadstica
Utilizaunahojadeclculoconelordenador
Seconoceelvolumensemanalderesiduosslidosrecogidosenm3durantelas52semanasdeunao,
enunmunicipiopequeo:
25'5,27'1,31'8,34'2,38'9,21'3,28'7,33'2,36'5,39'6,25'2,24'7,23'2,23'3,22'2,26'4,26'7,29'6,31'3,
30'5,28'3,29'1,26'7,25'2,24'5,23'7,25'4,27'2,31'7,34'5,38'4,21'2,28'1,33'7,36'8,39'9,31'7,34'4,
38'2,21'9,28'1,33'5,25'2,24'7,23'2,23'3,22'2,26'4,25'9,24'1,23'2,23'6,26'4.
Calcula,utilizandoExceluotrahojadeclculo:
5. Parmetrosestadsticos
a) Lasmedidasdecentralizacin:lamedia,mediana,moda
b) Lasmedidasdedispersin:desviacintpica,varianza,coeficientedevariacin,valormnimo,valor
mximo,recorrido,primercuartil,tercercuartileintervalointercuartlico.
c) Otroscoeficientes:coeficientedeasimetraycoeficientedecurtosisqueencuentres.Investigalas
posibilidadesdelordenadorparaobtenerparmetrosestadsticos.
d) Haz una representacin grfica en serie temporal, que permita observar tendencias, ciclos y
fluctuaciones. Recuerda que en una serie temporal, en el eje de abscisas est el tiempo de
observacinyenelejedeordenadaslamagnituddeobservacin.
Paraello,escribeenlacasillaA12,1,enA13,2,yarrastraparaescribirelordendelassemanas,hasta
queaparezcael52.EscribeenlacolumnaBelvolumenrecogidocadasemana.
EnlacasillaA11unttulo,porejemplo,Residuosslidos.
En la casilla C12 escribe Media, y en la casilla D12 calclala usando la funcin PROMEDIO. De igual
formacalculalosotrosparmetros.
Observauntrozodepantallaconalgunosresultados:
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
429
Estadstica
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
430
Estadstica
Estadsticadescriptivabidimensional
9. Enunamuestrade10personasmiramossucolordeojosypeloyencontramosquehay5
morenosdeojosmarrones,1morenodeojosverdes,3rubiosdeojosazulesy1rubiode
ojosverdes.A)Representaenunatabladedobleentradaestasituacin.B)Escribelatabla
de frecuencias relativas. C) Escribe las frecuencias absolutas y relativas marginales. D)
Escribeladistribucindefrecienciascondicionadas.
10. Lolahacalculadoloscoeficientesdecorrelacindelastresnubesdepuntosadjuntas,yha
obtenido:08,085y003,peroahoranorecuerdaculesdecadauna.Puedesayudara
decidirqucoeficientecorrespondeconcadanube?
A
10
10
0
0 1 2 3 4 5 6 7 8 9 10
14
12
10
4
2
0
2 3 4 5 6 7 8 9 10
2 3 4 5 6 7 8 9 10
11. Enunatiendaquierenestudiarlasventasdelpandemoldeenfuncindelprecio.Paraello
pruebancadasemanaconunpreciodistintoycalculanlasventasrealizadas.Hanobtenido
lossiguientesdatos:
Precio(euros)
05
07
12
13
Ventas(medias)
15
17
18
a) Representalosdatosenundiagramadedispersin(nubedepuntos)eindicaaquconclusiones
creesquesevaallegar.
b) Calculalacovarianza,elcoeficientedecorrelacinylarectaderegresin.
c) Decidenponerunpreciode14euros,culesopinasqueseranlasventasmediassemanales?
12. Preguntamosa10estudiantesde1deBachilleratoporsuscalificacionesenMatemticas,
porelnmerodeminutosdiariosquevenlatelevisin,porelnmerodehorassemanales
quededicanalestudio,yporsuestaturaencentmetros.Losdatosserecogenenlatabla
adjunta.
CalificacionesdeMatemticas
10
3
8
8
5
10
10
8
5
8
MinutosdiariosquevelaTV
0
90
30
20
70
10
0
20
60
30
Horassemanalesdeestudio
15
0
10
10
10
15
15
10
5
5
Estatura(encm)
175 166 155 161 161 177 182 177 167 172
Queremos estudiar la relacin entre las calificaciones de Matemticas y las otras tres variables. Para
ello dibuja los diagramas de dispersin, y calcula los coeficientes de correlacin y las rectas de
regresin.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
431
Estadstica
13. UnacompaaarearealizaunestudiosobrelarelacinentrelasvariablesX,tiempodeun
vuelo,enhoras;eY,consumodecombustible(gasleo)paradichovuelo,enlitros,ysehan
obtenidolossiguientesdatos.
X(horas)
05
Y(litros) 2250
15
25
3950
5400
7300
8500
10300
a) Representalosdatosenundiagramadedispersin.
b) Calculalacovarianzayelcoeficientedecorrelacinentreambasvariables.Interpretalosresultados.
c) Calculalaecuacindelasrectasderegresin.
14. Haz un trabajo. Pasa una encuesta a tus compaeros y compaeras de clase. Elige una
muestra de 10 personas y hazles dos preguntas con datos numricos, como por ejemplo,
cuntomidesumano,qunmerodezapatocalza,elnmerodelibrosqueleeenunmes,
el nmero de horas que ve la televisin a la semana, dinero que gasta al mes en comprar
msica, la calificacin en Matemticas de su ltimo examen Representa los datos
obtenidos en una tabla de doble entrada. Haz un estudio completo. Puedes utilizar el
ordenador:
a) Escribe en tu cuaderno una tabla de doble entrada de frecuencias absolutas, frecuencias
relativas.Obtnlasdistribucionesmarginalesycondicionadas.
b) Conlasdistribucionesunidimensionales,dibujalosdiagramasdebarras,diagramasdelneasy
diagramas de sectores. Calcula las medias, medianas y modas. Calcula las varianzas y las
desviacionestpicas.Calculaloscuartilesylosintervalosintercuartlicos.
c) Con las distribuciones bidimensionales, dibuja un diagrama de dispersin, y calcula la
covarianza,elcoeficientedecorrelacinylarectaderegresin.
d) Reflexionasobrelosresultadosyescribeuninforme.
Utilizaunahojadeclculoconunordenador
15. Elobjetivodeestaprcticaesestudiarladispersinentredosvariables,medianteunanube
depuntosodiagramadedispersin,elcoeficientedecorrelacinylarectaderegresin.
En10pasesseanotanlosingresosmedios,eneuros,porhabitanteyao,yelporcentajemedioenlos
residuosslidosdecomida.
Seobtiene:
xi() 750
yi(%) 85
65
30
20
25
45
70
40
50
a) Abreunahojadeclculo.Copialosdatos.Calculalamediayladesviacintpicadelasx,ylamedia
yladesviacintpicadelasy.
b) Representa la nube de puntos. Selecciona los datos,
incluyendo a las medias. Aprieta el botn de asistente
de grficos y elige XY (Dispersin). En ttulos escribe
como Ttulo del grfico Correlacin, en Eje de valores
(X) describe la variable x sin olvidar decir las unidades,
escribe: Ingresos/habitante (), en Eje de valores (Y)
describe la variable y sin olvidar decir las unidades,
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
432
Estadstica
escribe:PorcentajederesiduosdecomidaenlosRSU(%).EnLeyendaeligenomostrarleyenda.
c) Observaquesix x ey y tienenelmismosignoquedanenloscuadrantesIyIIIysilotienen
distintoenIIyIV.CuentalospuntosquequedanenloscuadrantesIyIII,cuentalosquequedanen
loscuadrantesIIyIV.Nospuededarunaideadelacorrelacin.Vaaserpositivaonegativa?Es
unacorrelacinfuerteodbil?Entrequevalorespuedevariarelcoeficientedecorrelacin?Estima
aojounvalorparaesacorrelacin.
d) OrganizaenExcelunahojadeclculoquetepermitacalcularlacorrelacin.Escribelosdatosenlas
filas 3 y 4. En L3 y L4 calcula las medias utilizando la funcin PROMEDIO. En M3 y M4 calcula la
desviacin tpica utilizando la funcin DESVEST. En N3 calcula el coeficiente de correlacin,
utilizandolafuncin:
COEF.DE.CORREL(B3:K3;B4:K4)
e) Ahoravamosamejorarnuestrogrfico.Observaquesicolocasalratnencimadeunpuntoindica
lascoordenadas.Trazalasrectasx= x ,y= y queindicanlasmedias.Utilizaparaellolapaletade
dibujo.Dibjalasencolorrojo.
f) Larectaderegresineslarectaquehacemnimaslasdistanciasdelanubedepuntos.Eslarecta:y
s
= y + y (x x ).CalculaenN4lapendientedelarecta.Escribelaecuacindelarecta.Observael
sx
grfico.Cmolahabrasestimadoaojo?Evalalapendienteylaordenadaenelorigen.
16. Serecogeenunatablalaaltura(enmetros)deunpadreydeladesuhijocon15aosde
edad.
Padre
17
16
17
165
19
19
181
Hijo
175
19
17
18
16
188
195
a)Utilizaelordenadorpara
representareldiagramade
dispersin. Copia los datos
en una hoja de clculo en
las columnas A y B. Seala
las dos series y elige
insertar
grfico
de
dispersin. Automticamente vers que aparece el
diagramadedispersin(nubedepuntos).Juegaconlas
opciones para modificar el ttulo, el formato, la escala
delosejes
b)Dibujalarectaderegresin.Pinchasobreunpuntodelanube,
yeligeAgregarlneadetendencia.Paraquedibujeelordenador
la recta de regresin la lnea de tendencia debe ser Lineal. En la
pantalla que aparece marcamos la casilla que dice: Presentar
ecuacinenelgrficoylacasillaquedicePresentarelvalordeR
cuadrado en el grfico. Al final, si lo has hecho bien, el dibujo
debesermsomenosalgosimilaraesto:
c) Utiliza la recta para determinar que altura del hijo
corresponderaaunaalturadelpadrede175m.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
2,5
1,5
0,5
0
1,5
1,6
1,7
1,8
1,9
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF
433
Estadstica
AUTOEVALUACIN
1. Realizamosunapruebaa20aspirantesaunpuestodegrabadorconsistenteenundictadocon
cierto tiempo de duracin (en minutos) y luego contar el nmero de errores cometidos al
transcribirloaordenador.Losresultadosfueron.
Tiempo 7 6 5 4 5 8 7 8 9 6 5 8 6 8 7 8 7 6 6 9
Errores 8
10 9
10 8
10 8
a)
b)
c)
d)
Construyelatablafrecuenciasconjuntaylastablasfrecuenciasmarginales.
Calculamedia,mediana,moda,varianza,desviacintpicaparalasvariablesmarginales.
Calculaelrecorridoparalasvariablesmarginalesylacovarianza.
Nmeromediodeerrorescondicionadoauntiempodedictadode6minutos.Porcentaje
aspirantesquecometenmenosde8erroresdeentrelosquesonsometidosaundictadode
msde6minutos.
e) Calculalarectaderegresinlinealdeltiemposobreelnmerodeerroresy,alavistadeella,
explicaladependenciaoindependenciadelasvariables.
2. Lasiguientetablamuestralatalladecalzadoylospesosde55estudiantes.
Talla
39 40 40 40 41 41 41 41 42 42 42 42 43 43 44
Peso
55
Nestudiantes 1
60
65
70
60
65
70
85
65
70
75
80
65
75
85
a) Calculalatabladefrecuenciasconjunta.
b) Sonindependienteselpesoylatalla?Calculalacovarianzaylarectaderegresin.
3. Dada la siguiente tabla de frecuencias conjunta, calcular el valor de a sabiendo que la media
condicionadadeYdadoX =1es3/5.
X/Y
0
1
1
4. LospreciosdiariosdelasaccionesXeYvaran,demaneraqueseestudianconjuntamenteesas
dosvariablesdurante10das,ysecalculanlosparmetros.
Media
Desviacin tpica
X
157
31
82
19
Covarianza095.
a) SiconocemoselvalordelaaccinXconanterioridadalvalordeY,calculalarectaderegresinque
permitaobtenerunaestimacindelpreciodeY,unavezconocidoelvalordeX.
b) Sera til usar este caso concreto de regresin lineal para predecir el valor de Y y aprovechar la
prediccinparatomardecisiones?Porqu?
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica
LibrosMareaVerde.tk
www.apuntesmareaverde.org.es
Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF