You are on page 1of 13

INFERENCIA ESTAD ISTICA

4.1. Introduccin o

4.2.

Muestreos

Ya sabemos que una poblacin es el conjunto de individuos sobre los que hacemos cierto estudio, y o que una muestra es un subconjunto de la poblacin. Es evidente que los resultados de una determinada o encuesta tendrn un mayor grado de abilidad si dicha encuesta se realiza sobre la poblacin completa. a o Sin embargo, en la mayor de las ocasiones esto no es posible, debido a mltiples razones: a u * Imposibilidad material (Hacer una encuesta a los casi 41 millones de espaoles es imposible,hacer n un estudio sobre la fecha de caducidad de un producto. Si lo hacemos con todos los productos qu vene demos luego?) * Imposibilidad temporal (Hacer un estudio sobre la duracin de una bombilla. Cunto debemos o a esperar para saberlo?). Por tanto, es habitual que tengamos que manejarnos con muestras, de modo que es importante saber elegir bien una muestra de la poblacin, una muestra que represente bien a dicha pbolacin. o o Hay muchas maneras de elegir una muestra de una poblacin. o Antes de pasar a analizar dichas formas de extraccin de muestras, lo que si hemos de dejar claro o es que todas las muestras han de cumplir varias condiciones indispensables. Es evidente que para que el estudio a realizar sea able, hay que cuidar mucho la eleccin de o la muestra, para que represente en la medida de lo posible a la poblacin de la que se extrae. Si la o muestra est mal elegida, diremos que no es representativa. a En este caso, se pueden producir errores imprevistos e incontrolados. Dichos errores se denominan sesgos y diremos que la muestra est sesgada. a Una de las condiciones para que una muestra sea representativa es que el muestreo (o sistema para elegir una muestra de una poblacin) que se haga sea aleatorio, es decir, todas las personas de o

ww w.

at

em

at

ic

a1

Inferir: Sacar una consecuencia de una cosa. Sacar consecuencia o deducir una cosa de otra. La estad stica, ciencia o rama de las Matemticas que se ocupa de recoger datos, analizarlos y a organizarlos, y de realizar las predicciones que sobre esos datos puedan deducirse, tiene dos vertientes bsicas: a a) Estad stica descriptiva: Bsicamente se ocupa de la 1 parte, es decir, a partir de ciertos datos, a analizarlos y organizarlos. Es aqu donde tiene sentido calcular la media, mediana, moda, desviacin o media, desviacin t o pica, etc. b) Estad stica inferencial: Se ocupa de predecir, sacar conclusiones, para una poblacin tomando o como base una muestra (es decir , una parte) de dicha poblacin. Como todas las predicciones, siempre o han de hacerse bajo un cierto grado de abilidad o conanza. Ser esta ultima vertiente de la estad a stica la que estudiemos en este tema.

.c om

la poblacin tengan las mismas posibilidades de ser elegidas, mientras que si la eleccin de la muestra o o es subjetiva, es probable que resulte sesgada. Las distintas maneras de elegir una muestra de una poblacin se denominan muestreos. Bsicamente o a hay dos tipos de muestreos: 1. Muestreo no probabilstico: El investigador no elige la muestra al azar, sino mediante determi nados criterios subjetivos. 2. Muestreo probabilstico: Cuando la muestra se elige al azar. En este caso podemos distinguir varios tipos: a) Muestreo aleatorio simple: Aquel en el que cada individuo de la poblacin tiene las mismas o posibilidades de salir en la muestra.

b) Muestreo sistemtico: En el que se elige un individuo al azar y a partir de l, a intervalos a e constantes, se eligen los dems hasta completar la muestra. a c) Muestreo estraticado: En este muestreo se divide la poblacin en clases o estratos y se o escoge, aleatoriamente, un nmero de individuos de cada estrato proporcional al nmero u u de componentes de cada estrato. d ) Muestreo por conglomerados:Si no disponemos de la relacin de los elementos de la poblao cin, o de los posibles estratos, no podemos aplicar los muestreos anteriores. o Aqu entra el llamado muestreo por conglomerados, donde en lugar de elegir individuos directamente, se eligen unidades ms amplias donde se clasican los elementos de la poblaa cin, llamados conglomerados. En cada etapa del muestreo en lugar de seleccionar elementos o al azar seleccionamos conglomerados. Los conglomerados deben ser tan heterogneos como la poblacin a estudiar, para que la e o represente bien. Luego se elegir algunos de los conglomerados al azar, y dentro de stos, an e analizar todos sus elementos o tomar una muestra aleatoria simple. No debemos confundir estrato y conglomerado. Un estrato es homogneo (sus elementos e tienen las mismas caracter sticas), mientras que un conglomeardo es heterogneo (debe e representar bien a la poblacin). o Veamos la diferencia de estos muestreos mediante un ejemplo: Imaginemos que hemos de recoger una muestra de 20 alumnos de entre los de un instituto de 600. 1 -Muestreo aleatorio simple: Elegir amos un alumno al azar (probabilidad de elegirlo 600 . Lo de1 volvemos a la poblacin y se elige otro (probabilidad de elegirlo 600 ), y as hasta 20. Notemos que o a 1 si no devolvisemos al alumno, entonces, la probabilidad de escoger al 2 alumno ser 599 , y ya no e todos tendr la misma probabilidad de ser elegidos. El problema es que entonces permitimos que se an puedan repetir individuos. -Muestreo sistemtico: Como hemos de elegir 20 alumnos de 600, es decir, 1 de cada 30, se procede a as Se ordenan los alumnos y se numeran, se elige uno al azar, por ejemplo el alumno 27, y luego los : dems se eligen a partir de este a intervalos de 30 alumnos. Escoger a amos por tanto a los alumnos: 27,57,87,117,147,177,207,237,267,297,327,357,387,417,447,477,507,537,567,597 y el alumno 627 ya es otra vez el 27. -Muestreo estraticado: Si queremos que la muestra sea representativa, lo mejor ser conocer a cuntos alumnos de cada curso hay, es decir, si hay 200 alumnos de 3 ESO, 150 de 4 ESO, 150 de a amos: 1 Bachillerato y 100 de 2 Bachillerato, proceder Como de 600 en total hemos de elegir a 20, de 200 de 3 de ESO hemos de elegir x: x 4000 20 = x = = 6 6 7 alumnos de 3 600 200 600

ww w.

at

em

at

ic

a1

.c

om

(Utilizando la regla de tres) De igual manera podemos calcular los alumnos correspondientes a los dems cursos: a y 3000 20 = y = = 5 alumnos de 4 600 150 600 z 3000 20 = z = = 5 alumnos de 1 600 150 600 t 2000 20 = t = = 3 3 alumnos de 2 600 100 600 De modo que en nuestra muestra de 20, 7 alumnos son de 3, 5 de 4, 5 de 1 y 3 de 2. Para la eleccin de cada alumno dentro de cada curso, utilizamos el muestreo aleatorio simple. o -Muestreo por conglomerados: Para ver este muestreo, hemos de cambiar el ejemplo. Supongamos que queremos extraer una muestra aleatoria de los estudiantes universitarios del pa s. Necesitariamos una lista con todos ellos para poder realizar alg n muestreo del tipo de los 3 anteriores, u lo cul es muy dif de conseguir. Sin embargo, los estudiantes estan clasicados por Universidades, a cil Facultades y Clases. Podemos seleccionar en una primera etapa algunas Universidades, despus algunas facultades al e azar, dentro de las facultades algunas clases y dentro de las clases, algunos estudiantes por muestreo aleatorio simple. Los conglomerados en cada etapa ser las diferentes Universidades, las diferentes an facultades y los diferentes clases. Como vemos los conglomerados son unidades amplias y heterogneas. e Ejercicio: En una poblacin de 1500 jvenes,7500 adultos y 1000 ancianos, se hace una encuesta a 200 personas o o para conocer sus actividades de ocio preferidas. Si se utiliza un muestreo estraticado, qu tama o e n muestral corresponde a cada estrato?.

4.3.

Estimacin por puntos o

Como el objetivo principal de la estad stica inferencial es el estudio de la poblacin y realizar o predicciones a cerca de ella pero a partir de una muestra de ella , no de la poblacin entera, en o principio, tendremos que estimar los ndices de la poblacin a partir de los o ndices correspondientes para la muestra. En una primera aproximacin, parece lgico pensar que si queremos determinar la media de una o o cierta poblacin, si hemos cogido una muestra representativa de dicha poblacin, la media de la muestra o o (que es fcilmente calculable porque tenemos los datos) ser muy parecida a la de la poblacin y por a a o tanto sirva para estimarla. Distinguiremos, por tanto, entre: 1. Parmetros poblacionales: Que son los a ndices centrales y de dispersin que denen a una poo blacin. o Representaremos la media poblacional y la desviacin t o pica poblacional . En el caso de proporciones, la proporcin de poblacin que tiene una determinada caracter o o stica la denotaremos por p y la proporcin que no la cumple por q = 1 p. (Como en la Distribucin o o binomial) 2. Estadsticos poblacionales: Son los ndices centrales y de dis persin que denen a una muestra. o o pica muestral por s. Representaremos la media muestral por x y la desviacin t En el caso de proporciones, la proporcin de muestra que tiene una determinada caracter o stica la denotaremos por p y la proporcin que no la cumple por q = 1 p. o

ww w.

at

em

at ic

a1

.c

om

Cul es el problema de la estimacin entonces?. Como vamos a disponer de una muestra, lo que a o podemos calcular es x y s (o bien p y q ), y a partir de estos intentar estimar quienes tienen que ser y (o bien p y q), los reales para la poblacin. o En la estimacin por puntos, el conocimiento de un estad o stico muestral nos permitir decidir cul a a es el correspondiente parmetro de la pobla cin. Para ello hemos de conocer cul es la relacin entre a o a o un estad stico y el corresp ondiente parmetro. a

4.4.

Distribucin muestral de medias o

Si tenemos una poblacin de parmetros desconocidos y , y tomamos una muestra, podemos o a a o calcular la media muestral,x1, que tendr cierta relacin con . Podr amos tomar otra muestra, de igual tamao, y calcular de nuevo su media muestral x2 , que n tambin estar relacionada con . e a As sucesivamente, considerando varias muestras y haciendo las medias muestrales respectivas, tenemos una serie de medias, relacionadas de alguna manera con cmo?. De la siguiente forma: o Propiedad: Si la poblacin sigue una distribucin normal N (, ), donde y son desconocidos, si o o elegimos todas las muestras de cierto tama o (n) , de forma que sean representativas, entonces: n a) La media de las medias muestrales de todas las muestras posibles, es igual a la media poblacional, es decir: x1 + x2 + . . . + xk = x= k b) La desviacin t o pica de las medias muestrales posibles es:

donde es la desviacin t o pica poblacional y n es el tamao de las muestras. n Conclusin: Las medias de las muestras de tama o n extra o n das de una poblacin de parmetros y o a , siguen una distribucin: o X N , n siempre que dichas muestras tengan un tamao n 30. n Notas importantes: a) Este resultado es consecuencia del Teorema Central del lmite. b) Si la poblacin es normal, el resultado se cumple para muestras de CUALQUIER tama o o n (incluso menor que 30). c) Si es desconocida, el mismo resultado sigue siendo cierto sustituyendo en la frmula por s. o Ejemplo: La altura de los estudiantes de una poblacin se distribuye segn una normal de media 167 o u y desviacin t o pica 32. a) Calcula la probabilidad de que un estudiante mida menos de 165 cm. b) Se toma una muestra de 10 estudiantes. Calcula la probabilidad de que la media muestral sea menor que 165 cm. En el apartado a) , manejamos la variable X N (165; 3 2) siendo X= altura de un estudiante.

ww w.

at

em

at ic
sx = n

a1

.c

om

La probabilidad pedida ser: a p(X < 165) = p 165 167 X 167 < 32 32 = p(Z < 0 63) = 0 2676

En el apartado b), la variable que manejamos ya no es X, sino que tenemos una muestra de 10 estudiantes. Como la poblacin inicial es normal, podemos aplicar el resultado anterior aunque la o muestra sea de tama o menor que 30. As la variable a estudiar es n , X=media de las alturas de 10 estudiantes, que segn lo dicho, sigue una distribucin u o X N Nos piden: p(X < 165) = p 165 167 X 167 < 1 012 1 012 = p(Z < 1 97) = 0 0244 32 165; 10 = N (165; 1 012)

a) Como las muestras son de tama o n=25 y la poblacin es normal N (142 32; 8 5), las medias muesn o trales siguen una distribucin: o X N b) Nos piden:

em

w.

M at

85 142 32; 25

c) Si las muestras son de tamao n=100, las medias muestrales siguen una distribucin: n o X N y por tanto: p(X 144 6) = p Z 144 6 144 32 0 85 = p(Z 2 68) = 1 p(Z 2 68) = 0 0037 85 142 32; 100 = N (142 32; 0 85)

Ejercicio: Una mquina ha fabricado piezas de precisin con un peso medio de 150 gr. y una desviacin a o o t pica de 20 gr. Calcular la probabilidad de que una muestra de 80 piezas tenga un peso medio de ms a de 155 gr. (Solucin: 00129) o

4.5.

Distribucin muestral de proporciones o

Nos planteamos ahora determinar qu proporcin de una poblacin posee un cierto atributo, por e o o ejemplo si es fumador o no fumador, si tiene ordenador o no, si tiene alergia o no,etc... El estudio de este tipo de proporciones es equiparable al de una distribucin binomial (donde slo hay dos posibilidades). o o Si la proporcin xito es p y la de fracaso q, y se toma una muestra de la poblacin de tama o n, al o e o n

ww

p(X 144 6) = p Z

144 6 144 32 17

at ic

= p(Z 1 34) = 1 p(Z 1 34) = 0 0901

a1

Ejemplo: Los pesos de los tornillos que fabrica cierta mquina se distribuyen segn una N (142 32; 8 5) a u (medidas en gr.). Se toman muestras de 25 tornillos. Calcular: a) Distribucin que siguen las medias de esas muestras. o b) Probabilidad de que una muestra elegida al azar de 25 tornillos tenga un peso medio superior a 1446 gr. c) La misma pregunta si la muestra es de 100 tornillos.

= N (142 32; 1 7)

.c om

igual que en el caso anterior, para cada muestra tendremos una proporcin muestral que denotaremos o por p y una desviacin t o pica muestral que denotaremos por sp . Entonces,utilizando razonamientos similares a los del apartado anterior, se verica que p = p, y pq por tanto: sp = n Conclusin: Las proporciones muestrales de tamao n 30, extra o n das de una poblacin en la que la o probabilidad de xito es p, se ajustan a una normal e N p; pq n

Ejemplo: Una fbrica de pasteles fabrica, en su produccin habitual, un 3 % de pasteles defectuosos. a o Un cliente recibe un pedido de 500 pasteles de la fbrica. a a) Probabilidad de que encuentre ms del 4 % de pasteles defectuosos. a b) Probabilidad de que encuentre menos de un 1 % de pasteles defectuosos. 3 tanto, a) En este caso xito= pastel defectuoso, y la proporcin poblacional de xito es de p = e o e 100 97 . La muestra que recibe el cliente es de tama o n=500. n q= 100 Por tanto, las proporciones muestrales siguen una distribucin: o 3 97 100 3 = N (0 03; 0 076) ; 100 p N 100 500 puesto que las muestras tienen tamao mayor que 30. n La probabilidad pedida es que la proporcin de pasteles defectuosos en la muestra sea mayor del o 4 %, es decir: 0 04 0 03 = p(Z 1 32) = 0 0934 p( 0 04) = p Z p 0 0076

ww w.

b) En este caso es

at

em

p( 0 01) = p Z p Ejercicios:

0 01 0 03 0 0076

at

1. De una poblacin de 120 alumnos , hay 48 que tienen 2 o ms hermanos. Si de dicha poblacin o a o se toman muestras de tama o 40. n a) Qu distribucin siguen las proporciones muestrales?. e o b) Cul es la probabilidad de que se encuentre en dicha muestra una proporcin de ms del a o a 55 % de alumnos con 2 o ms hermanos?. a 2. Las notas de cierto examen se distribuyen seg n una normal de media =53 y desviacin t u o pica =24. Hallar la probabilidad de que un estudiante tomado al azar tenga una nota: a) Superior a 65 b) Inferior a 52 c) Comprendida entre 5 y 65 Halla las mismas probabilidades para de la media de las notas de 16 estudiantes elegidos al azar. 3. En un saco mezclamos jud blancas y pintas en la relacin de 14 blancas por cada pinta. as o Extraemos un puado de 100 jud n as. Calcula la probabilidad de que la proporcin de jud o as pintas est comprendida entre 005 y 01. e

ic

a1

= p(Z 2 63) = 0 0043

.c

om

4. El cociente intelectual, CI, de unos universitarios se distribuye normalmente con media 100 y desviacin t o pica 11. a) Se elige al azar una persona. Hallar la probabilidad de que su CI est entre 100 y 103. e b) Se elige al azar una muestra de 25 personas. Encontrar la probabilidad de que la media de sus cocientes intelectuales est entre 100 y 103. e

4.6.

Intervalos de probabilidad

En una variable normal cualquiera N (, ), se verica que: 1. En el intervalo ( , + ) est el 6826 % de la poblacin. a o 2. En el intervalo ( 2 , + 2 ) est el 9544 % de la poblacin. a o 3. En el intervalo ( 3 , + 3 ) est el 9974 % de la poblacin. a o

Figura 4.1: Porcentajes de poblacin en los diferentes intervalos simtricos de una normal N (, ). o e

Ms explicitamente, se denomina intervalo de probabilidad a aquel intervalo para el cul se sabe que a a hay una seguridad del N % de que los parmetros muestrales (x o p) se encuentren en dicho intervalo. a La seguridad N viene jada previamente. Si queremos que el N % de la poblacin est en el intervalo, denominaremos nivel de conanza al o e nmero: u N 1 = 100 y unido a este, se encuentra el llamado nivel de signicacin, que viene dado por . Este nivel en o general vendr explicitado en las condiciones del problema, si bien los valores ms comunes suelen ser a a del 90 %,95 % y 99 %. Ejemplo: Si queremos que el 88 % de la poblacin est en el intervalo, el nivel de conanza ser 1 = o e a 88 = 0 88, mientras que el nivel de signicacin ser = 1 0 88 = 0 12. o a 100

ww

Es evidente que a medida que el intervalo se ampl hay mayor porcentaje de la poblacin en l. a, o e En general, dado un porcentaje del N %, siempre es posible encontrar un intervalo simtrico rese pecto de la media de forma que dicho intervalo contenga a dicho porcentaje de poblacin. o

w.

at

em at

ic

a1

.c

om

4.6.1.

Intervalo de probabilidad para la media muestral x

Si la poblacin sigue una distribucin de parmetros y , y las muestras son de tama o n 30 o o a n (o bien la poblacin ya es normal y las muestras son de cualquier tamao), sabemos que la media o n o muestral x sigue una distribucin: X N ; n Se trata de encontrar el valor de k como en la gura:

Figura 4.2: Buscamos el valor de k que deje en el intervalo ( k, + k) al (1 ) 100 % de la poblacin. o Razonemos ahora sobre la normal Z N(0;1) que es la que se encuentra tabulada Si queremos que el intervalo buscado contenga a la media muestral con una conanza de 1 , entonces fuera del intervalo el rea tiene que ser de , y como la curva es simtrica, en cada una de las ramas fuera de a e la regin rayada, tenemos un area de . Llamaremos z al punto situado en el eje x que separa la o 2 2 regin rayada de la otra. o

Figura 4.3: Buscamos el valor de z que deje en el intervalo (z , z ) al (1 ) de la poblacin en o 2 2 2 la N(0;1) Es evidente que se cumple: p Z z 2 o dicho de otro modo: p Z z 2 =

ww

w.

at

em at
k
n

2 probabilidad que se busca dentro de la tabla como hemos visto anteriormente en el tema de la normal. =1 Ahora bien, este valor slo sirve para la normal estndar N(0;1). Nosotros manejamos la normal o a y para pasar a la normal estndar deberemos tipicar: a N ; n = z 2

de donde despejando, encontramos k, el valor buscado: k = + z n 2

ic

a1
2

.c om

As dado el nivel de signicacin o el de conanza 1 , podemos determinar el intervalo de , o probabilidad para la media muestral, que ser: a z , + z 2 2 n n Ejemplo Determinar, en la distribucin N(0;1), el valor que concentra el 75 % de la poblacin en un o o intervalo simtrico respecto a la media e Ahora 1 = 0 75, es decir = 0 25 y por tanto = 0 125, es decir, buscamos el valor z0 125 , de 2 modo que, como en la gura, dejemos el 75 % de la poblacin en el centro. o

Ejemplo:Calcular el intervalo de probabilidad con un nivel de conanza del 95 % para la media de una muestra de 100 recin nacidos, sabiendo que la poblacin de recin nacidos sigue una normal de e o e media =3100 gr. y desviacin tipica =150 gr. o Como el nivel de conanza es 095, entonces 1 = 0 95 y por tanto = 0 05 y en cada rama fuera de la regin queda = 0 025. o 2 Buscamos entonces z0 025 , que es el valor que deja a su derecha un area de 0025, es decir: p(Z z0 025 ) = 0 025 = p(Z z0 025 ) = 0 975 Buscando este valor dentro de la tabla se obtiene que el valor de z0 025 = 1 96, y por tanto el intervalo para la media muestral es: 150 150 , 3100 + 1 96 3100 1 96 100 100 = (3100 1 96 15, 3100 + 1 96 15) = (3070 6, 3129 4)

Esto signica que el 95 % de las muestras de tamao 100 tendr su media comprendida entre estos 2 n a valores: (30706,31294) Ejercicio: Calcular el mismo intervalo con una conanza del 99 %. Ejercicio: Las notas de una poblacin de 150 alumnos siguen una distribucin de media 55 y o o varianza 41616. Extaremos muestras de tama o 36. Calcula el intervalo de probabilidad para un nivel n de conanza del: a)75 % b) 8664 %, e interpreta los resultados. (NOTA: Recordemos que la varianza y la desviacin t o pica de una distribucin estn relacionadas o a 2 porque la varianza es el cuadrado de la desviacin t o pica y se representa por ).

ww w.

at e

Ejercicio: Encuentra el valor correspondiente que concentre el 88 % de la poblacin. o

m at

Se cumple que p(Z z0 125 ) = 0 125, es decir p(Z z0 125 ) = 0 875,y si buscamos en la tabla, resulta que el valor es: z0 125 = 1 15

ic

a1

Figura 4.4: Buscamos el valor de z0 125 que deje en el intervalo (z0 125 , z0 125 ) al 075 de la poblacin o en la N(0;1)

.c om

4.6.2.

Intervalo de probabilidad para la proporcin muestral p o

Razonando de igual manera se puede llegar a que para el nivel de signicacin el intervalo para o la proporcin muestral p es o pq pq , p + z p z 2 2 n n donde p y q son las proporciones poblacionales y n 30. Ejercicio: Sabiendo que la proporcin de alumnos con v o deo de una poblacin de 120 alumnos es de o p=07, halla el intervalo de probabilidad para la proporcin de: o a) las muestras de tamao 30 con una conanza del 75 %. n b) las muestras de tama o 49 con una conanza del 90 %. n c) las muestras de tama o 49 con una conanza del 99 %. n

4.7.

Estimacin por intervalos o

4.7.1.

Estimacin de la media de una poblacin o o

es decir, que:

ww

, siendo n el tama o de la muestra, y sabemos que el intervalo de probabilidad a nivel de conanza n 1 para x es: z , + z 2 2 n n

De la primera desigualdad se sigue que: z x = x + z 2 2 n n Y de la segunda: x + z = x z 2 2 n n x z x + z 2 2 n n

Luego se deduce que:

Es decir, que el intervalo de conanza con nivel de conanza 1 para la media poblacional desconocida es: x z , x + z 2 2 n n NOTA: a) Hay que aadir que para aplicar este resultado, o bien las muestras tienen tamao n 30, o n n bien la poblacin sigue una distribucin normal. o o

w.

M at

z x + z 2 2 n n

em

La media de una poblacin es desconocida y deseamos conocerla. Para ello, basndonos en los o a intervalos de probabilidad, sabemos que si la poblacin tiene parmetros y , la media muestral x o a sigue una distribucin: o X N ; n

at ic

a1

.c

om

La estimacin anterior, la puntual, se utiliza poco, pues no tenemos datos sucientes que nos o indiquen el grado de abilidad del dato muestral que hemos tomado. Lo que tiene ms sentido plana tearse es cul es la probabilidad de que la media o proporcin poblacional pertenezcan a un intervalo a o determinado.

b) Si la desviacin t o pica de la poblacin , es desconocida, se utilizar, la desviacin t o a o pica muestral s en su lugar,y el intervalo ser a: s s x z , x + z 2 2 n n a Al valor se le denomina error tpico o estndar. n Ejemplo: Para estimar la media de los resultados que obtendr al resolver un cierto test los alumnos an o de 4 de E.S.O. de la Comunidad de Castilla-Len, se les pasa el test a 400 alumnos escogidos al azar, con los resultados de la tabla: Puntuacin o 1 2 3 4 5 Nmero de alumnos u 24 80 132 101 63

ic

A partir de ellos, estima con un nivel de conanza del 95 % el valor de la media poblacional. Aprovechando repasaremos el clculo de algunos parmetros estad a a sticos. Como slo disponemos de la muestra, no conocemos la media ni la desviacin t o o pica poblacional, hemos de calcular la media y la desviacin t o pica muestral. Para ello, calculamos la tabla siguiente: X 1 2 3 4 5 Total Resulta: Frec.absoluta fi 24 80 132 101 63 400 X fi 24 160 396 404 315 1299

a1

.c
X2 1 4 9 16 25

ww w.

at

Varianza=s2 =

4723 (3 25)2 = 11 81 10 56 = 1 25 400 s = s2 = 1 25 = 1 12

Ya tenemos los parmetros muestrales. Hemos de determinar el intervalo de conanza para . Como a 1 = 095, resulta que = 0 05 y queda = 0 025. 2 Se obtiene que el valor es z0 025 = 1 96, por tanto el intervalo de conanza para , al 95 % es: 1 12 1 12 , 3 25 + 1 96 3 25 1 96 400 400 = (3 25 0 11, 3 25 + 0 11) = (3 14, 3 36)

Por tanto tenemos una conanza del 95 % de que la nota media de la poblacin est comprendida o e entre 314 y 336. Ejercicio: De una variable estad stica conocemos la desviacin t o pica, 8, pero desconocemos la media. Para estimarla, extraemos una muestra de tama o 60 cuya media es 37. Estimar la media poblacional n con una conanza del 99 %.

em

x=

at

1299 = 3 25 400

om

X 2 fi 24 320 1188 1616 1575 4723

Error mximo admisible: a Hemos visto que el intervalo de conanza para la media poblacional es: x z , x + z 2 2 n n Se cumple entonces que la diferencia, en valor absoluto, entre las medias poblacional y muestral es: | x| < z 2 n Al valor E = z 2 n

se le llama error mximo admisible. Dicho error tiene las siguientes propiedades: a a) El error es manor cuanto mayor sea el tama o de la muestra (n), porque dividimos por un n nmero cada vez mayor. u b) El error es mayor al aumentar el nivel de conanza, puesto que el valor z aumenta, como se 2 observa en la tabla: Conanza=1 09 095 099 z 2 1645 196 2575

4.7.2.

Estimacin de una proporcin o o

Si para cierta poblacin se desconoce la proporcin p de individuos que poseen cierta caracter o o stica, y deseamos dar un intervalo de conanza para el valor de p, como el intervalo de probabilidad para la proporcin muestral, ,para el nivel de conanza 1 en una muestra de tamao n es: o p n p z 2 pq , p + z 2 n pq n

Razonando igual que en el caso anterior, concluimos que: El intervalo de conanza para p a un nivel de conanza de 1 es: p z 2 pq , p + z 2 n pq n

Aunque como habitualmente no se conoce p en realidad se usa: p z 2 pq , p + z 2 n pq n

NOTA: a) Es necesario que n 30 para poder aplicar esta frmula. o b) Habitualmente en las encuestas, se suele utilizar, en lugar de la ultima frmula, el valor de o p=q=05, que es la situacin ms desfavorable. o a

ww w.

Ejercicio: Al medir un tiempo de reaccin, un psiclogo sabe que la desviacin t o o o pica del mismo es 05 segundos. Cul es el n mero de medidas que deber realizar para que con una conanza del 99 %, a u a el error de estimacin no exceda de 01 segundos?. o

at

em

at ic

Para reducir el error, por tanto, no hay que aumentarla conanza, sino el tamao de la muestra elegida. n Si conocemos el error y el nivel de conanza, podemos calcular el tama o de la muestra , usando n la frmula del error. o

a1

.c o

Ejercicio: Determina el intervalo de conanza, con una signicacin del 005 para la proporcin o o poblacional de fumadores entre los jvenes menores de 21 aos, a partir de una muestra de tamao o n n 900, cuando no se conocen valores de p anteriores. Considera los dos casos anteriores (usando p y p=q=05). La proporcin de fumadores en la encuesta ha sido de p = 0 3. o El error mximo admisible en este caso es: a E = z 2 o en caso de no conocer p: pq n

NOTA: Diferencia entre intervalos de probabilidad y de conanza En un intervalo de probabilidad lo que conocemos es la media y desviacin tpica poblacionales, o y damos el intervalo donde se encontrar (para un cierto nivel de conanza) la media muestral o la a proporcin muestral. o Sin embargo, en un intervalo de conanza entramos ya en el terreno de la estimacin, es decir o NO conocemos la media poblacional (y en ocasiones tampoco la desviacin t o pica poblacional) ni la proporcin poblacional , sino que slo conocemos, o podemos calcular, la media muestral o la proporcin o o o muestral, y de lo que se trata es de dar un intervalo en el que se encuentre la media poblacional (o la proporcin poblacional). o

ww

pq n Ejercicio: Para 96 familias espa olas elegidas al azar se ha determinado que la TV permanece enn cendida en la casa una media de 217 minutos diarios, la desviacin t o pica de la muestra fue de 40 minutos. a) Para una abilidad del 95 % qu error se asume cuando se da por bueno ese dato para el total e de las familias espa olas?. n b) Qu tama o muestral ser necesario para reducir ese error a la mitad?. e n a

w.

at

em

at

ic

E = z 2

a1

.c om

You might also like