You are on page 1of 8

TEMA 12: TEORA DE MUESTRAS.

DISTRIBUCIONES EN EL MUESTREO
0.

INTRODUCCIN

En temas anteriores hemos estudiado conceptos fundamentales, como era el concepto de variable
aleatoria y su distribucin de probabilidades, estudiamos diferentes modelos de distribuciones tanto
de tipo discreto como de tipo continuo y analizbamos sus caractersticas bsicas (media, varianza,
etc.). A partir de ahora estaremos interesados en saber qu modelo sigue la poblacin, y para ello nos
basaremos en la informacin que se obtenga de un subconjunto o parte de esa poblacin que
llamaremos muestra.
Cuando realizamos una introduccin general de la estadstica decimos que uno de los objetivos
fundamentales es obtener conclusiones basndonos en datos que se han observado, proceso que se
conoce con el nombre de inferencia estadstica, es decir utilizando la informacin que nos proporciona
una muestra de la poblacin se obtienen conclusiones o se infieren valores sobre caractersticas
poblacionales.
En este captulo daremos una serie de conceptos bsicos que sern fundamentales para el desarrollo
posterior de la inferencia estadstica.
1. POBLACIN Y MUESTRA. CONDICIONES DE REPRESENTATIVIDAD DE UNA
MUESTRA.
a) Poblacin.
Cuando una investigacin estadstica va referida a un conjunto, coleccin o colectivo de elementos,
este colectivo se llama poblacin.
El tamao de la poblacin es el nmero de elementos o unidades estadsticas que la componen. La
poblacin, por su tamao, puede ser finita o infinita.
b) Muestra.
En ciertos estudios, cuando la poblacin es muy grande, no se suele hacer una observacin exhaustiva,
se estudia una parte de la misma llamada muestra. Para poder obtener conclusiones acerca de la
poblacin, es imprescindible que la muestra sea representativa.
Muestra es una parte de la poblacin, debidamente elegida, que se somete a la observacin cientfica
en representacin de la misma, con el propsito de obtener resultados vlidos para toda la poblacin.
El nmero de elementos de una muestra se denomina tamao de la muestra.
Para que una muestra se considere vlida debe cumplir que:
1 - Su tamao sea proporcional al tamao de la poblacin.
2 - No haya distorsin en la eleccin de los elementos de la muestra.
3 - Sea representativa.
Los principales motivos que inducen a tomar muestras son:
1 - El coste econmico y de tiempo.
2 - Que la poblacin sea homognea, pudiendo obtener buenos resultados a partir de cualquier
muestra.
3 - La falta de personal preparado para llevar a cabo un buen estudio general.
4 - La necesidad de obtener unos datos de forma rpida.

El uso del muestreo presenta limitaciones, entre ellas:


1 - El riesgo que supone la toma de una muestra que puede no ser representativa.
2 - Cuando se necesita informacin de todos los elementos de la poblacin.

3 - Cuando no se domina bien la tcnica del muestreo.


4 - Cuando la poblacin est formada por un nmero muy pequeo de elementos, ya que una
ligera equivocacin en la toma de la muestra puede originar grandes errores.
La forma de obtener conclusiones vlidas para la poblacin a partir de los datos de una muestra es el
objetivo principal de la inferencia estadstica.
2. MUESTREO. TIPOS DE MUESTREO.
En un estudio estadstico de una poblacin debemos decidir la forma en que seleccionamos las
muestras (muestreo) de tal manera que resulten representativas del total de la poblacin. Los errores
en que podemos incurrir en la eleccin de muestras pueden sesgar las conclusiones.
Ejemplos tpicos son:

Muestreo de conveniencia. Cuando tomamos las muestras que cuestan menos esfuerzo.
Voluntarsmo. Cuando se obtienen datos solo de aquellos individuos que deciden espontneamente
dar su opinin, su propia actitud los selecciona como una muestra selecta.
Veamos cules son los tipos de muestras ms comunes:
a) Muestreo aleatorio simple.
La muestra se puede elegir por distintos procedimientos. El principio que debe presidir la eleccin de
una muestra es el principio aleatorio, mediante el cul todos y cada uno de los elementos de la
poblacin tengan la misma probabilidad de ser elegidos y formar parte de la muestra. Se puede llevar a
cabo mediante un sorteo riguroso, obteniendo una serie de unidades estadsticas (con o sin
reemplazamiento) hasta completar la muestra fijada.
El muestreo aleatorio simple consiste en seleccionar n elementos sin reemplazamiento de entre los N
que componen la poblacin, de tal modo que todas las muestras de tamao n que se pueden formar
tengan la misma probabilidad de ser elegidos.
En la prctica, la muestra se obtiene unidad a unidad. Para ello, se enumeran los elementos de la
poblacin desde el 1 hasta N y se extraen a continuacin n elementos al azar o bien se introducen en
un bombo tantas bolas numeradas como elementos de la poblacin. Removiendo el bombo se van
sacando bolas y anotando los nmeros de los elementos de la muestra.
Este procedimiento, aunque simple, requiere tener unos medios materiales: bombo, bolas suficientes,
etc., por lo que a veces se utilizan en su lugar otras alternativas como las tablas de nmeros aleatorios.
Las tablas de nmeros aleatorios estn formadas por grupos de dgitos obtenidos al azar y ordenados
por filas y columnas.
b) Muestreo aleatorio sistemtico.
Se empiezan numerando todos los elementos de la poblacin desde 1 a N. Para seleccionar los n
elementos que constituyen la muestra, es preciso obtener el coeficiente de elevacin: h=(N/n).
Despus se elige al azar un nmero i, llamado origen, comprendido entre 1 y h (1ih), que nos indica
el punto de arranque de la seleccin.
La muestra est formada por los elementos:
i , i+h , i+2h ,...., i + (n-1)h.
Este procedimiento exige, para que se pueda aplicar correctamente, que la poblacin no presente
ninguna ordenacin por la variable objeto de estudio y, si la hay, previamente habr que desordenarla.
c) Muestreo aleatorio estratificado

En este caso, la poblacin de N elementos est dividida en subpoblaciones o estratos de elementos


N1 N 2 ... N k y, para elegir la muestra efectuamos un muestreo aleatorio estratificado.

I1

I2

I3

Ik

Total

Subpoblacin

N1

N2

N3

Nk

Muestra

n1

n2

n3

nk

Se llama muestreo aleatorio estratificado al procedimiento completo de seleccionar, en cada estrato o


subpoblacin, la muestra por muestreo aleatorio. La eleccin, en cada subpoblacin, la podemos hacer
bien por muestreo aleatorio simple o bien sistemtico.
Este tipo de muestreo se utiliza para obtener muestras en poblaciones no homogneas, consiguindose
as una mayor precisin y menor error.
La muestra total est formada por la suma de las muestras correspondientes a cada estrato.
Cuando todas las muestras tienen un mismo tamao en cada estrato, se dice que es un muestreo
aleatorio estratificado constante (o de afijacin igual ).
As, si hemos dividido la poblacin en L subpoblaciones y la muestra es de tamao n, en cada estrato
tomamos el mismo nmero de unidades estadsticas o elementos:

n1 n2 ... nL

n
L

Cuando el nmero de elementos seleccionados en cada estrato o subpoblacin es proporcional a su


tamao, se trata de un muestreo aleatorio estratificado proporcional (o de afijacin proporcional).

n1
n
n
n
2 ... L
N1 N 2
NL N
La muestra ni en cada estrato se toma de forma proporcional a su tamao N i
d) Muestreo por conglomerados
Es otro procedimiento de muestreo aleatorio en el que la unidad muestral, denominada conglomerado,
est formada por un grupo de unidades elementales, como bloques de viviendas, familias, colegios,
etc.
Este tipo de muestreo tiene la ventaja de que la muestra est ms concentrada y, por tanto, es mucho
ms fcil obtener las respuestas o los datos de las unidades ltimas (individuos, alumnos, etc.)
Cuando los conglomerados se corresponden con zonas geogrficas y se define el conglomerado como
rea o parte bien definida del terreno, se habla de muestreo por reas en lugar de hablar de muestras
por conglomerados.
El muestreo por conglomerado puede realizarse:
a) En una etapa: Si en los conglomerados que han pasado a formar parte de la muestra se toman
todas las unidades.
b) En dos o ms etapas: Tenemos N individuos en una poblacin, dividido en K grupos que
podemos tomar como conglomerados. Si queremos elegir n individuos de la muestra en K de estos
conglomerados, hemos de tomar una muestra a su vez en cada conglomerado seleccionado.

3. DISTRIBUCIONES EN EL MUESTREO
En este apartado estudiaremos las distribuciones de algunas variables aleatorias para muestras
procedentes de poblaciones normales, cuyos parmetros pueden, o no, ser conocidos.
Sabemos que muchos fenmenos que se observan en la realidad tienen distribuciones de frecuencias
relativas que al representarlas tienen una forma parecida a la distribucin normal, por ello podemos
suponer que la mayora de las poblaciones con las que nos encontraremos sern normales y las
variables aleatorias observadas en una muestra aleatoria ( X 1 , X 2 ,... X n ) sern independientes y tienen
la misma distribucin.
a) Distribucin en el muestreo de una proporcin.
Las chinchetas de una determinada marca no salen todas buenas y algunas resultan defectuosas. Sea p
la proporcin de chinchetas buenas.
No sabemos el valor de p, pero podemos aproximarnos de alguna manera. Para ello, tomamos una
muestra aleatoria de 100 chinchetas y observamos que 86 de ellas estn bien.
, ya que no es el valor de p, pero s da la proporcin de chinchetas
Al valor 86/100 lo llamamos p

buenas en la muestra elegida. Si elegimos otras muestras de tamao 100, evidentemente el valor de p
vara.
y que
Los distintos valores de p dan lugar a una variable aleatoria que representaremos por p
llamaremos estadstico.
se llama distribucin muestral o distribucin en el muestreo de
La distribucin de los valores de p
una proporcin. Se demuestra que:
tiene las siguientes caractersticas:
La variable aleatoria p
1. Media: =p
2. Desviacin tpica: =

p 1 p
n

se aproxima a la normal, siempre que p no se


3. A medida que n crece, la distribucin de p
acerque ni a 0 ni a 1.

b) Distribucin en el muestreo de la media


Supongamos que se desea saber la altura media de los nios de 11 aos de una ciudad. La altura
media poblacional la representaremos por , y por la desviacin tpica poblacional.
Con el fin de hacernos una idea de cmo puede ser , elegimos una muestra aleatoria formada por 40
nios, y se obtiene que:
* La altura media muestral es: x1 =140 cms.
* La desviacin tpica muestral es: s1 =16,5 cms.
Si elegimos otras muestras de tamao 40 y calculamos sus medias y sus desviaciones tpicas,
obtendremos: x2 , x3 ,, xn y s2 , s3 ,, sn .
Los distintos valores de dan lugar a una variable aleatoria que representamos por X . La distribucin
de los valores de X se llama distribucin de las medias muestrales por depender de las muestras o
distribucin en el muestreo de la media, y se demuestra que:
La variable aleatoria X tiene las siguientes caractersticas:
1. Media:
2. Desviacin tpica:

3. A medida que n crece, la distribucin de X se aproxima a una normal.

As X N ,
n

* Si es desconocida y n 30, la sustituiremos por $


s

x x
i

(desviacin tpica muestral)

n 1

* Si es desconocida y n<30 los valores de s varan considerablemente de muestra en muestra,


pues s disminuye a medida que n aumenta, y la distribucin de X ya no sera normal. "Si (

X 1 , X 2 ,... X n ) es una muestra aleatoria simple de tamao n, procedente de una poblacin N(,) con
desconocida, entonces:

X t-Student con n-1 grados de libertad"


c) Distribucin de las sumas muestrales
El encargado del registro civil de una ciudad quiere saber cunto suman las tallas de las parejas que
van all a inscribirse. Supongamos que la suma de las tallas de la poblacin tiene por media y
desviacin tpica .
Con el fin de hacernos una idea de cmo puede ser , elegimos una muestra aleatoria formada por 35
parejas, y se obtiene que:
* la talla suma media es: t1 = 2,35 m.
* la desviacin tpica de la muestra es: s1 = 0,15 m.
Si elegimos otras muestras de tamao 35 y calculamos sus medias y sus desviaciones tpicas,
obtendremos: t2 , t3 ,..., tn y s2 , s3 ,..., sn .
Los distintos valores de ti dan lugar a una variable aleatoria que representamos por T. La distribucin
de los valores de T se llama distribucin de las sumas muestrales, por depender de las muestras, o
distribucin en el muestreo de las sumas, y se demuestra que:
La variable aleatoria T tiene las siguientes caractersticas:
1. Media: n
2. Desviacin tpica: n
3. A medida que n crece, la distribucin de T se aproxima a la normal.
d) Distribucin en el muestreo de la diferencia de medias.
Supongamos que la medida de los esprragos de La Rioja tienen de media 1 y desviacin tipica 1 y
que los esprragos de Aranjuez tienen de media 2 y desviacin tpica 2 . Supongamos tambin que
ambas poblaciones se distribuyen normalmente y de forma independiente.
Tomamos una muestra de tamao n1 de esprragos de La Rioja y una muestra de tamao n2 de
esprragos de Aranjuez. Sean x1 y x2 sus longitudes medias respectivas.
Si elegimos otras muestras de tamaos n1 y n2 , respectivamente, y calculamos sus medias y las
diferencias de medias, se obtiene:

x1 ' x2' ; x1 " x2 " ;x1 '" x2 '",...

Estos distintos valores dan lugar a una variable aleatoria que representamos por X 1 X 2 . La
distribucin de X 1 X 2 se llama distribucin en el muestreo de la diferencia de medias, y se
demuestra que:
La variable aleatoria X 1 X 2 tiene las siguientes caractersticas:
1. Media: 1 2

2. Desviacin tpica:

1 21

n1 n2

3. A medida que n1 y n2 crecen, la distribucin de X 1 X 2 se aproxima a la normal.


Si las desviaciones tpicas son desconocidas y las muestras son grandes, sustituiremos 1 y 2 por s1
y s2 , respectivamente.

EJERCICIOS TEMA 1
1. Supongamos que el 30% de la poblacin de viviendas de un pas tienen ms de un cuarto de aseo.
Con el fin de obtener una informacin ms precisa se toma una muestra aleatoria de tamao 400
viviendas. Obtener la probabilidad de que la proporcin de viviendas de la muestra con ms de un aseo
est comprendida entre 025 y 032.
2. El 3% de las piezas producidas por una mquina son defectuosas. Se toma una muestra aleatoria de
100 piezas.
a) Cul es la distribucin que sigue la proporcin de piezas defectuosas en la muestra?
b) Hallar la probabilidad de que en la muestra existan menos de 28 piezas defectuosas.
3. Despus de unas elecciones se sabe que el candidato que ha sido elegido presidente obtuvo el 42%
de los votos. Hallar la probabilidad de que de 1.000 individuos elegidos al azar de entre los votantes
hubiese obtenido el candidato ms de 450 votos.
4. Las notas de un grupo de alumnos es aproximadamente normal con media =5,5 y desviacin tpica
=0,8.
a) Hallar la media y la desviacin tpica de las medias muestrales y de las sumas para muestras de
tamao 4.
b) Calcular la probabilidad de que la media muestral de 4 alumnos elegidos al azar sea mayor que
5,2.
c) Hallar la probabilidad de que la suma de las calificaciones obtenidas por los 4 alumnos sea
inferior a 21.
5. Se sabe que los nios espaoles de enseanza primaria ante una prueba de discriminacin visual se
distribuyen segn una N(4,2). Extraemos una muestra aleatoria formada por 39 nios y les pasamos la
prueba. Hallar la probabilidad de que la media muestral:
a) Sea menor que 3,5.
b) Sea mayor que 3,9.
c) Est comprendida entre 3,8 y 4,1.
6. En una universidad se sabe que las tallas de los alumnos se distribuyen normalmente con media 172
cms. y desviacin tpica 17,5 cms. Se toman muchas muestras de 35 estudiantes.
a) Cul es la media y la desviacin tpica de la distribucin de las medias muestrales?
b) Hallar la probabilidad de que la media muestral sea inferior a 171 cms.
7. El peso de los toros de una determinada ganadera se distribuye segn una normal de media 500
kgs. y 45 kgs. de desviacin tpica. Se toman muestras de 35 toros y se calcula el peso medio.
Hallar la probabilidad de que la media muestral:
a) Sea mayor que 540 kgs.
b) Sea menor que 480 kgs.
c) Est entre los 480 y 495 kgs.
8. El peso de las truchas de una piscifactora sigue una ley N(200,50). Se toman muestras de 60
truchas y se calcula su peso medio.
Hallar las probabilidades de que la media muestral:
a) Sea mayor que 210 kgs.
b) Sea menor que 185 kgs.
c) Est entre 210 y 225 kgs.

9. Se sabe que la talla media de los nios recin nacidos en la Comunidad Autnoma A se distribuyen
segn una N(66,6), mientras que los de la Comunidad Autnoma B se distribuyen segn una N(62,4).
Si se toman muestras al azar de 50 nios recin nacidos de cada Comunidad Autnoma:
a) Cules son los parmetros media y desviacin tpica de la diferencia de medias muestrales?
b) Hallar la probabilidad de que la diferencia de medias de las tallas de los nios recin nacidos de
una de las muestras sea inferior a 3 cms.
10. En las pruebas de acceso a la Universidad A se ha obtenido una calificacin media de 5,8 con una
desviacin tpica de 1,25; mientras que en las pruebas de acceso a la Universidad B se ha obtenido una
calificacin media de 5,6 con una desviacin tpica de 1,5. Si se toman al azar 100 alumnos de cada
universidad, cul es la probabilidad de que los alumnos de A tengan una calificacin media de al
menos 3 dcimas superior a los alumnos de la Universidad B?
11. La compaa area A sabe que el tiempo de retraso de sus aviones se distribuye normalmente con
una retraso medio de 10 minutos y desviacin tpica 2 minutos, mientras que en otra compaa B su
retraso medio es de 15 minutos y desviacin tpica 4 minutos. Si se toman muestras al azar de 100
vuelos, hallar la probabilidad de que la diferencia en los tiempos medios de retraso sea menor que 1,5
minutos.

EJERCICIOS DE AMPLIACIN
1. Analizando los salarios de los trabajadores de dos comunidades autnomas se deduce que en la
comunidad A el salario medio es de 775 con una varianza de 15, y en la comunidad B el salario
medio es de 773 con una varianza de 18. Si tomamos una muestra aleatoria de 36 personas en A y
de 49 en B, determinar la probabilidad de que la muestra procedente de A tenga un salario medio que
sea al menos 1 superior al salario medio de la comunidad B.
2. Las lmparas de un fabricante A tienen vida media de 1400 horas con una desviacin tpica de 200
horas, mientras que las de otro fabricante B tienen vida media de 1200 horas con una desviacin tpica
de 100 horas. Si se toma una muestra de 125 lmparas de cada clase.
a) Cul es la probabilidad de que las de A tengan una vida media que sea al menos de 160 horas
ms que las de B?
b) Cul es la probabilidad de que las de A tengan una vida media que sea al menos de 250 horas
ms que las de B?
3. Las bolas de rodamiento de cierto fabricante pesan 0,5 g. de media, con una desviacin tpica 0,02
g. Cul es la probabilidad de que dos lotes de 1000 bolas cada una difieran en peso en ms de 2g.?
4. Un cierto tipo de lmparas tiene una vida media de 1500 h y una desviacin tpica de 150 h. Se
conectan tres de ellas de manera que en cuanto una falle es encendern otra. Suponiendo que las vidas
medias estn normalmente distribuidas:
a) Cul es la probabilidad de que den luz durante al menos 500 horas?.
b) Cul es la probabilidad de que den luz durante a lo sumo 4200 horas?.
5. De una variable aleatoria N(-1, ) se extrae una muestra aleatoria simple de tamao 10, cuyo
resultado es: 1,03; -1,79; 1,45;-2,54; 0,37; -0,6; 0,53; 0,28; -2,21; -2,66. Calclese P( X 1,2 )

You might also like