You are on page 1of 13

Estadstica Inferencial

ESTADISTICA INFERENCIAL

1. METODOS DE MUESTREO DE PROBABILIDAD

Hay dos tipos de muestro: muestreo probabilsticos y muestreo no probabilsticos.

1.1 Muestreo probabilstico

Los mtodos de muestreo probabilstico son aquellos en los que todos los individuos tienen la
misma probabilidad de ser elegidos para formar parte de una muestra. Slo estos mtodos de
muestreo probabilstico aseguran la representatividad de la muestra extrada y son, por tanto,
los ms recomendables. Dentro de los mtodos de probabilstico se encuentran los siguientes
tipos:

Muestreo aleatorio simple

El procedimiento empleado es el siguiente: 1) se asigna un nmero a cada individuo de la


poblacin, y 2) a travs de algn medio mecnico (bolas dentro de una bolsa, tablas de
nmeros aleatorios, nmeros aleatorios generados con una calculadora u ordenador, etc.) se
eligen tantos sujetos como sea necesario para completar el tamao de muestra requerido.

Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando la
poblacin que se est manejando es muy grande.

Muestreo aleatorio sistemtico

Este procedimiento exige numerar todos los elementos de la poblacin, pero en lugar de
extraer n nmeros aleatorios slo se extrae uno. Se parte de ese nmero aleatorio i, que es un
nmero elegido al azar, y los elementos que integran la muestra son los que ocupan los lugares
i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de
dividir el tamao de la poblacin entre el tamao de la muestra: k=N/n. El nmero i que se
emplea como punto de partida ser un nmero al azar entre 1 y k.

1
Estadstica Inferencial

El riesgo de este tipo de muestreo est en los casos en que se dan periodicidades en la
poblacin ya que al elegir a los miembros de la muestra con una periodicidad constante (k) se
puede introducir una homogeneidad que no se da en la poblacin.

Muestreo aleatorio estratificado

Trata de obviar las dificultades que presentan los anteriores, ya que simplifica los procesos y
suele reducir el error muestral para un tamao dado de la muestra. Consiste en considerar
categoras tpicas diferentes entre s (estratos) que poseen gran homogeneidad respecto a
alguna caracterstica(se puede estratificar, por ejemplo, segn la profesin, el municipio de
residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es
asegurarse de que todos los estratos de inters estarn representados adecuadamente en la
muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el
muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarn
parte de la muestra. En ocasiones, las dificultades que plantea son demasiado grandes, pues
exige un conocimiento detallado de la poblacin (tamao geogrfico, sexos, edades...).

La distribucin de la muestra en funcin de los diferentes estratos se denomina afijacin, y


puede ser de diferentes tipos:

Afijacin simple: a cada estrato le corresponde igual nmero de elementos mustrales.

Afijacin proporcional: la distribucin se hace de acuerdo con el peso (tamao) de la poblacin


en cada estrato.

Afijacin ptima: se tiene en cuenta la previsible dispersin de los resultados, de modo que se
consideran la proporcin y la desviacin tpica.

Tiene poca aplicacin ya que no se suele conocer la desviacin.

Por ejemplo, se est interesado en estudiar el grado de aceptacin que la implantacin de la


reforma educativa ha tenido entre los padres de un municipio. A tal efecto se seleccion una
muestra de 600 padres de familia. Se conoce por los datos del Ministerio de Educacin que de
los 10.000 nios escolarizados en la bsica, 7.000 acuden a colegios pblicos y 3.000 a colegios

2
Estadstica Inferencial

privados. Como el inters es que en la muestra estn representados todos los tipos de colegio,
se realiza un muestreo estratificado empleando como variable de estratificacin el tipo de
colegio.

Si se emplea una afijacin simple seran 300 nios de cada tipo de centro, pero en este caso
parece ms razonable utilizar una afijacin proporcional pues hay bastante diferencia en el
tamao de los estratos. Por consiguiente, se calcula la proporcin para cada uno de los estratos
respecto de la poblacin, para poder reflejarlo en la muestra.

Colegios pblicos: 7.000/10.000 = 0.70

Colegios privados: 3.000/10.000 = 0.30

Para conocer el tamao de cada estrato en la muestra se multiplica la proporcin por el tamao
muestral.

Colegios pblicos: 0.70x600 = 420 padres de familia

Colegios privados: 0.30x600 = 180 padres de familia

Muestreo aleatorio por conglomerados

Los mtodos presentados hasta ahora estn pensados para seleccionar directamente los
elementos de la poblacin, es decir, que las unidades mustrales son los elementos de la
poblacin. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de
la poblacin que forman una unidad, a la que se denomina conglomerado. Las unidades
hospitalarias, los departamentos universitarios, una caja de determinado producto, etc. son
conglomerados naturales. En otras ocasiones, se pueden utilizar conglomerados no naturales
como, por ejemplo, las urnas electorales.

Cuando los conglomerados son reas geogrficas suele hablarse de "muestreo por reas".

El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto nmero de


conglomerados (el necesario para alcanzar el tamao muestral establecido) y en investigar
despus todos los elementos pertenecientes a los conglomerados elegidos.

3
Estadstica Inferencial

Por ejemplo, en una investigacin se trata de conocer el grado de satisfaccin laboral de los
empleados de una cadena de almacenes; se toma una muestra de 700 empleados. Ante la
dificultad de acceder individualmente a estos empleados, se decide hacer una muestra por
conglomerados.

Sabiendo que el nmero de empleados por almacn es aproximadamente de 35, los pasos a
seguir seran:

Recoger un listado de todos los almacenes.

Asignar un nmero a cada uno de ellos.

Elegir por muestreo aleatorio simple o sistemtico los 20 almacenes (700/35 = 20) que
proporcionarn los 700 empleados que se necesitan.

1.2 Mtodos de muestreo no probabilsticos

A veces, para estudios exploratorios, el muestreo probabilstico resulta excesivamente costoso


y se acude a mtodos no probabilsticos, aun siendo conscientes de que no sirven para realizar
generalizaciones, pues no se tiene certeza de que la muestra extrada sea representativa, ya
que no todos los sujetos de la poblacin tienen la misma probabilidad de ser elegidos. En
general, se selecciona a los sujetos siguiendo determinados criterios procurando que la muestra
sea representativa.

Muestreo por cuotas

Tambin denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un


buen conocimiento de los estratos de la poblacin y/o de los individuos ms "representativos"
o "adecuados" para los fines de la investigacin. Mantiene, por tanto, semejanzas con el
muestreo aleatorio estratificado, pero no tiene el carcter de aleatoriedad de aqul.

En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de individuos que
renen determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 aos, de sexo
femenino y residentes en una misma ciudad. Una vez determinada la cuota, se eligen los

4
Estadstica Inferencial

primeros que se encuentre que cumplan esas caractersticas. Este mtodo se utiliza mucho en
las encuestas de opinin.

Por ejemplo, una universidad desea estudiar la incidencia de las drogas en la adolescencia. Lo
que debera hacer sera: conocer por los informes del Estado cules son los centros educativos
ms afectados por el problema, fijar un nmero de sujetos a entrevistar, proporcional a cada
uno de los estratos (cuotas) y, finalmente, dejar en manos de los responsables del trabajo de
campo a qu sujetos concretos se deber entrevistar.

Muestreo intencional

Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras


"representativas" mediante la inclusin en la muestra de grupos supuestamente tpicos. Es muy
frecuente su utilizacin en sondeos preelectorales de zonas que en anteriores votaciones han
marcado tendencias de voto.

Muestreo casual o incidental

Se trata de un proceso en el que el investigador selecciona directa e intencionadamente los


individuos de la poblacin. El caso ms frecuente de este procedimiento es el utilizar como
muestra los individuos a los que se tiene fcil acceso (los profesores de universidad emplean
con mucha frecuencia a sus propios alumnos). Un caso particular es el de los voluntarios.

Bola de nieve

Se localiza a algunos individuos, los cuales conducen a otros, y stos a otros, y as hasta
conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen
estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos,
egresados de una institucin, etc.

1.3. Errores en las encuestas

Aun cuando en las encuestas se utilizan mtodos de muestreo probabilstico, estn sujetas a
errores potenciales, los cuales se describen a continuacin:

5
Estadstica Inferencial

Error de cobertura o sesgo en la seleccin

La clave para una seleccin apropiada en la muestra es un marco de poblacin adecuado o una
lista actualizada de todos los elementos que participarn en el muestreo. El error de cobertura
ocurre si se excluyen ciertos elementos de la lista de poblacin, de manera que no tienen
oportunidad de ser seleccionados en la muestra. El error de cobertura conduce a un sesgo de
seleccin. Si el listado es inadecuado porque no se incluyeron algunos elementos de la
poblacin, cualquier muestra probabilstica aleatoria proporcionar una estimacin de las
caractersticas del marco, no de la poblacin real.

Error o sesgo de no respuesta

No todas las personas estn dispuestas a contestar una encuesta. El error de no respuesta
surge del fracaso al recopilar datos de todos los sujetos de la muestra y el resultado es un sesgo
de no respuesta. Como en general no se puede suponer que las personas que no responden son
semejantes a aquellas que s responden, es importante realizar un seguimiento a las no
respuestas despus de un periodo determinado. Deben hacerse varios intentos, ya sea por
correo o por telfono, para convencerlos de que diligencien la encuesta. Con base en estos
resultados, las estimaciones obtenidas con las respuestas iniciales se combinan con las
estimaciones obtenidas con el seguimiento, de manera que las inferencias hechas a partir de la
encuesta sean vlidas.

Error de muestreo

El error de muestreo se presenta cuando se encuesta una muestra y no la poblacin, es decir,


cuando no se aplica un censo. Aun cuando no se puede evitar este error, s se puede controlar;
una forma importante de controlarlo es seleccionar un mtodo o un diseo adecuado de
muestreo. El error de muestreo muestra la heterogeneidad o las diferencias aleatorias de una
muestra a otra, segn la probabilidad de que elementos especficos sean seleccionados en unas
muestras determinadas.

Error de medicin

6
Estadstica Inferencial

Se refiere a la falta de precisin en las respuestas registradas, debido a fallas en la redaccin del
enunciado de las preguntas, la influencia del entrevistador en la persona que responde, o por el
esfuerzo que realiza la persona que responde.

2 ELECCION DEL TAMAO DE LA MUESTRA


El tamao de la muestra, un tema que siempre preocupa, no tiene fcil solucin y va
estrechamente unido a la representatividad.
No existe un tamao ideal de la muestra. A efectos descriptivos, se considera una muestra
grande cuando n > 30. Una muestra debe ser lo suficientemente grande como para ser
representativa, pero el nmero de elementos necesarios para lograr la representatividad vara
de una investigacin a otra.
Cuanto ms homognea es una poblacin en las caractersticas objeto de estudio, ms fcil
resulta obtener muestras representativas sin necesidad de que sean grandes. Es decir, el
tamao de la muestra est en relacin directa con la desviacin tpica de las puntuaciones en
las caractersticas de la variable a investigar.
El tamao necesario de la muestra depende de tres factores:
1. El nivel de confianza deseado
2. El margen de error que el investigador est dispuesto a tolerar
3. La variabilidad de la poblacin que se estudia

Nivel de confianza: Es el porcentaje de confiabilidad con el cual se estima la verdadera


proporcin de xito. El nivel de confianza tiene relacin directa con el tamao de la muestra,
por lo tanto, se dir que a mayor nivel de confianza ms grande debe ser el tamao de la
muestra. Los niveles de confianza ms usados son 95% y 99%, pero se puede usar cualquier
otro. El nivel de confianza del 95% corresponde al valor de z=1.96, el del 99% a z=2.55 (ver
tabla de apndice D).
El margen de error lo designaremos con E. Si el error permitido es pequeo, se necesitar una
muestra grande. Si el error permitido es grande, se coger una muestra ms pequea.

7
Estadstica Inferencial

El tercer factor est relacionado con la desviacin estndar poblacional. Si la poblacin est
muy dispersa, se requerir una muestra grande. Si la poblacin es homognea, se requerir una
poblacin pequea
La frmula que nos permitir hallar el tamao de la muestra para estimar la media poblacional
est dado por:

z
2

n
E
Donde:
n es el tamao de la muestra
z es el valor normal estndar que corresponde al tamao de la muestra
es una estimacin de la desviacin estndar de la poblacin
E es el mximo error permitido

EJEMPLO
Se quiere determinar el ingreso medio mensual de los trabajadores de un cantn. El error al estimar la
media debe ser inferior a $100 con un nivel de confianza de 95%. Por estudios anteriores se sabe que la
desviacin estndar es de $1000. De qu tamao debe ser la muestra?
Como datos tenemos:
El valor de z para un nivel de confianza del %95 que es de z 1.96 (ver tabla de apndice D), E 100
y 1000 , al reemplazar en la frmula tenemos:

2
1.96 * $1000
n (19.6) 384.16
2

$100

El valor se redondea a 384, es decir se necesita una muestra de 384 trabajadores.


Si quisiramos aumentar el nivel de confianza a 99% el valor de z sera z 2.58 , y con las
dems condiciones anteriores el tamao de la muestra sera:

2
2.58 * $1000
n (25.8) 665.64
2

$100

8
Estadstica Inferencial

El tamao de la muestra recomendada sera de 666.


El aumento de un nivel de confianza de 95% a 99%, ocasiona un aumento de 282 trabajadores.
Esto podra incrementar enormemente el costo de la investigacin, tanto en trminos de
tiempo, como de dinero. Por lo tanto se tiene que ser muy cuidadoso al seleccionar el nivel de
confianza.

TAREA 1 Libro Estadstica para Administracin y Economa, de Lind-Marchal-Mason


Pag. 321, ejercicios 23 al 30.

3 PRUEBA DE HIPOTESIS DE UNA MUESTRA


Una prueba de hiptesis es una afirmacin o conjetura que se lanza sobre un parmetro
poblacional; su objetivo en un nivel de significancia o error es demostrar por medio de
resultados mustrales, si existe suficiente evidencia o no que apoye la hiptesis.
PASOS PARA UNA PRUEBA DE HIPOTESIS DE UNA MUESTRA
PASO 1. Plantear la hiptesis nula (H o) y la hiptesis alternativa (H1)
La hiptesis nula (Ho) es una afirmacin acerca del valor de un parmetro poblacional. La
hiptesis alternativa (H1) es una afirmacin que se acepta si los datos mustrales proporcionan
evidencia suficiente de que la hiptesis nula es falsa.
EJEMPLO 1
1.1 El peso promedio de los artculos exportados es de 20 kilos.
H 0 : 20
H 1 : 20
1.2 El tiempo promedio para atender a una persona en una cafetera es mnimo de 8 minutos.
H0 : 8
H1 : 8

1.3 Ms del 35% de las solicitudes de prstamo en el banco x son para vivienda.
H 0 : P 0.35
H 1 : P 0.35

1.4 Un fabricante de cierta marca de cereal de arroz afirma que el contenido de grasa saturada
no excede 1.5 gramos.

9
Estadstica Inferencial

H 0 : 1.5
H 1 : 1.5
PASO 2. Seleccionar el nivel de significancia
El nivel de significancia es la probabilidad de rechazar la hiptesis nula cuando es verdadera. Se
le denota mediante la letra griega , tambin es denominada como nivel de riesgo; este
trmino es ms adecuado, ya que se corre el riesgo de rechazar la hiptesis nula, cuando en
realidad es verdadera. Este nivel est bajo el control de la persona que realiza la prueba.
Si suponemos que la hiptesis planteada es verdadera, entonces, el nivel de significacin
indicar la probabilidad de no aceptarla, es decir, que est fuera de rea de aceptacin. El nivel
de confianza (1-) indica la probabilidad de aceptar la hiptesis planteada, cuando es verdadera
en la poblacin.
Tradicionalmente se selecciona el nivel 0.05 (5%) para proyectos de investigacin sobre
consumo, el nivel 0.01 (1%) para el aseguramiento de calidad, y el 0.10 (10%) para encuestas
polticas. El investigador es el que debe decidir qu nivel de significancia usar antes de formular
una regla de decisin y recopilar los datos mustrales.
PASO 3. Calcular el valor estadstico de prueba
Existen algunos estadsticos de prueba: La prueba F (Fisher), la prueba 2 (Ji cuadrada), la

prueba z y t. Nosotros utilizaremos las dos ltimas.


Si se conoce la desviacin estndar de la poblacin, el estadstico de prueba es la distribucin
normal estndar, y se determina a partir de:

X
z
/ n

Si no se conoce la desviacin estndar de la poblacin , pero se tiene al menos 30


observaciones en la muestra, se sustituye s por . El estadstico de prueba es la distribucin
normal estndar, y se determina a partir de:

X
z
s/ n

10
Estadstica Inferencial

Si no se conoce la desviacin estndar poblacional, pero se tiene menos de 30 observaciones


en la muestra, se sustituye s por . El estadstico de prueba es la distribucin t, y se determina
a partir de:

X
t
s/ n
PASO 4. Definir la regin de rechazo
Es necesario definir estadsticamente, y sujetos al nivel de significancia, el rea a partir de qu
valores vamos a aceptar la hiptesis nula y rechazar la hiptesis alternativa. Esto es lo que se
conoce como regin de rechazo. La regin de rechazo define la ubicacin de todos los valores
que son tan grandes o tan pequeos, que la probabilidad de que se presenten bajo la
suposicin de que la hiptesis nula es verdadera, es muy remota.

PASO 5. Tomar una decisin


El quinto y ltimo paso en una prueba de hiptesis es comparar el valor estadstico calculado
con el valor crtico, y tomar la decisin de rechazar o no la hiptesis nula.
Si el estadstico calculado es mayor que el valor crtico entonces se rechaza la hiptesis nula. Si
el estadstico calculado es menor o igual que el valor crtico, hiptesis nula no se rechaza.

PRUEBA DE SIGNIFICANCIA DE UNA Y DOS COLAS

11
Estadstica Inferencial

La figura muestra la regin de rechazo slo en la cola derecha de la distribucin normal.

La figura muestra la regin de rechazo slo en la cola izquierda de la distribucin normal.

La figura muestra la regin de rechazo en la cola izquierda y derecha de la distribucin normal.


En resumen, una prueba es de una cola cuando la hiptesis alternativa indica una direccin, por
ejemplo:
H0: El ingreso medio de ejecutivos es de $65000 por ao
H1: El ingreso medio de ejecutivos es superior a $65000 por ao
Si no se especifica direccin en la hiptesis alternativa, la prueba sera de dos colas.
H0: El ingreso medio de ejecutivos es de $65000 por ao
H1: El ingreso medio de ejecutivos no es igual a $65000 por ao

12
Estadstica Inferencial

Si se rechaza la hiptesis nula H0 , y se acepta la H1 , en el caso de dos colas, el ingreso medio


podra ser significativamente mayor que $65000 anuales o significativamente menor que
$65000 anuales.

13