You are on page 1of 9

ESCUELA DE CIENCIAS BÁSICAS TECNOLOGIAS E INGENIERIAS

100403- INFERENCIA ESTADÍSTICA


Act No. 4. Lección evaluativa No. 1

Contexto
Act. 4. Lección evaluativa No. 1
Objetivo
Reconocer las conceptualizaciones y elementos que se estudian en la unidad 1
y la relación entre los mismos.

Resumen
El presente recurso aborda la conceptualización necesaria para comprender el
contexto de la estimación, bien sea estimación puntual o por intervalos, y otros
temas propios de la unidad, así como una aplicación en Excel para construir
intervalos de confianza.

Palabras clave (Keywords)


Estadístico, estimador, estimación puntual, Muestreo, por conglomerados;
sistemático; estratificado; M.A.S, intervalo de confianza, parámetro.

Muestreo

Cuando un investigador realiza en ciencias sociales un experimento, una


encuesta o cualquier tipo de estudio, trata de obtener conclusiones generales
acerca de una población determinada. Para el estudio de ese grupo, tomará un
sector, al que se conoce como muestra.

Las poblaciones que el investigador puede estudiar son muy diversas, pero
generalmente se relacionan con personas. Por ejemplo, puede estudiar la
opinión de las amas de casa con respecto a ciertos métodos de planificación
familiar, la edad promedio de los alumnos de una escuela, el coeficiente
intelectual promedio de los universitarios, etc.

Desde luego, es de fundamental importancia que se empiece el estudio


definiendo la población que se va a estudiar. Las poblaciones suelen ser muy
numerosas, por lo que es difícil estudiar a todos sus miembros; además de que
esto no es posible, no es necesario. Es como si quisiéramos estudiar la

1
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGIAS E INGENIERIAS
100403- INFERENCIA ESTADÍSTICA
Act No. 4. Lección evaluativa No. 1

composición química del agua de un río y para ello tratáramos de analizar todo
el líquido que corre por su cauce, cuando solamente necesitamos algunas
muestras para realizar ese estudio y para llegar a conclusiones generalizables
con respecto a la composición química del agua a todo el río.

En ciencias sociales, las muestras no se obtienen tan fácilmente, puesto que


los eventos se relacionan siempre con personas, las cuales son mucho menos
estables en cuanto a sus pautas de actividades, valores, actitudes y conductas
que algunos de los fenómenos que se estudian en las ciencias naturales.

Muestra

Una muestra es un conjunto de unidades, una porción del total, que nos
representa la conducta del universo en su conjunto.

Una muestra, en un sentido amplio, no es más que eso, una parte del todo que
llamamos universo y que sirve para representarlo.

Sin embargo, no todas las muestras resultan útiles para llevar a cabo un
trabajo de investigación. Lo que se busca al emplear una muestra es que,
observando una porción relativamente reducida de unidades, se obtengan
conclusiones semejantes a las que lograríamos si estudiáramos el universo
total. Cuando una muestra cumple con esta condición, es decir, cuando nos
refleja en sus unidades lo que ocurre en el universo, la llamamos
muestra representativa. Por lo tanto, una muestra representativa contiene las
características relevantes de la población en las mismas proporciones en que
están incluidas en tal población. Sus conclusiones son susceptibles de ser
generalizadas al conjunto del universo, aunque para ello debamos añadir un
cierto margen de error en nuestras proyecciones.

Las muestras pueden ser clasificadas, en una primera división en


probabilísticas y no probabilísticas.

En las muestras probabilísticas, la característica fundamental es que todo


elemento del universo tiene una determinada probabilidad de integrar la
muestra, y esa probabilidad puede ser calculada matemáticamente con
precisión.

2
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGIAS E INGENIERIAS
100403- INFERENCIA ESTADÍSTICA
Act No. 4. Lección evaluativa No. 1

Muestras probabilísticas

En las muestras no probabilísticas ocurre lo contrario y el investigador no tiene


idea del error que puede estar introduciendo en sus apreciaciones.

Las muestras no probabilísticas más usadas son:

 Muestra accidental. Es aquella que se obtiene sin ningún plan


preconcebido; las unidades elegidas resultan producto de circunstancias
fortuitas. Si entrevistamos a los primeros 50 transeúntes que pasan por
cierta calle o medimos la profundidad del mar a lo largo de un trayecto
entre dos puntos cualesquiera, estaremos en presencia de una muestra
accidental.
 Muestra por cuotas. Consiste en predeterminar la cantidad de elementos
de cada categoría que habrán de integrar la muestra. Así podemos
asignar una cuota de 50 hombres y 50 mujeres a una muestra de 100
individuos, asumiendo que ésa es la distribución de la población total.

3
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGIAS E INGENIERIAS
100403- INFERENCIA ESTADÍSTICA
Act No. 4. Lección evaluativa No. 1

 Muestra intencional. Las unidades se eligen en forma arbitraria,


designando a cada unidad según características que para el investigador
resulten de relevancia. Se emplea, por lo tanto, el conocimiento y la
opinión personal para identificar aquellos elementos que deben ser
incluidos en la muestra. Se basa, primordialmente, en la experiencia de
alguien con la población.

Muestras aleatorias

Como dijimos, en ellas cada uno de los elementos del universo tiene una
probabilidad determinada y conocida de ser seleccionado. Los procedimientos
más usuales para la obtención de muestras aleatorias son

Azar simple. Este procedimiento se inicia confeccionando una lista de todas


las unidades que configuran el universo, numerando correlativamente cada
una de ellas. Luego, mediante cualquier sistema (tabla de números al azar,
programas de computación), se van sorteando al azar estos números hasta
completar el total de unidades que deseamos que entren en la muestra. De
este modo, la probabilidad que cada elemento tienen de aparecer en la
muestra es exactamente la misma. Si cada uno de los elementos que integran
la población no tiene la misma posibilidad de ser elegido, se habla entonces de
una muestra viciada. Este método nos garantiza una selección completamente
aleatoria, pero resulta muy lento y costoso, pues nos obliga a elaborar listas
completas de todas las unidades de interés, lo que a veces es sencillamente
imposible. Por este motivo, sólo se emplea cuando los universos son
relativamente pequeños.

 Azar sistemático. También se requiere de un listado completo de las


unidades que integran el universo en estudio. Luego se efectúan las
siguientes operaciones:

1. Se calcula la constante K, que resulta de dividir el número total de


unidades que componen el universo por el número de unidades que
habrán de integrar la muestra:

K = N/n

Donde:
N=número total de unidades que componen el universo.
n = número total de unidades que integrarán la muestra.

4
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGIAS E INGENIERIAS
100403- INFERENCIA ESTADÍSTICA
Act No. 4. Lección evaluativa No. 1

2. Se efectúa un sorteo para elegir un número que sea inferior o igual al


valor de K. Como primera unidad para integrar la muestra se elige
aquella que, en la lista general, posea idéntico número de orden al
sorteado. Si designamos con A este primer valor, la segunda unidad
elegida será la que lleve el número A + K, la tercera corresponderá a
A + 2K y así sucesivamente hasta llegar a A + (n – 1)K.

Tamaño de muestra y Error muestral

Recordemos que la muestra descansa en el principio de que las partes


representan al todo y, por tal, refleja las características que definen a la
población de la cual fue extraída, lo cual nos indica que es representativa. Es
decir, que para hacer una generalización exacta de una población, es necesario
tomar una muestra representativa. Por lo tanto, la validez de la generalización
depende de la validez y tamaño de la muestra.

Cuando trabajamos con muestras, generalmente se presentan dos tipos de


errores:
Error sistemático. Llamado de distorsión o sesgo de la muestra, se presentan
por causas ajenas a la muestra:

 Situaciones inadecuadas: se presentan, por ejemplo, cuando el


encuestador tiene dificultades para obtener la información y la sustituye
por la que más fácilmente está a su alcance, que no siempre es la más
confiable.
 Insuficiencia en la recolección de datos: hay distorsión por falta de
respuestas, o respuestas inadecuadas, ya sea por ignorancia o falta de
datos relativos a los elementos incluidos. Distorsiones del encuestador
causadas por prejuicios, interés personal o por fallas en la aplicación de
instrumentos.
 Errores de cobertura a causa de que no se han incluido elementos
importantes y significativos para la investigación que se realiza.

Error de muestreo o muestral. Cualquiera sea el procedimiento utilizado y


la perfección del método empleado, la muestra diferirá de la población. A esta
diferencia se la denomina error de muestreo.

Cuando una muestra es aleatoria o probabilística, es posible calcular sobre ella


el error muestral. Este error indica el porcentaje de incertidumbre, es decir,
el riesgo que se corre que la muestra elegida no sea representativa. Si
trabajamos con un error calculado en 5%, ello significa que existe un 95% de

5
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGIAS E INGENIERIAS
100403- INFERENCIA ESTADÍSTICA
Act No. 4. Lección evaluativa No. 1

probabilidades de que el conjunto muestral represente adecuadamente al


universo del cual ha sido extraído.

A medida que incrementamos el tamaño de la muestra, el error muestral


tiende a reducirse, pues la muestra va acercándose más al tamaño del
universo

Estimación

Un estadístico utilizado para aproximar un parámetro de población se


denomina estimador del parámetro. El número obtenido cuando se evalúa el
estimador para una muestra en particular, es una estimación del parámetro.

Para entender mejor este concepto se tiene el siguiente ejemplo:

Si se desea conocer el salario promedio de los docentes de la Universidad


Nacional Abierta y a Distancia se puede hacer dos cosas:

1. Registrar el sueldo mensual de todos y cada uno de los docentes y


calcular el valor promedio.
2. Tomar una muestra de los docentes y calcular el valor del salario
promedio de la muestra.

El valor que encontramos en el primer caso es el valor real y se


denomina parámetro. En el segundo caso tendremos un valor aproximado al
valor real que se denomina estimación. Es decir, un parámetro de la población
es estimado a partir de una muestra, siendo el estimador la función o
estadístico elegido entre los posibles para caracterizar al parámetro. El valor
tomado por dicho estimador en cada caso concreto recibe el nombre
de estimación.

Notación

En la notación utilizada en publicaciones sobre estos temas, los parámetros se


representan con letras griegas y los estimadores o estadísticos con letras
latinas. Es decir, si estamos hablando del promedio de todos los docentes se
denota como µ y el valor que arroja la muestra se denota como 𝑥 .

Buen estimador

Para lograr que la muestra nos permita obtener un estimador lo más cercano
al parámetro se deben cumplir dos condiciones:

6
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGIAS E INGENIERIAS
100403- INFERENCIA ESTADÍSTICA
Act No. 4. Lección evaluativa No. 1

 Asegurar un adecuado proceso de muestreo.


 Obtener un buen tamaño de muestra

Obtener un buen estimador permite sacar conclusiones que sean aplicables a


toda la población de la cual se sacó la muestra.

Se deben distinguir dos tipos de estimación: la estimación puntual y la


estimación por intervalo.

La estimación puntual

Consiste en asignar un único valor como estimación del parámetro; esta


estimación se utiliza cuando queremos conocer el valor concreto de un
parámetro poblacional y no disponemos de este valor.

La estimación por intervalo

Es aquella que calcula un intervalo que contenga entre sus límites, con cierta
probabilidad, el verdadero valor del parámetro poblacional. Este intervalo se
llama intervalo de confianza.

Concepto de Intervalo de Confianza.

Aunque la media muestral es un buen estimador para la media poblacional,


surge el problema de que un único valor observado de 𝑋 (media muestral)
generalmente no es igual a la media poblacional 𝜇. Habrá una diferencia entre
el verdadero valor del parámetro que se estudie, ya sea la media o proporción
por decir algo y la estimación del parámetro.

En el contexto de estimar un parámetro poblacional, un intervalo de confianza


es un rango de valores (calculado en una muestra) en el cual se encuentra el
verdadero valor del parámetro, con una probabilidad determinada. La
probabilidad de que el verdadero valor del parámetro se encuentre en el
intervalo construido se denomina nivel de confianza, y se denota 1-. La
probabilidad de equivocarnos se llama nivel de significancia y se simboliza .
Generalmente se construyen intervalos con confianza 1-= 95% (o
significancia =5%). Menos frecuentes son los intervalos con =10% o
=1%.

Como su nombre lo indica un intervalo de confianza es una expresión de la


forma:

𝜃 − 𝜎𝜃 , 𝜃 + 𝜎𝜃

7
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGIAS E INGENIERIAS
100403- INFERENCIA ESTADÍSTICA
Act No. 4. Lección evaluativa No. 1

Dónde,

𝜃: Estimador

𝜎𝜃 : Desviación estándar de la distribución del estimador (error estándar)

Por ejemplo, Germán cita a su novia a la 7:20 pm, pero por experiencia (en las
últimas citas) sabe que ella no es puntual, por tanto le sugiere que se ven
entre las 6:00 pm y las 7:00 pm, esto quiere decir que se verán en el intervalo
de tiempo de [6, 7] dicho intervalo tiene una amplitud de 1 hora.

En el caso anterior Germán puede comparar la hora real en que llega su novia
con el parámetro poblacional, y la estimación con la hora que cree llegará
según lo visto en las últimas 10 citas; entre tanto el error estándar será la
desviación del tiempo de llegada, así construye un intervalo de confianza a
partir de la estimación, pudiendo decir que con una confianza del 95% ella
estará entre las 6 y 7 pm, es decir en 95 de 100 citas ella llegará después de
las 6 pero antes de las 7.

La amplitud del intervalo

Depende de tres factores:

 La confianza deseada.
 La desviación estándar
 El tamaño muestral

Si se amplía el intervalo, se gana error, se pierde confianza.

Para el caso de Germán, si aumenta la confianza (1-)%, y desea una de 98%


el intervalo será más grande, por ejemplo la hora de llegada de su novia será
[5:30, 7:30].

Valor crítico

Se representa por Z/2. Es el valor de la abscisa en una determinada


distribución que deja a su derecha un área igual a /2, siendo 1- el nivel de
confianza. Normalmente los valores críticos están tabulados o pueden
calcularse en función de la distribución de la población. Por ejemplo, para una

8
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGIAS E INGENIERIAS
100403- INFERENCIA ESTADÍSTICA
Act No. 4. Lección evaluativa No. 1

distribución normal, de media 0 y desviación típica 1, el valor crítico para


= 0,05 se calcularía del siguiente modo:

Clic para ver:


Valor crítico en
Intervalo de
confianza

Recursos

Muestra Representativa – Caso Real –

Aplet: Estimación por intervalos

Concepto: Estimación

You might also like