Lectura Actividad - 4

ESCUELA DE CIENCIAS BÁSICAS TECNOLOGIAS E INGENIERIAS
100403- INFERENCIA ESTADÍSTICA

Act No. 4. Lección evaluativa No. 1
Contexto
Act. 4. Lección evaluativa No. 1
Objetivo
Reconocer las conceptualizaciones y elementos que se estudian en la unidad 1
y la relación entre los mismos.
Resumen
El presente recurso aborda la conceptualización necesaria para comprender el
contexto de la estimación, bien sea estimación puntual o por intervalos, y otros
temas propios de la unidad, así como una aplicación en Excel para construir
intervalos de confianza.
Palabras clave (Keywords)

Estadístico, estimador, estimación puntual, Muestreo, por conglomerados;
sistemático; estratificado; M.A.S, intervalo de confianza, parámetro.
Muestreo
Cuando un investigador realiza en ciencias sociales un experimento, una

encuesta o cualquier tipo de estudio, trata de obtener conclusiones generales
acerca de una población determinada. Para el estudio de ese grupo, tomará un
sector, al que se conoce como muestra.
Las poblaciones que el investigador puede estudiar son muy diversas, pero
generalmente se relacionan con personas. Por ejemplo, puede estudiar la
opinión de las amas de casa con respecto a ciertos métodos de planificación
familiar, la edad promedio de los alumnos de una escuela, el coeficiente
intelectual promedio de los universitarios, etc.
Desde luego, es de fundamental importancia que se empiece el estudio

definiendo la población que se va a estudiar. Las poblaciones suelen ser muy
numerosas, por lo que es difícil estudiar a todos sus miembros; además de que
esto no es posible, no es necesario. Es como si quisiéramos estudiar la
1
composición química del agua de un río y para ello tratáramos de analizar todo
el líquido que corre por su cauce, cuando solamente necesitamos algunas
muestras para realizar ese estudio y para llegar a conclusiones generalizables
con respecto a la composición química del agua a todo el río.
En ciencias sociales, las muestras no se obtienen tan fácilmente, puesto que

los eventos se relacionan siempre con personas, las cuales son mucho menos
estables en cuanto a sus pautas de actividades, valores, actitudes y conductas
que algunos de los fenómenos que se estudian en las ciencias naturales.
Muestra
Una muestra es un conjunto de unidades, una porción del total, que nos
representa la conducta del universo en su conjunto.
Una muestra, en un sentido amplio, no es más que eso, una parte del todo que
llamamos universo y que sirve para representarlo.
Sin embargo, no todas las muestras resultan útiles para llevar a cabo un
trabajo de investigación. Lo que se busca al emplear una muestra es que,
observando una porción relativamente reducida de unidades, se obtengan
conclusiones semejantes a las que lograríamos si estudiáramos el universo
total. Cuando una muestra cumple con esta condición, es decir, cuando nos
refleja en sus unidades lo que ocurre en el universo, la llamamos
muestra representativa. Por lo tanto, una muestra representativa contiene las
características relevantes de la población en las mismas proporciones en que
están incluidas en tal población. Sus conclusiones son susceptibles de ser
generalizadas al conjunto del universo, aunque para ello debamos añadir un
cierto margen de error en nuestras proyecciones.
Las muestras pueden ser clasificadas, en una primera división en

probabilísticas y no probabilísticas.
En las muestras probabilísticas, la característica fundamental es que todo

elemento del universo tiene una determinada probabilidad de integrar la
muestra, y esa probabilidad puede ser calculada matemáticamente con
precisión.
2
Muestras probabilísticas
En las muestras no probabilísticas ocurre lo contrario y el investigador no tiene

idea del error que puede estar introduciendo en sus apreciaciones.
Las muestras no probabilísticas más usadas son:
 Muestra accidental. Es aquella que se obtiene sin ningún plan

preconcebido; las unidades elegidas resultan producto de circunstancias
fortuitas. Si entrevistamos a los primeros 50 transeúntes que pasan por
cierta calle o medimos la profundidad del mar a lo largo de un trayecto
entre dos puntos cualesquiera, estaremos en presencia de una muestra
accidental.
 Muestra por cuotas. Consiste en predeterminar la cantidad de elementos
de cada categoría que habrán de integrar la muestra. Así podemos
asignar una cuota de 50 hombres y 50 mujeres a una muestra de 100
individuos, asumiendo que ésa es la distribución de la población total.
3
 Muestra intencional. Las unidades se eligen en forma arbitraria,

designando a cada unidad según características que para el investigador
resulten de relevancia. Se emplea, por lo tanto, el conocimiento y la
opinión personal para identificar aquellos elementos que deben ser
incluidos en la muestra. Se basa, primordialmente, en la experiencia de
alguien con la población.
Muestras aleatorias
Como dijimos, en ellas cada uno de los elementos del universo tiene una
probabilidad determinada y conocida de ser seleccionado. Los procedimientos
más usuales para la obtención de muestras aleatorias son
Azar simple. Este procedimiento se inicia confeccionando una lista de todas

las unidades que configuran el universo, numerando correlativamente cada
una de ellas. Luego, mediante cualquier sistema (tabla de números al azar,
programas de computación), se van sorteando al azar estos números hasta
completar el total de unidades que deseamos que entren en la muestra. De
este modo, la probabilidad que cada elemento tienen de aparecer en la
muestra es exactamente la misma. Si cada uno de los elementos que integran
la población no tiene la misma posibilidad de ser elegido, se habla entonces de
una muestra viciada. Este método nos garantiza una selección completamente
aleatoria, pero resulta muy lento y costoso, pues nos obliga a elaborar listas
completas de todas las unidades de interés, lo que a veces es sencillamente
imposible. Por este motivo, sólo se emplea cuando los universos son
relativamente pequeños.
 Azar sistemático. También se requiere de un listado completo de las

unidades que integran el universo en estudio. Luego se efectúan las
siguientes operaciones:
1. Se calcula la constante K, que resulta de dividir el número total de

unidades que componen el universo por el número de unidades que
habrán de integrar la muestra:
K = N/n
Donde:
N=número total de unidades que componen el universo.
n = número total de unidades que integrarán la muestra.
4
2. Se efectúa un sorteo para elegir un número que sea inferior o igual al

valor de K. Como primera unidad para integrar la muestra se elige
aquella que, en la lista general, posea idéntico número de orden al
sorteado. Si designamos con A este primer valor, la segunda unidad
elegida será la que lleve el número A + K, la tercera corresponderá a
A + 2K y así sucesivamente hasta llegar a A + (n – 1)K.
Tamaño de muestra y Error muestral
Recordemos que la muestra descansa en el principio de que las partes

representan al todo y, por tal, refleja las características que definen a la
población de la cual fue extraída, lo cual nos indica que es representativa. Es
decir, que para hacer una generalización exacta de una población, es necesario
tomar una muestra representativa. Por lo tanto, la validez de la generalización
depende de la validez y tamaño de la muestra.
Cuando trabajamos con muestras, generalmente se presentan dos tipos de

errores:
Error sistemático. Llamado de distorsión o sesgo de la muestra, se presentan
por causas ajenas a la muestra:
 Situaciones inadecuadas: se presentan, por ejemplo, cuando el

encuestador tiene dificultades para obtener la información y la sustituye
por la que más fácilmente está a su alcance, que no siempre es la más
confiable.
 Insuficiencia en la recolección de datos: hay distorsión por falta de
respuestas, o respuestas inadecuadas, ya sea por ignorancia o falta de
datos relativos a los elementos incluidos. Distorsiones del encuestador
causadas por prejuicios, interés personal o por fallas en la aplicación de
instrumentos.
 Errores de cobertura a causa de que no se han incluido elementos
importantes y significativos para la investigación que se realiza.
Error de muestreo o muestral. Cualquiera sea el procedimiento utilizado y

la perfección del método empleado, la muestra diferirá de la población. A esta
diferencia se la denomina error de muestreo.
Cuando una muestra es aleatoria o probabilística, es posible calcular sobre ella

el error muestral. Este error indica el porcentaje de incertidumbre, es decir,
el riesgo que se corre que la muestra elegida no sea representativa. Si
trabajamos con un error calculado en 5%, ello significa que existe un 95% de
5
probabilidades de que el conjunto muestral represente adecuadamente al

universo del cual ha sido extraído.
A medida que incrementamos el tamaño de la muestra, el error muestral

tiende a reducirse, pues la muestra va acercándose más al tamaño del
universo
Estimación
Un estadístico utilizado para aproximar un parámetro de población se

denomina estimador del parámetro. El número obtenido cuando se evalúa el
estimador para una muestra en particular, es una estimación del parámetro.
Para entender mejor este concepto se tiene el siguiente ejemplo:
Si se desea conocer el salario promedio de los docentes de la Universidad

Nacional Abierta y a Distancia se puede hacer dos cosas:
1. Registrar el sueldo mensual de todos y cada uno de los docentes y

calcular el valor promedio.
2. Tomar una muestra de los docentes y calcular el valor del salario
promedio de la muestra.
El valor que encontramos en el primer caso es el valor real y se

denomina parámetro. En el segundo caso tendremos un valor aproximado al
valor real que se denomina estimación. Es decir, un parámetro de la población
es estimado a partir de una muestra, siendo el estimador la función o
estadístico elegido entre los posibles para caracterizar al parámetro. El valor
tomado por dicho estimador en cada caso concreto recibe el nombre
de estimación.
Notación
En la notación utilizada en publicaciones sobre estos temas, los parámetros se

representan con letras griegas y los estimadores o estadísticos con letras
latinas. Es decir, si estamos hablando del promedio de todos los docentes se
denota como µ y el valor que arroja la muestra se denota como 𝑥 .
Buen estimador
Para lograr que la muestra nos permita obtener un estimador lo más cercano
al parámetro se deben cumplir dos condiciones:
6
 Asegurar un adecuado proceso de muestreo.

 Obtener un buen tamaño de muestra
Obtener un buen estimador permite sacar conclusiones que sean aplicables a

toda la población de la cual se sacó la muestra.
Se deben distinguir dos tipos de estimación: la estimación puntual y la

estimación por intervalo.
La estimación puntual
Consiste en asignar un único valor como estimación del parámetro; esta

estimación se utiliza cuando queremos conocer el valor concreto de un
parámetro poblacional y no disponemos de este valor.
La estimación por intervalo
Es aquella que calcula un intervalo que contenga entre sus límites, con cierta
probabilidad, el verdadero valor del parámetro poblacional. Este intervalo se
llama intervalo de confianza.
Concepto de Intervalo de Confianza.
Aunque la media muestral es un buen estimador para la media poblacional,

surge el problema de que un único valor observado de 𝑋 (media muestral)
generalmente no es igual a la media poblacional 𝜇. Habrá una diferencia entre
el verdadero valor del parámetro que se estudie, ya sea la media o proporción
por decir algo y la estimación del parámetro.
En el contexto de estimar un parámetro poblacional, un intervalo de confianza

es un rango de valores (calculado en una muestra) en el cual se encuentra el
verdadero valor del parámetro, con una probabilidad determinada. La
probabilidad de que el verdadero valor del parámetro se encuentre en el
intervalo construido se denomina nivel de confianza, y se denota 1-. La
probabilidad de equivocarnos se llama nivel de significancia y se simboliza .
Generalmente se construyen intervalos con confianza 1-= 95% (o
significancia =5%). Menos frecuentes son los intervalos con =10% o
=1%.
Como su nombre lo indica un intervalo de confianza es una expresión de la

forma:
𝜃 − 𝜎𝜃 , 𝜃 + 𝜎𝜃
7
Dónde,
𝜃: Estimador
𝜎𝜃 : Desviación estándar de la distribución del estimador (error estándar)
Por ejemplo, Germán cita a su novia a la 7:20 pm, pero por experiencia (en las
últimas citas) sabe que ella no es puntual, por tanto le sugiere que se ven
entre las 6:00 pm y las 7:00 pm, esto quiere decir que se verán en el intervalo
de tiempo de [6, 7] dicho intervalo tiene una amplitud de 1 hora.
En el caso anterior Germán puede comparar la hora real en que llega su novia
con el parámetro poblacional, y la estimación con la hora que cree llegará
según lo visto en las últimas 10 citas; entre tanto el error estándar será la
desviación del tiempo de llegada, así construye un intervalo de confianza a
partir de la estimación, pudiendo decir que con una confianza del 95% ella
estará entre las 6 y 7 pm, es decir en 95 de 100 citas ella llegará después de
las 6 pero antes de las 7.
La amplitud del intervalo
Depende de tres factores:
 La confianza deseada.
 La desviación estándar
 El tamaño muestral
Si se amplía el intervalo, se gana error, se pierde confianza.
Para el caso de Germán, si aumenta la confianza (1-)%, y desea una de 98%

el intervalo será más grande, por ejemplo la hora de llegada de su novia será
[5:30, 7:30].
Valor crítico
Se representa por Z/2. Es el valor de la abscisa en una determinada

distribución que deja a su derecha un área igual a /2, siendo 1- el nivel de
confianza. Normalmente los valores críticos están tabulados o pueden
calcularse en función de la distribución de la población. Por ejemplo, para una
8
distribución normal, de media 0 y desviación típica 1, el valor crítico para

= 0,05 se calcularía del siguiente modo:
Clic para ver:

Valor crítico en
Intervalo de
confianza
Recursos
Muestra Representativa – Caso Real –
Aplet: Estimación por intervalos
Concepto: Estimación

Lectura Actividad - 4

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Lectura Actividad - 4

Uploaded by

Copyright:

Available Formats

ESCUELA DE CIENCIAS BÁSICAS TECNOLOGIAS E INGENIERIAS

100403- INFERENCIA ESTADÍSTICA

Palabras clave (Keywords)

Cuando un investigador realiza en ciencias sociales un experimento, una

Desde luego, es de fundamental importancia que se empiece el estudio

En ciencias sociales, las muestras no se obtienen tan fácilmente, puesto que

Las muestras pueden ser clasificadas, en una primera división en

En las muestras probabilísticas, la característica fundamental es que todo

En las muestras no probabilísticas ocurre lo contrario y el investigador no tiene

Las muestras no probabilísticas más usadas son:

 Muestra accidental. Es aquella que se obtiene sin ningún plan

 Muestra intencional. Las unidades se eligen en forma arbitraria,

Azar simple. Este procedimiento se inicia confeccionando una lista de todas

 Azar sistemático. También se requiere de un listado completo de las

1. Se calcula la constante K, que resulta de dividir el número total de

2. Se efectúa un sorteo para elegir un número que sea inferior o igual al

Tamaño de muestra y Error muestral

Recordemos que la muestra descansa en el principio de que las partes

Cuando trabajamos con muestras, generalmente se presentan dos tipos de

 Situaciones inadecuadas: se presentan, por ejemplo, cuando el

Error de muestreo o muestral. Cualquiera sea el procedimiento utilizado y

Cuando una muestra es aleatoria o probabilística, es posible calcular sobre ella

probabilidades de que el conjunto muestral represente adecuadamente al

A medida que incrementamos el tamaño de la muestra, el error muestral

Un estadístico utilizado para aproximar un parámetro de población se

Para entender mejor este concepto se tiene el siguiente ejemplo:

Si se desea conocer el salario promedio de los docentes de la Universidad

1. Registrar el sueldo mensual de todos y cada uno de los docentes y

El valor que encontramos en el primer caso es el valor real y se

En la notación utilizada en publicaciones sobre estos temas, los parámetros se

 Asegurar un adecuado proceso de muestreo.

Obtener un buen estimador permite sacar conclusiones que sean aplicables a

Se deben distinguir dos tipos de estimación: la estimación puntual y la

Consiste en asignar un único valor como estimación del parámetro; esta

La estimación por intervalo

Concepto de Intervalo de Confianza.

Aunque la media muestral es un buen estimador para la media poblacional,

En el contexto de estimar un parámetro poblacional, un intervalo de confianza

Como su nombre lo indica un intervalo de confianza es una expresión de la

𝜎𝜃 : Desviación estándar de la distribución del estimador (error estándar)

La amplitud del intervalo

Depende de tres factores:

Si se amplía el intervalo, se gana error, se pierde confianza.

Para el caso de Germán, si aumenta la confianza (1-)%, y desea una de 98%

Se representa por Z/2. Es el valor de la abscisa en una determinada

distribución normal, de media 0 y desviación típica 1, el valor crítico para

Clic para ver:

Muestra Representativa – Caso Real –

Aplet: Estimación por intervalos

You might also like