You are on page 1of 14

Ing.

Allan Silva

Determinando la población y la muestra

Una vez definido el problema a investigar, formulados los objetivos y delimitadas las
variables, se hace necesario determinar los elementos o
individuos con quienes se va a llevar a cabo el estudio o
investigación.

Es el momento de delimitar el ámbito de tu investigación


definiendo una población y seleccionando la muestra.

Se debe recordar que las variables siempre están ubicadas –o contenidas‐ en


algún elemento, sea persona (Ej. edad, sexo, inteligencia, categoría laboral,
desempeño, etc.), cosa (Ej. informes, empresas, oficinas, leyes, etc.) o situaciones.
A estos elementos se les llama “unidad de análisis” y el conjunto de todas las
unidades de análisis se conoce como “población”.

Muchas veces es imposible tener contacto y observar a todas las unidades de análisis,
por lo que es necesario seleccionar un sub‐conjunto que represente apropiadamente
a toda la población. Este sub‐conjunto es conocido con el nombre de “muestra”. El
proceso mediante el cual este sub‐conjunto es seleccionado se denomina “muestreo”.

La población (denotada como “N”) es el conjunto de todos los individuos (objetos,


personas, eventos, situaciones, etc.) en los que se desea investigar algunas
propiedades. La población es el conjunto de individuos que tienen una o más
propiedades en común, se encuentran en un espacio o territorio y varían en el
transcurso del tiempo.

En una investigación se puede tener más de una población, todo depende de la


complejidad y variedad de los objetivos de investigación. A veces, cada objetivo
requiere una población distinta. Si tienes más de una población, debes especificarla y
describirla con detalle.

La muestra (denotada como “n”) es el conjunto de casos extraídos de una población,


seleccionados por algún método de muestreo. La muestra siempre es una parte de la
población. Si tienes varias poblaciones, entonces tendrás varias muestras.

Entonces, ahora ya sabes qué es unidad de análisis, población, muestra y muestreo.


Analicemos en detalle el muestreo.
Ing. Allan Silva

¿Qué es el muestreo?

El muestreo es el proceso de extraer una muestra a partir de una población.

Cuando te extraen sangre para analizarla, no te la extraen toda porque morirías. Te


extraen solamente una pequeña muestra. Con esa muestra es suficiente para
determinar con precisión las características de toda tu sangre, saber si estás anémico,
si tienes alguna enfermedad, etc. Lo mismo sucede con la investigación. En la práctica
no es necesario estudiar toda la población para resolver el problema de investigación,
sino que, en general, se puede lograr los objetivos solo con una parte representativa
de ella.

El muestreo proporciona muchas ventajas: a) ahorra tiempo,


b) reduce costos y c) posibilita mayor profundidad y exactitud
en los resultados. Sin embargo, tiene algunos
inconvenientes: a) es dificultoso, b) una muestra mal
seleccionada o sesgada distorsiona tus resultados, c) las
limitaciones propias del tipo de muestreo.

Veamos cuáles son las etapas típicas del muestreo.

¿Cuáles son las etapas del muestreo?

El muestreo tiene seis etapas muy bien definidas. Cada una de las etapas requiere
que tomes decisiones. Veamos cada una de ellas:

Selecciona
c a
Identifica el
e los in
ndividuos
marco de tuu
poblacion al. muestra.
c
Calcula el
tam año
muetral.
Determina si
realizarás
muestreo y
el tipo
Define la adecuado.
unidad de
análisis y
población.
Ing. Allan Silva

1. Definir la unidad de análisis y la población de estudio.


Es decir, identificar los criterios de inclusión y exclusión de la población y
precisar el tamaño de la población. Esta etapa la terminas cuando sabes a
cuánto asciende el tamaño de tu población de estudio, y qué criterios de inclusión y
exclusión empleas para delimitarla.

• Para seleccionar una muestra lo primero es definir la unidad de análisis


(“quiénes van a ser estudiados”). Esto depende del problema a investigar y de
los objetivos de la investigación.
• Una vez definida la unidad de análisis se debe delimitar la población.
Una población es el conjunto de todos los casos que concuerdan con una serie
de especificaciones (criterios de inclusión y exclusión).
• La población debe situarse claramente en torno a sus características de
contenido, lugar y tiempo.

2. Determinar si se realizará muestreo o si se trabajará con toda la población.


Si la población es pequeña y se puede acceder a ella sin restricciones, entonces
se trabajará con toda la población. Si la población es muy grande o es
demasiado costoso trabajar con toda la población, entonces conviene utilizar una
muestra.

3. Determinar el tipo de muestreo a emplear.


Precisar si se utilizará un muestreo probabilístico o no probabilístico. Precisar qué
sub‐tipo de muestreo se empleará. Se pretende que la muestra sea un reflejo fiel
de la población (que sea representativa).

4. Calcular el tamaño de la muestra.


Utilizando fórmulas estadísticas o cualitativas, calcula el tamaño mínimo de la
muestra requerido para tu estudio.

5. Identificar el marco poblacional de donde se extraerá la muestra.


Determinado el tamaño de la muestra, es necesario identificar a cada uno de los
elegidos. Para ello se utiliza el “marco poblacional”, que es una lista donde están
identificados todos elementos de la población.

6. Seleccionar a los individuos de la población que conformarán la muestra.


Si utilizas un muestreo probabilístico, utilizarás una tabla de números aleatorios
para seleccionar ‐del marco muestral‐ a cada uno de los integrantes de la muestra.

Estas etapas son genéricas, casi siempre idénticas para todas las investigaciones. Las
variaciones ocurren dependiendo del tipo de investigación que se realiza.
Ing. Allan Silva

¿Qué son los criterios de inclusión y exclusión?

Los criterios de inclusión y exclusión son características que sirven


para diferenciar quién participa como población en la
investigación y quién no. Los criterios de inclusión y exclusión son
demarcadores, son límites que discriminan entre los que serán
parte del estudio y los que no lo serán.

Si estás investigando empresas agropecuarias, no todos serán parte del


estudio, seguro que sólo te interesan las que cumplan ciertos criterios. Estos
pueden ser, a modo de ejemplo: a) Tamaño (micro), b) antigüedad (<3 años), c) que
sean pertenecientes a un departamento, d) que sean informales.

Es importante que identifiques estos criterios y que lo hagas explícito en tu proyecto


de investigación.

Ejemplo

“…La población está constituida por los estudiantes de nivel secundario de las
instituciones educativas públicas. Los criterios de inclusión y exclusión considerados
para la delimitación poblacional son los siguientes:
• Sexo masculino: solo varones.
• Edades comprendidas entre 12 y 14 años de edad.
• Que cursen entre 1° y 3° año de secundaria.
• Que estudien en turno mañana o tarde.
• Que estudien en instituciones educativas públicas.
Considerando estos criterios, el tamaño de la población asciende a 4,632
estudiantes…”

Esta es la forma típica como debes redactar la identificación de tu población y la


demarcación de los criterios de inclusión‐exclusión.

¿Cuántos tipos de muestreo hay?

En el paso 3 de las etapas del muestreo es necesario determinar qué tipo de


muestreo se empleará. Al respecto, existen dos tipos generales de muestreo: a) el
muestreo probabilístico y b) el muestreo no probabilístico.

En las muestras probabilísticas, todo integrante de la población tiene una probabilidad


determinada y conocida de conformar la muestra, y esa probabilidad puede ser
calculada con precisión estadística. Los muestreos probabilísticos son los muestreos
más confiables pero los más complicados.
Ing. Allan Silva
En las muestras no probabilísticas ocurre lo contrario, todo integrante de la
población no tiene una probabilidad determinada, tampoco es conocida, de
conformar la muestra. Los criterios para seleccionar la muestra no son estadísticos,
son racionales, por eso el investigador no tiene idea del error que puede estar
introduciendo en su muestra. Las muestras no probabilísticas son las menos
confiables, pero las más frecuentes, por ser más económicas y, algunas veces, más
convenientes.

¿Qué es el muestreo probabilístico?

Conocido también como “muestreo aleatorio”, utiliza el azar y las estadísticas como
instrumentos de selección, pudiéndose calcular de antemano la probabilidad de que
cada elemento de la población sea incluido en la muestra.

Este tipo de muestreo es el que alcanza mayor rigor científico, y se caracteriza porque
se cumple el principio de la equi‐probabilidad, según el cual todos los elementos de la
población tienen la misma probabilidad de ser elegidos en una muestra. Las muestras
probabilísticas siempre son representativas de la población. Y como son
representativas, con este muestreo se puede generalizar con precisión los resultados
a la población.

La muestra probabilística es la más adecuada para identificar índices y describir


poblaciones mediante muestras. Por eso, este tipo de muestreo es típico y necesario
cuando estás realizando investigaciones cuantitativas, descriptivas y correlacionales.

Ejemplo

Un investigador quiere determinar cuántas empresas manufactureras de 3 a 5 años


de antigüedad presentan problemas logísticos y cuántos no, y qué variables están
asociadas, en San Juan de R i o C o c o . Por eso, realiza un muestreo probabilístico
local de 350 empresas solo para San Juan.

Los muestreos probabilísticos son los más costosos. Requieren más tiempo y
recursos. Es más lento y complicado. Sin embargo, su costo vale la pena porque los
resultados se pueden generalizar a toda la población.
Ing. Allan Silva

¿Cuántos tipos de muestreo probabilístico hay?

El “muestreo por azar” o muestreo probabilístico presenta varios tipos:


1. Muestreo aleatorio simple.
2. Muestreo sistemático.
3. Muestreo estratificado.
4. Muestreo por conglomerados
5. Muestreo polietápico.

Muestreo Aleatorio Simple.

Es la modalidad de muestreo más conocida y que alcanza mayor rigor científico.


Garantiza la equi‐probabilidad de elección de cualquier elemento y la independencia
de selección de cualquier otro. En este procedimiento se extraen al azar un número
determinado de elementos (conocido como ‘n’), de la población (conocido como ‘N’).
La secuencia es:

a) Definir la población.
b) Elaborar una lista de toda la población, asignándoles números consecutivos
desde 1 hasta ‘n’.
c) Calcular el tamaño de la muestra.
d) Extraer al azar los elementos hasta completar el número calculado (utilizando
tablas de números aleatorios o programas de computadora como el SPSS).

Muestreo Aleatorio Sistemático.

Es una variante del muestreo simple. Este muestreo es más rápido que el anterior,
sobre todo si la población es numerosa y está previamente ordenada. La forma de
selección utiliza un sistema sencillo. Observa.

Ejemplo

Tenemos 10,000 F i n c a s (en una lista) y queremos obtener una muestra de 100.
Primero elegimos al azar una empresa entre los 10000/100=100 primeros
(supongamos que salga el 26), el segundo elemento será la finca 100+26 (126), la
siguiente será el 226, luego el 326, etc.

La elección sistemática partiendo de listas es válida si el orden no ha sido establecido


teniendo en cuenta la característica que estudiamos. No pueden servir, por ejemplo,
listas en orden de ingresos, si ésta es una de las variables de investigación.

Muestreo Estratificado.

Este muestreo se utiliza cuando la población está constituida en estratos o subgrupos


(conjuntos homogéneos con respecto a la característica que se estudia). Dentro de
cada estrato se puede aplicar el muestreo aleatorio simple o sistemático.
Ing. Allan Silva

El muestreo estratificado consiste en sub‐dividir la población en subgrupos o estratos


según las características que se consideren y en elegir la muestra de modo que estén
representados los diferentes estratos.

Para obtener la muestra estratificada, se siguen los siguientes pasos:

a) Se divide la población en estratos.


b) De cada estrato se extrae una muestra por muestreo aleatorio simple.
c) Se asigna a cada individuo según ciertas reglas de afijación (simple, proporcional,
óptima).
d) La suma de las muestras de cada estrato forman la muestra total ‘n’.

Ejemplo

Supongamos que, en Estelí, 70% de empresas son informales y el 30% formales. Si


queremos encuestar a 100 empresas, lo que haremos es dividir las empresas en 2
estratos (formales e informales) y se eligen aleatoriamente 70 empresas informales y
aleatoriamente 30 formales.

Observa, en el siguiente ejemplo, la forma como se presenta un muestreo probabilístico


estratificado en el proyecto de investigación.
Ing. Allan Silva

Ejemplo

“Del total de Defensorías de la Niñez, dentro de Nicaragua (N=1,537), fueron seleccionadas


aleatoriamente 148 . Se usó un muestreo probabilístico estratificado.

Para la asignación de los tamaños muestrales a los diferentes estratos en el muestreo


aleatorio estratificado se utilizó el procedimiento de asignación proporcional.

La selección de la muestra de acuerdo a los estratos respectivos, se obtuvo a través de una


tabla de números aleatorios.

Los valores se presentan en la siguiente tabla.

Estratos Población de Muestra Proporción n/N (%)


Defensorias

Escolar 494 48 32.1

Comunal 261 25 17.0

Regional 470 45 30.6

Departamental 154 15 10.0

Parroquial 55 5 3.6

Centro Pobl. 40 4 2.6


ONG 38 4 2.5
Otros 25 2 1.6
Total 1537 148 100.0
Nota: Observa que en esta tabla se presentan los estratos (columna 1), la población inicial,
la muestra calculada y la proporción entre la muestra y la población. Esa es la forma típica
de presentar un muestreo estratificado.
Ing. Allan Silva

Muestreo por Conglomerados.

Este tipo de muestreo se utiliza cuando los individuos de la población constituyen


grupos naturales muy grandes o conglomerados que contienen otros grupos más
pequeños de forma sucesiva (Ej. País, región, distrito, organismos, oficinas, etc.).

Esta técnica es útil porque no es necesario identificar ni tener un listado de todos los
elementos de la población para seleccionarlos aleatoriamente, sino que después de
seleccionar los conglomerados, se procede a elaborar dicho listado sólo para los
elementos que componen los conglomerados elegidos.

En el muestreo por grupos el proceso sigue estos pasos:

1. La población se divide previamente en grupos o conglomerados que contienen


diversos elementos.
2. Se seleccionan aleatoriamente el número de conglomerados y se trabaja con
el total de elementos pertenecientes a los conglomerados elegidos.
3. La unidad muestral es el conglomerado (cluster) o grupo y el proceso de
selección aleatoria se aplica a la selección de éstos y no a los elementos
menores que componen el conglomerado.

Se quiere realizar una encuesta nacional durante las elecciones de la nueva directiva
del C S E . Los conglomerados, en este caso, pueden ser los distritos electorales y,
dentro de ellos, las mesas electorales. Con este muestreo lo que se hace es escoger
algunos distritos electorales y luego, dentro de ellos, algunas mesas electorales al azar
y de ahí se toman todos los votos de las mesas seleccionadas.

Muestreo Polietápico.

En este caso se combina el muestreo aleatorio simple con el muestreo por


conglomerados. Primero se realiza un muestreo por conglomerados (Ej. si los
conglomerados son colegios en Lima, se seleccionan aleatoriamente varios de ellos).
Segundo, no se eligen todos los estudiantes (como ocurriría en un muestro por
conglomerados), sino que se elige una muestra aleatoria (dicha muestra puede ser
obtenida por muestreo aleatorio simple o puede ser estratificado).

El proceso sigue una secuencia de etapas de selección de unidades muestrales de


mayor rango a otras de menor, hasta llegar a los individuos o elementos que
constituyen la muestra: provincia, distrito escolar, centros, aulas, estudiantes. Este
tipo de muestreo sólo necesita conocer los individuos que integran los
conglomerados de la última etapa.

A continuación te presento una tabla resumen de los muestreos probabilísticos.


Ing. Allan Silva
Características, ventajas y desventajas de los muestreos probabilísticos
Tipos de Características Ventajas Inconvenientes
muestreo
probabilístico
Aleatorio simple Se selecciona una muestra de Sencillo, rápido y de fácil Requiere que se posea
tamaño n de una población de comprensión. de antemano un
N unidades, cada elemento listado completo de
tiene una probabilidad de Se basa en la teoría toda la población
inclusión igual y conocida de estadística, y por tanto (marco poblacional).
n/N. existen paquetes
informáticos para analizar los No se aplica para
datos poblaciones
estratificadas.
Sistemático Conseguir un listado de los N Fácil de aplicar. No siempre es Si la constante de
elementos de la población. necesario tener un listado muestreo está
de toda la población. asociada con el
Determinar tamaño muestral fenómeno de interés,
n. Definir un intervalo k=N/n. Cuando la población está las estimaciones
Elegir un número aleatorio, r, ordenada siguiendo una obtenidas a partir de
entre 1 y k (r=arranque tendencia conocida, asegura la muestra pueden
aleatorio). Seleccionar los una cobertura de unidades de contener sesgo de
elementos de la lista. todos los tipos. selección.

Estratificado En ciertas ocasiones resultará Asegura que la Se ha de conocer la


conveniente estratificar la muestra represente distribución en la
muestra según ciertas adecuadamente a la población de las
variables de interés. Para ello población en función de variables utilizadas
debes conocer la composición unas variables para estratificar.
estratificada de la población. seleccionadas.
Una vez calculado el tamaño
muestral apropiado, este se Se obtienen estimaciones más
reparte de manera precisas. Consigue una
proporcional entre los distintos muestra lomás semejante
estratos definidos en la posible a la población en lo
población usando una simple que a las variables
regla de tres. estratificadoras se refiere.

Conglomerados Se realizan varias fases Es muy eficiente La probabilidad de


de cuando la población es cometer errores es
muestreo sucesivas demasiado grande y dispersa. mayor.
(polietápico)
El cálculo del error es
Solo se necesita marco más complejo.
poblacional para la última
etapa del muestreo.
Ing. Allan Silva

Recuerda que la descripción de los tipos de muestreo es solo introductoria, es


sólo para que los conozcas. Este no es un libro de estadística, por eso te
recomiendo revisar algunos libros especializados sobre el tema. Hacer una
investigación no solo implica estudiar a fondo el tema de tu investigación, sino
también aprender sobre el método y las técnicas que vas a emplear. Por eso, no solo
revises bibliografía de tu tema, revisa también bibliografía metodológica.

¿Qué es el muestreo no probabilístico?

El muestreo no probabilístico, como su nombre lo indica, no se basa en el principio


de la equi‐probabilidad. Estas técnicas siguen otros criterios de selección
(conocimientos del investigador, economía, comodidad, alcance, etc.), procurando
que la muestra obtenida sea lo más representativa posible.

Estas muestras, al no utilizar el muestreo al azar, no tienen la garantía de las


muestras probabilísticas, es decir, no se sabe si los resultados estarán sesgados. Sin
embargo, aunque existe esta limitación, en la práctica los muestreos no
probabilísticos son a menudo necesarios e inevitables, porque son más económicos,
rápidos y menos complicados.

Este tipo de muestreo es típico y necesario cuando estás realizando investigaciones


cualitativas, exploratorias, históricas, documentales.

¿Cuántos tipos de muestreo no probabilístico hay?

Existen diferentes tipos de muestreo no probabilístico. Los más usados


son:
1. Muestreo accidental
2. Muestreo por cuotas
3. Muestreo intencional
4. Muestreo por rastreo “Bola de nieve”

Muestra accidental. Es aquella que se obtiene sin ningún plan pre‐concebido.


Las unidades elegidas resultan producto de circunstancias fortuitas y descontroladas.
Con este muestreo nunca sabrás hasta qué punto tus resultados son válidos y si en
verdad representan a la población. Este es el tipo de muestreo menos confiable.

Las investigaciones que utilizan voluntarios es un tipo de muestreo accidental. Estas


muestras están sesgadas porque los voluntarios tienen características distintas a la
población en general, como por ejemplo: son personas que tienen mayor nivel
cultural, tienen mejor estatus social, suelen ser más inteligentes, son más sociables,
son menos convencionales, son menos conformistas, etc.
Ing. Allan Silva

Ejemplo

“La muestra elegida fue de tipo accidental compuesta por 138 empleados
administrativos de universidades privadas cuyas edades oscilan de los 22 a 61 años,
por lo que los resultados son exclusivos para este grupo.”

Muestra por cuotas. Se calcula el tamaño de la muestra dependiendo de la


distribución de la población. Por ejemplo, en una población de 1,000 estudiantes,
donde el 40% son mujeres, puedes asignar una cuota de 60 hombres y 40 mujeres a
una muestra de 100 individuos. Por más que esa presunción llegue a ser válida, no
deja de existir cierta arbitrariedad en este modo de proceder, por lo que la rigurosidad
estadística de las muestras por cuotas se reduce considerablemente.

Muestra intencional. Este es el mejor tipo de muestreo no probabilístico. El muestreo


se realiza sobre la base del conocimiento y criterios del investigador. Se basa,
primordialmente, en la experiencia con la población. En algunas oportunidades se
usan como guía o muestra tentativa para decidir cómo tomar una muestra aleatoria
más adelante.

Muestreo por rastreo o “bola de nieve”. Son muy empleados en la investigación


cualitativa histórica, documental y etnográfica.

En este muestreo, los primeros elegidos como encuestados (a juicio del investigador)
proponen y ayudan a la selección de los restantes de la muestra. Esta técnica se
utiliza para localizar por referencias a miembros de poblaciones peculiares o muy
difíciles de acceder.

Siempre existe el riesgo del sesgo porque la persona sugerida por otro miembro de la
muestra tiene una probabilidad mayor de ser similar a la primera.

Ejemplo

Una investigación busca identificar las experiencias artesanos exportadores de


p r o d u c t o s a Europa. El investigador seleccionó una muestra no probabilística de
empresarios cuyos locales de confecciones están ubicados en Limay. Los
empresarios fueron seleccionaron a través de conocidos y de referencias. De esta
manera se entrevistó a 40 empresarios usando guías de entrevistas
semi‐estructuradas.

En este caso una muestra no probabilística es adecuada pues se trata de un estudio


con un diseño de investigación exploratorio; es decir, no es concluyente, sino que su
objetivo es documentar ciertas experiencias. Este tipo de estudio pretende generar
datos e hipótesis que constituyan la materia prima para investigaciones más precisas.
Ing. Allan Silva

¿Cómo calculo el tamaño de la muestra?

El cálculo del tamaño de tu muestra depende de qué tipo de investigación estas


realizando. Si es una investigación cualitativa o cuantitativa, el procedimiento variará.

¿Cómo calculo el tamaño de la muestra si mi investigación es cuantitativa?

En los estudios cuantitativos, el tamaño de la muestra depende de la precisión con


que se desea estimar el parámetro de la población. Entre más grande sea la muestra
más representativa de la población será.

Para calcular el tamaño de las muestras cuantitativas se emplean fórmulas


estadísticas. Para ello se necesita algunos valores, como son:

• El tamaño de la población: Si es mayor a 100 mil, entonces el tamaño de la


muestra será suficiente con 370. Si es menor a 100 mil, necesitas calcular
empleando fórmulas.
• El nivel de confianza: Te aconsejo que siempre sea del 95%.
• El tamaño aproximado de la proporción (p,q): Si no las conoces, que sea del
50% cada una.
• El error máximo admisible: Acepta un error máximo del 5%.
• Otros valores adicionales: como la tasa de no respuesta, entre otros.

Ejemplo

Una UCA con 500 empleados desea reducir el nivel de ausentismo de los trabajadores.
Reportes de asistencia indican que cerca del 10% de los trabajadores faltan al
t rabajo, pero no determinan las causas del ausentismo. Decides investigar las razones
más frecuentes para las faltas, y, por tanto, estimas el nivel de confianza de tu muestra
en el 95% y un error máximo admisible del 3%.

De esta forma:
n = tamaño de la muestra
z = nivel de confianza elegido (igual a 2)
p = porcentaje de inasistencia (10)
q = porcentaje complementario (p ‐ q = 90)
N = tamaño de la población (N=500)
e = error máximo permitido (3)
Ing. Allan Silva
La fórmula utilizada para el cálculo es la siguiente:
2
n= z .p.q.N
e2.(N‐1) + z2.p.q

Substituyendo los números en la fórmula se tiene:


n= 22. 10 . 90 . 500
32. (500‐1) + 22. 10 . 90

= 222,47

En este caso, el estudiante tendría que investigar aproximadamente 223 empleados para
poder determinar cuáles son las principales causas del ausentismo laboral. Si se aumentase
el porcentaje de error admisible al 5%, el tamaño de la muestra se reduciría a 112.

Te aconsejo nunca usar un error máximo del 5%

You might also like