Professional Documents
Culture Documents
Introducción
Las exigencias en la investigación actual han creado la necesidad de profundizar en mu-
chos aspectos estadísticos. Es práctica común pedir a los alumnos de maestría y doctorado
que calculen el tamaño de la muestra del estudio que realizan. Para ello deben escoger las
variables que han utilizado para la hipótesis de trabajo y deben diferenciar las variables de
respuesta (dependientes) y las predictoras (independientes).
Para realizar un cálculo adecuado del tamaño de muestra, el investigador debe
conocer con amplitud las variables que debe analizar. Cada variable tiene su propia
distribución probabilística y algunas cuentan con formas muy particulares. Por ejemplo,
las concentraciones en suero de triglicéridos y leptina tienen distribuciones sesgadas
a la derecha (consúltese el capítulo 15, El sesgo en la investigación) y es común que la
desviación estándar tenga un valor muy parecido al promedio respectivo. La transfor-
mación logarítmica es muy utilizada con estas variables. Este conocimiento contribuye a
que los cálculos se hagan de manera adecuada con los logaritmos y no con las variables
originales.
Estas técnicas estadísticas para la investigación se utilizan en casi todas las áreas del
conocimiento, con un auge importante en salud. Existen varias razones para seleccionar
una muestra; el objetivo fundamental es hacer inferencias estadísticas (estimaciones de
uno o más parámetros acerca de una población finita de interés). Esta población es la
que se desea investigar y a la que se le denomina población de interés, población blan-
co o población diana. Para que la extrapolación (inferencia estadística) tenga validez, la
muestra debe ser representativa y la representatividad alude a que el estimador muestral
de las variables de interés debe tener una distribución con comportamiento similar a las
66 Metodología de la investigación, bioestadística y bioinformática en ciencias médicas y de la salud
de la población de las que proviene.1 Para cumplir con este supuesto de representatividad
es deseable que la muestra sea probabilística y para calcular su tamaño se deben tomar
en cuenta varios factores: estructura de la hipótesis, error tipo I (error alfa), error tipo II
(error beta), poder estadístico deseado, variabilidad, pérdidas en el seguimiento del es-
tudio, diferencia clínicamente significativa y tipo de estudio epidemiológico utilizado en
determinada investigación.
Muestra Población
probabilística de interés
Parámetro
Estimador Extrapolación de la
muestral población
Representatividad:
Distribución de frecuencias similar
entre la muestra y la población
Hipótesis
De acuerdo con el tipo de estudio de investigación, tal vez sea necesario formular una o
más hipótesis. Si se trata de un estudio de tipo descriptivo, esto no es necesario, porque
sólo se busca una caracterización de la población de interés. En cambio, en los estudios de
tipo comparativo, en que se emplean pruebas de significación estadística, sí es necesario
establecer una o más hipótesis. Por lo general, en la formulación de una hipótesis el inves-
tigador plantea a priori el posible resultado, mientras que con los estudios descriptivos se
pueden establecer propuestas de hipótesis a posteriori. En ambos casos, es necesario con-
trastar las hipótesis y determinar si se aceptan o se rechazan. Para realizar este contraste,
las hipótesis toman el nombre de nula (H0) o alternativa (H1). En casi todos los casos, la
hipótesis que el investigador desea probar se plantea en la hipótesis alternativa; es decir, el
investigador espera que se rechace la hipótesis nula (cuadro 7-1).
El tipo de contraste de hipótesis puede ser unilateral (una cola) o bilateral (dos
colas). Una hipótesis unilateral se plantea cuando se especifica la dirección de la asocia-
ción (mayor o menor) de las variables; en la hipótesis bilateral, se puede afirmar la exis-
tencia de asociación entre las variables, pero no se especifica la dirección. Por lo general,
se recomienda que el contraste de hipótesis sea bilateral, porque ofrece la estimación más
robusta, a pesar de que el tamaño de muestra es más grande. El contraste unilateral sólo
debe utilizarse cuando existe evidencia suficiente para limitar las hipótesis a una dirección
(una cola).2 Aunque esto es posible, la mayoría de los revisores de protocolos de investiga-
ción tiene la costumbre de exigir contrastes a dos colas. Cabe mencionar que el valor de
Z de una distribución normal cambia dependiendo del tipo de contraste de hipótesis. Así,
para la probabilidad de α aceptada, en un contraste unilateral, se tendría Zα y para el bi-
lateral se tendría Zα/2. En cuanto al valor correspondiente a la probabilidad de β aceptada
en ambos contrastes es Zβ.6
Decisión Realidad
H0 es cierta H1 es cierta
pendiendo del nivel de confianza que se quiera para la prueba; el criterio más usado en la
literatura biomédica consiste en aceptar un riesgo de α < 0.05.
Poder estadístico
En el contraste de hipótesis, el poder o la potencia estadística equivale a la probabilidad de
aceptar H1 cuando es cierta. Se define como 1 − β. Es decir,
Este concepto está vinculado muy de cerca con el error tipo II y su valor depende del
error tipo II que se acepte. De esta manera, si β = 0.2, se tiene una potencia de 1 − β = 0.8.
En términos porcentuales, se dice que la prueba tiene una potencia de 80%. Si se quisiera
un poder estadístico mayor, se necesitaría una muestra de mayor tamaño. En general, el
poder estadístico mínimo aceptado en la literatura biomédica es de 80%. Cuando el poder
es menor a esta cifra, algunos autores, como Henneckens,7 sugieren que estos trabajos no se
tomen como concluyentes cuando no se haya podido rechazar la hipótesis nula (cuando
se haya aceptado la hipótesis alternativa).
Variabilidad
Es la dispersión esperada de los datos. La variabilidad se evalúa dependiendo de la va-
riable de interés. Si éstas son continuas, el tamaño de muestra está determinado por la
variable con el mayor coeficiente de variación [CV(Y )=(SY /Y )], donde SY es la desvia-
ción estándar y Y es la media. Cuanto mayor sea el CV, el tamaño de muestra es mayor.
Por otra parte, cuando las variables de interés son categóricas, debe utilizarse la estima-
ción de la proporción que más se acerque a 0.5. En caso de que existan hipótesis con
ambos tipos de variables, el tamaño de muestra se debe calcular de acuerdo con la varia-
ble categórica, porque ésto garantiza una mayor cantidad de elementos o individuos y,
por tanto, resultados más robustos.6 Por lo general, la variabilidad se obtiene de estudios
previos reportados o de estudios piloto. Por medio de la estadística, se ha demostrado
que cuanto más agrupados estén los valores alrededor de un eje central, la variabilidad
es menor y, por tanto, el tamaño de muestra también resulta menor.2
IC = ±δ
s= i =1
i
y Z es el valor del eje de las abscisas de la función normal estándar en que
α/2
n −1
se acumula la probabilidad de (1 − α). Cuando n es muy pequeña, Zα/2 podría sustituirse
Z2 a/2*S 2
por t(n−1),α/2. Entonces, al despejar n se tiene n = . En muestras finitas donde la
δ2
población es inferior a un millón, la fórmula para el cálculo del tamaño de la muestra se
Enfoque práctico de los elementos necesarios para la estimación del tamaño de la muestra 71
n
suele multiplicar por el factor de corrección por finitud 1 − , quedando la estimación
Z2α /2*S 2 N
del tamaño de muestra como n = * 1 − n . En general, el error de estimación o
δ N 2
error absoluto (δ) se obtiene de una muestra piloto o de estudios de investigación previos.
IC = p ± δ = p ± Zα 2 *
(
p 1− p ).
n
2* S 2
( )
2
nc = ne = * Zα 2 * Zβ
D2
donde d es el promedio de las diferencias individuales entre los valores basales y posterio-
res, S2 es la varianza de ambas distribuciones, que se suponen iguales, Zα/2 es el valor del
eje de las abscisas de la función normal estándar en donde se acumula la probabilidad de
(1 − α) para un contraste de hipótesis bilateral y Zβ es el valor del eje de las abscisas de la
función normal estándar, en donde se acumula la probabilidad de (1 − β).6
p1 (1 − p1 ) + p2 (1 − p2 )
nc = ne = ( )
2
* Zα 2 + Zβ
(p − p )
2
1 2
Referencias
1. Cid Cid A.I., Delgado Manríquez C.A., Leguey Galán S. Muestreo en poblaciones finitas. En:
Leguey Galán S (coord). Introducción al muestreo en poblaciones finitas. Madrid, España: ENE,
Nuevas estructuras, 1999.
2. Pérez Medina A., Gómez Restrepo C., Sánchez Pedraza R., Dennis R., Ruiz Morales A. Se-
lección de la muestra y factores determinantes para el cálculo de su tamaño. En: Ruiz Morales
A., Gómez Restrepo C., Lendoño Trujillo D. (ed). Investigación clínica: Epidemiología clínica
aplicada. Bogotá, Colombia: Centro Editorial Javeriano, ceja, 2001.
74 Metodología de la investigación, bioestadística y bioinformática en ciencias médicas y de la salud
3. Méndez Ramírez I., Eslava Gómez G., Romero Mares P. Conceptos básicos de muestreo (serie mo-
nográfica), México, D.F.: Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas,
Universidad Nacional Autónoma de México, 2004, Vol 12, Núm. 27.
4. Martínez Bencardino C. Estadística y muestreo, 12a. ed. Bogotá, Colombia: Ecoe Ediciones, 2005.
5. Cochran W.G. Sampling Techniques, 3a. ed. Nueva York: John Wiley & Sons, 1977.
6. Marrugat J., Vila J., Pavesi M., Sanz F. Estimación del tamaño de muestra en la investigación clí-
nica y epidemiológica, Unidad de Lípidos y Epidemiología Cardiovascular. Barcelona, España:
Instituto Municipal de Investigación Médica (imim), Medicina Clínica, 1998;111:267-276.
7. Henneckens C.H., Mayrent S.L. Epidemiology in Medicine. Boston: Little Brown and Com-
pany, 1987.