You are on page 1of 16

10

Pruebas de contraste de hiptesis. Estimacin puntual y por intervalos

gata Carreo Serra

10.1. Introduccin
La mayora de las investigaciones realizadas en el mbito mdico-clnico, comportan estudios comparativos entre dos o ms muestras comparando, la mayora de ellos, el efecto producido por terapias o tratamientos. En este ltimo caso, algunos estudios enmascaran el placebo de frmaco activo, aunque esta prctica ha sido objeto de amplio debate por plantear dudas sobre su tica. La finalidad de estas investigaciones es contestar preguntas tales como: es igual el tratamiento A al tratamiento B? Cul es la efectividad del tratamiento? En estos casos es cuando necesitamos evaluar si las diferencias que se obtienen a partir de una muestra, se deben a factores distintos al azar y estn directamente relacionadas con la administracin de un tratamiento u otro. Para conocer en qu se basan este tipo de estudios, deberemos introducir conceptos como las pruebas de hiptesis y los errores asociados a ellas. Adems, veremos que esta probabilidad puede ser calculada a partir de pruebas estadsticas paramtricas, en las que se supone la normalidad de los datos, y las no paramtricas, usadas en condiciones no idneas de normalidad.
133

10-CAP 10

133

1/1/32, 00:42

10.2. Pruebas de contraste de hiptesis


En la situacin que hemos comentado a modo de introduccin, la respuesta al tratamiento se determinar en base a una medida numrica, sea el descenso de la TAS o mediante un porcentaje de respuesta al tratamiento. Por tanto, las respuestas obtenidas en cada grupo de tratamiento podremos decir que constituyen una estimacin de la efectividad de los mismos. Podemos intuir que aunque la efectividad de los dos tratamientos fuera tericamente la misma, por el simple hecho de tratar con muestras, la diferencia observada no sera exactamente el valor cero, sino que estara muy prxima a l, siendo bastante improbable obtener valores lejanos a ese valor (aunque no imposible). El principio bsico que hace referencia al contraste de hiptesis pretende contraponer dos suposiciones contrarias (hiptesis) formuladas al principio de todo estudio: una a favor de la igualdad, bien sea de respuesta de tratamientos o hacia un valor conocido, y otra que establece la desigualdad entre la efectividad real de los tratamientos estudiados o entre el valor que le suponemos al inicio. En realidad, el propsito de la prueba de hiptesis es determinar si el valor supuesto (hipottico) de un parmetro poblacional, como la media de la poblacin, debe aceptarse como verosmil en base a evidencias muestrales. Si el valor observado de una estadstica muestral (por ejemplo, la media), se acerca al valor paramtrico supuesto y difiere muy poco de l, el valor hipottico no se rechaza. Si por el contrario el valor obtenido muestralmente difiere en gran medida de lo que podemos atribuir al azar, la hiptesis formulada al inicio se rechazar por inverosmil.

10.2.1. Estimacin puntual. Definicin de estadstico


Un estadstico es un valor que se obtiene de la muestra y que representa o estima a su parmetro poblacional. Por tanto, es un instrumento mediante el cual podremos estimar parmetros, utilizando lo que llamamos inferencia o estadstica inferencial. La estimacin puntual hace referencia al clculo de valores que apuntan hacia el verdadero valor poblacional, como por ejemplo: estimacin de una media o de una prevalencia. De esta forma, un buen estimador debe ser: o Insesgado: Que el valor del parmetro coincida con el valor promedio del estimador. Esta propiedad la tienen la mayora de los estimadores usados en la prctica.

134

10-CAP 10

134

1/1/32, 00:42

o Consistente: Que el valor de la muestra se acerque al valor del parmetro al aumentar el tamao de la muestra. o Suficiente: Que el estimador use toda la informacin que la muestra contiene respecto al parmetro de inters. o Eficiente: Que el estimador tenga menor variabilidad que otro posible. Por ejemplo, la media muestral es un buen estimador de la media poblacional, porque su valor apunta al verdadero valor promedio en la poblacin. Otros estimadores puntuales son, la proporcin muestral para estimar proporciones poblacionales y la desviacin estndar en la muestra para estimar la poblacional. En estos ejemplos, la estimacin puntual permanece igual, pero como asumimos cierto error por el hecho de elegir una muestra y no otra, debemos acotar el error que cometemos y ello se realiza mediante el intervalo de confianza, puesto que la estimacin puntual es insuficiente. El intervalo de confianza se puede definir como el intervalo de longitud mnima tal que contiene el verdadero valor del parmetro poblacional con una probabilidad igual a 1- . A efectos prcticos esto significa que si seleccionamos 100 muestras distintas de una misma poblacin y calculamos el intervalo de confianza del 95%, el estimador obtenido en 95 de estas muestras estar contenido en dicho intervalo.

10.2.2. Hiptesis nula e hiptesis alternativa


En un contraste de hiptesis se denomina hiptesis nula (Ho) a la que considera que ambos tratamientos son iguales y si, en el supuesto de que sea cierta, la probabilidad de que se observe una diferencia tan grande o mayor que la obtenida en nuestro estudio es muy baja (usualmente el valor crtico es 0,05) se rechaza dicha hiptesis y se acepta la contraria, denominada hiptesis alternativa, que establece que ambos tratamientos son diferentes. La nomenclatura utilizada en un contraste de hiptesis suele ser la siguiente:
H (Hiptesis nula): Igualdad de tratamientos tambin { H (Hiptesis alternativa): Diferencia de tratamientos. H Respuesta igual a { H :: Respuesta distintavalor conocido al valor conocido
0 a 0 a

Por tanto, aceptaremos la hiptesis nula, si las diferencias obtenidas experimentalmente se deben slo al azar; mientras que la rechazaremos y aceptaremos la hiptesis alternativa, si consideramos que las diferencias obtenidas no se deben nicamente al azar, si no que la administracin de un tratamiento u otro ha provocado respuestas sensiblemente distintas entre ellos. Segn sean los estadsticos que se desean contrastar, la expresin de la hiptesis nula toma diver135

10-CAP 10

135

1/1/32, 00:42

sas formas, por ejemplo:


Hiptesis nula Contraste Comparacin de dos medias muestrales X1 y X2 Comparacin de la media muestral X1 con media poblacional
1

=
2

2 1

=0 =0

Comparacin de dos proporciones maestrales p1 y p2 Comparacin de una proporcin muestral p1 con proporcin poblacional p

p1 = p2 p1 = p

p1 p2 = 0 p1 p = 0

Tabla 4. Planteamiento de la Hiptesis nula segn tipos de contraste de hiptesis

Los ejemplos que hemos puesto al inicio del captulo, referentes a las preguntas Es igual el tratamiento A al tratamiento B? Cul es la efectividad del tratamiento? Aparecen a continuacin en formato de contraste de hiptesis:

{ H :: H
0 a

A A

B B

(Igualdad de tratamientos) (Diferencia de tratamientos)

tambin

H0 : Ha :

= 25 (Efectividad igual a 25 mmHg) A 25 (Efectividad distinta de 25 mmHg) A

Aunque estos conceptos parecen muy tericos, en realidad son muy intuitivos. Las pruebas de hiptesis son formulaciones de lo que queremos contrastar y, en base a resultados probabilsticos (asociados a la popularmente conocida p o p-value), aceptaremos la hiptesis nula o la rechazaremos. Puesto que trabajamos con muestras y no con la poblacin entera, debemos asumir que podremos cometer un cierto error en nuestras decisiones. Estos errores asociados a la aceptacin y rechazo de la hiptesis nula son los errores alfa y beta.

10.2.3. Error alfa y error beta


En los contrastes de hiptesis se pueden dar dos tipos de errores en funcin de lo que nos aporta nuestra muestra y lo que objetivamente est ocurriendo en la realidad. Estos errores (o probabilidades) reciben el nombre de alfa y beta y se definen tal como se indica a continuacin: o El error alfa o tipo I, es el que se comete al rechazar la hiptesis nula H0 siendo cierta. Es decir, aceptamos que existen diferencias entre tratamientos cuando en realidad no las hay. o El error beta o tipo II, es el error que se comete al aceptar la hiptesis
136

10-CAP 10

136

1/1/32, 00:42

nula H0 siendo falsa. Es decir, existe una diferencia real entre tratamientos pero no se ha podido rechazar la hiptesis nula. Como lo que ocurre en la realidad es desconocido, lo nico que podemos acotar es la probabilidad de equivocarnos. La siguiente tabla muestra los errores alfa y beta en funcin del resultado de la prueba y lo que realmente ocurre en la realidad.
Decisin H0 verdadera Aceptamos H0 Rechazamos H0 Sin error Error alfa o tipo I Realidad H0 falsa Error beta o tipo II Sin error

Tabla 5. Errores asociados a las pruebas de hiptesis

El error alfa debe ser fijado a priori por los responsables del estudio, puesto que es el que marca el nivel de rechazo de la hiptesis nula. Este valor se sita generalmente en 0,05 y es el valor con el que compararemos nuestra p, obtenida mediante el estadstico de contraste adecuado a nuestros objetivos. Avanzndonos un poco ms en las pruebas de hiptesis, cuando hablamos de una p, p-value o nivel de significacin con un valor cercano a cero, estamos indicando que la prueba realizada (t de Student, Prueba F, prueba Z) supera el umbral probabilstico previamente fijado de 0,05 como tope mnimo para considerar la igualdad entre los parmetros. Como hemos dicho, el nivel de significacin lo marcamos nosotros de manera que, cuanto mayor sea, ms fcil ser aceptar la hiptesis alternativa cuando en realidad es falsa. Si al valor se le llama tambin grado de significacin estadstica, a su complementario (1-alfa) se le llama nivel de confianza, o probabilidad de que las diferencias que se detecten no se deban al azar. Por convenio, suele utilizarse un valor de 0,05, lo que significa que 5 de cada 100 veces detectaramos diferencias entre tratamientos cuando realmente seran iguales, aunque tambin es usual un valor de 0,01. Teniendo en cuenta que en la gran mayora de los casos el nivel alfa se fija a 0,05 en un contraste de hiptesis aceptaremos una hiptesis o la otra segn la siguiente regla de decisin:

137

10-CAP 10

137

1/1/32, 00:42

Si p es menor de 0,05, se admite que la probabilidad de que las diferencias encontradas se deban al azar son demasiado pequeas, por lo que rechazaremos la hiptesis nula y aceptaremos la alternativa. Si p es mayor o igual a 0,05, la probabilidad de que las diferencias encontradas se deban al azar son demasiado grandes para aceptar la hiptesis alternativa y, por tanto, se acepta la hiptesis nula: las diferencias encontradas estn dentro de las que consideramos debidas al azar.

El error beta se ha definido como la probabilidad de rechazar la hiptesis nula cuando sta es falsa, es decir, la probabilidad de detectar diferencias entre tratamientos cuando realmente existen diferencias. Asociado al error beta se ha definido la potencia estadstica de un test como 1-beta. Al igual que el nivel de significacin, el error beta o poder estadstico debe definirse antes de iniciar el estudio para estimar el tamao muestral necesario para poder evaluar el objetivo del estudio. Debido a que los dos errores definidos son imposibles de controlar a la vez, vamos a fijarnos solamente en el error alfa o nivel de significacin y nos informa de la probabilidad que tenemos de estar equivocados si aceptamos la hiptesis alternativa. Este error es el que nos interesa ya que la hiptesis alternativa (existen diferencias) que estamos interesados en probar, no queremos aceptarla si en realidad no es cierta, es decir, si aceptamos la hiptesis alternativa queremos equivocarnos con un margen de error muy pequeo.

10.2.4. Estimacin por intervalos. Regin crtica y regin de aceptacin


Como hemos visto, asociado al valor del estadstico calculado para evaluar las hiptesis, existe un intervalo o rango de valores dentro del cul aceptamos la hiptesis nula, rechazando la alternativa. Ese intervalo o regin se denomina regin de aceptacin, y ser mayor o menor dependiendo del nivel de confianza que precisemos, 1- . La regin que quede fuera de la regin de aceptacin indica que en este caso los cambios no se pueden atribuir al azar, y por tanto hemos de rechazar H0 y aceptar H1. Tal regin se llama regin crtica o de rechazo. Llegados a este punto, hemos de distinguir entre dos tipos de contraste o test, que determinan la regin de aceptacin y la regin de rechazo. En una distribucin Normal, cerca del 68% de los valores de un parmetro, por ejemplo la media poblacional, estn incluidos dentro del intervalo abarcado por la media muestral 1 desviacin estndar (DE); ms del 95% estn dentro de la media 2 DE y ms del 99% entre la media 3 DE. El verdadero valor poblacional estar situado dentro de estos valores con dicha probabilidad.
138

10-CAP 10

138

1/1/32, 00:42

Al plantearnos el contraste de hiptesis, si desconocemos en qu direccin puede ser falsa H0, entonces Ha es simplemente la negacin ( o tratamientos distintos) y decimos entonces que el contraste es bilateral. Si por el contrario, conocemos que un tratamiento, si tiene efectos, puede mejorar la respuesta pero nunca empeorarla, entonces estamos hablando de un contraste unilateral, dado que la hiptesis alternativa recoge diferencias entre dos parmetros pero en un nico sentido. A continuacin los veremos por separado. 10.2.4.1. Contraste bilateral (o de dos colas) En este caso la regin de rechazo o regin crtica est formada por dos reas disjuntas. Dicho caso se presenta cuando la hiptesis nula es del tipo H0 : = k (o bien H0 : p = k) y la hiptesis alternativa, por tanto, es del tipo H1 : k (o bien H1 : p k). La regin crtica para un cierto nivel sera, en la N(0;1): El valor z( /2) para igual a 0,05 corresponde al valor 1,96, muchas veces aproximado a 2, que es el que corresponde al valor de la curva normal que deja una probabilidad a cada lado de la curva de /2, es decir, deja a cada lado 0,025.

Figura 39. Intervalo -z ( /2) , z( /2). Regin de aceptacin y de rechazo.

Fijmonos en que el nivel de significacin se concentra en dos partes (o colas) simtricas respecto de la media. La regin de aceptacin en este caso no es ms que el correspondiente intervalo de probabilidad para x o p, es decir:

10.2.4.2. Contraste unilateral (o de una cola) En este caso la regin crtica est formada por una sola rea. Como se observa en las figuras, el nivel de significacin se concentra slo en una parte o cola. Este caso se presenta cuando la hiptesis nula es del tipo H0 : k (o bien H0 : p k) y la hiptesis alternativa, por tanto, es del tipo H1 : < k (o bien H1 : p < k). Tambin puede aparecer en sentido contrario, es decir, H0 : k (o bien H0
139

10-CAP 10

139

1/1/32, 00:42

: p k) y la hiptesis alternativa, H1 : > k (o bien H1 : p > k). A nivel de confianza 1 - , las regiones sern, en la N(0;1):

Figura 40. Nivel de aceptacin de los contrastes unilaterales

En estos casos el valor z( ) corresponde al valor 1,64 1,64 segn el sentido de la diferencia, que es el que corresponde al valor de la curva normal que deja una probabilidad por encima o por debajo de 0,05, constituyendo esta regin la regin de rechazo y el resto la regin de aceptacin y engloba el 95% del rea de la curva. Los valores ms conocidos de , corresponden a puntos de la distribucin de referencia que engloban un rea por debajo de la curva correspondiente a 1 . Si el estadstico de contraste sigue una distribucin normal estandarizada z, estos valores son los que aparecen a continuacin:
Contrastes bilaterales Valores de Z Entre -1.645 y 1.645 Entre -1.96 y 1.96 Entre -2.575 y 2.575 rea bajo la curva 0.90 0.95 0.99 Contrastes unilaterales Valores de Z Entre - y 1.28 Entre - y 1.645 Entre - y 2.33 rea bajo la curva 0.90 0.95 0.99

Tabla 6. Valores Z y rea bajo la curva asociados a los contrastes bilaterales y unilaterales

10.2.5. Algunos contrastes paramtricos ms importantes Hemos dado mucha importancia a los errores alfa y beta, sin embargo, debe tenerse claro que el clculo ms complicado, corresponde al estadstico de contraste adecuado para solucionar nuestras hiptesis. La eleccin de la prueba estadstica consistir en definir una medida que permita comparar los resultados obtenidos en nuestra muestra con los resultados tericos segn la hiptesis planteada. La distribucin de esta medida, cuando la hiptesis nula es cierta, deber aproximarse a la de alguna distribucin conocida. Este valor del estadstico es el que debe situarse en su funcin de distribucin para establecer el rea bajo la curva y conocer la probabilidad asociada a ese valor. Esa probabilidad es la que llamare140

10-CAP 10

140

1/1/32, 00:42

mos p-valor, por lo que si el valor de nuestro estadstico est muy lejano a los valores normales de la distribucin, dejar un rea muy grande bajo la curva y una probabilidad muy pequea de obtener valores mayores a l. La mayora de los paquetes estadsticos tienen incorporados los clculos necesarios para los estadsticos adecuados y nos ofrecen su p-valor asociado; sin embargo, a continuacin se muestra una pequea introduccin a los estadsticos que se necesitaran para poder los contrastes de hiptesis ms importantes. Dicha informacin nos permitir entender un poco ms el objetivo de los contrastes de hiptesis. o Contrastes sobre la media. A partir de una muestra extrada de una poblacin X normal con media y varianza 2 desconocidas, se desea contrastar la hiptesis nula H0: = 0. El estadstico de contraste es d1, S es la desviacin tpica muestral corregida y x es un estimador de la media poblacional . Si H0 es cierta, el estadstico d1 sigue una distribucin t de Student con n-1 grados de libertad.
d1 = X ^ S
o

n,

o Contrastes sobre la varianza. Si partimos de una muestra extrada de una poblacin X normal con varianza 2 y se desea contrastar H0: 2 = 20, siendo 20 un valor preestablecido de la varianza. El estadstico de contraste es d2 donde ^2 es el estimador habiS 2 tual de la varianza . Si H0 es cierta d2 sigue una distribucin F de Snedecor.
d2 = (n 2 1) S
^2

o Contrastes sobre la igualdad de varianzas. Se desea contrastar si dos varianzas son iguales, suponiendo que provienen de dos poblaciones normales. H0: 2x = 2Y ( 2x / 2y) = 1. El estadstico de contraste es d3 y si H0 es cierto d3 ~ Fn-1,m-1
d3 = Sx ^ S2 y
^2

o Contrastes sobre la diferencia de medias, muestras independientes e igualdad de varianzas. Se supone que x2 = y2 = 2. Se desea contrastar H0: x = x ( x - y) = 0. El estadstico de contraste es d4 y si H0 es cierto se verifica que d4 ~ tn+m-2
d4 = X-Y ST
^2

1 1 n +m

141

10-CAP 10

141

1/1/32, 00:42

siendo
ST =
^2

(n-1) Sx +(m-1)Sy n+m-2

^2

^2

o Contrastes sobre la diferencia de medias, muestras independientes y varianzas desiguales. Se supone que x2 y2 . Se desea contrastar H0: x = y ( x - y) = 0. El estadstico de contraste que se utiliza es d5 y si H0 es cierto se verifica que d5 ~ tg , siendo g = n + m - 2 + un trmino de correccin

d5 =

X-Y
Sx Sy n +m
^2 ^2

o Contrastes sobre la diferencia de medias, muestreo apareado. Tenemos dos muestras aleatorias simples de igual tamao muestral y son obtenidas al realizar dos observaciones Xi e Yi sobre el mismo individuo. Por la naturaleza del muestreo apareado las dos muestras son dependientes. Para eliminar este problema se estudia la variable diferencia Z = Y - X, por tanto, a partir de las dos muestras iniciales se calcula la muestra de diferencias, Zi = Xi - Yi . Para contrastar la hiptesis H0: x = y ( x - y) = 0 z = 0. Se utiliza el estadstico de contraste d6 y si H0 es cierto d6 ~ tn-1

d6 = Z ^ SZ

n.

10.2.6. Etapas de la prueba de hiptesis


Los procedimientos seguidos en las pruebas de hiptesis se encuentran prefijados y se dan por etapas que facilitan su comprensin. En primer lugar, debe enunciarse la hiptesis nula y alternativa y determinarse el valor para poder identificar el valor z( /2) que separa las regiones de aceptacin o rechazo. En segundo lugar, debemos determinar la distribucin del parmetro muestral. Y, por ltimo, calcular el estadstico y aplicar el test; en funcin de si el estadstico cae en la regin crtica o en la regin de aceptacin, entonces, se tomar una decisin con respecto a una de las dos hiptesis.

10.2.7. Ejemplos de utilizacin


En los prximos captulos veremos los tests necesarios y los estadsticos a calcular cuando se nos plantea un contraste de hiptesis utilizando el paquete
142

10-CAP 10

142

1/1/32, 00:42

estadstico SPSS. En este apartado hemos preferido elegir dos ejemplos que ilustren la forma manual de clculo, sin recurrir al paquete estadstico, con el objetivo de conceptualizar mejor el contraste de hiptesis. 10.2.7.1. Estimacin por intervalo de una proporcin Imaginemos que deseamos estimar la prevalencia del tabaquismo en los pacientes hospitalarios. Para ello, se revisan las historias clnicas de 150 pacientes, observando que 45 eran fumadores. Cul es la prevalencia del tabaquismo?. La proporcin de pacientes fumadores es p = 45 /150 = 0,3 (30%), por lo que la proporcin de pacientes no fumadores es q = 1- p = 1- 0,3 = 0,7 (70%). Si decimos que la prevalencia del tabaquismo es del 30%, estamos incurriendo en el error de no proporcionar el intervalo de confianza correspondiente a esa proporcin y que nos indicar el rango de valores reales que puede adoptar nuestra prevalencia. Una prevalencia del 30% puede obtenerse de una muestra de 30 casos o de un estudio poblacional con miles de pacientes. Cuanto mayor sea el tamao muestral, mayor ser la precisin de nuestra la estimacin y esto se refleja con el intervalo de confianza, que ser menor. Para obtener el intervalo de confianza para proporciones, deberemos aplicar la siguiente frmula:

IC (p) = p Z

/2

p q n

donde n es el tamao muestral, p corresponde a la proporcin obtenida en nuestra muestra, como hemos dicho anteriormente q corresponde a 1-p y, finalmente, z /2 es el valor crtico de la distribucin normal que deja una probabilidad 1- bajo la curva y corresponde al valor 1,96 en el caso de definir un nivel de confianza del 95% (referenciado en la Tabla 6 de este captulo o bien mediante los valores tabulados de la distribucin normal). De esta forma, el clculo del intervalo de confianza del 95% se obtiene como:

Por lo tanto, a partir de los datos obtenidos en la muestra podemos afirmar que la prevalencia de tabaquismo hospitalario est entre el 22,7% y el 37,3% con una confianza del 95%. 10.2.7.2. Estimacin por intervalos de dos medias Un estudio pretende comparar la efectividad de dos tratamientos A y B en la
143

10-CAP 10

143

1/1/32, 00:42

hipertensin arterial, suponiendo que existen diferencias entre ellos pero sin conocer el sentido de stas. De esta forma, se plantea el siguiente contraste de hiptesis: H0 : A = B Ha : A B Para seguir una consistencia en todos los ejemplos, fijaremos el nivel de error alfa en 0,05. En el tratamiento A tenemos una muestra de pacientes (nA=15) en los que se ha observado una reduccin media de las cifras de TAS de xA=18 mmHg con una desviacin estndar (sA) de 2,3; mientras que con el tratamiento B, se ha obtenido una muestra de 20 pacientes (nB=20) que han disminuido en promedio xB=15,25 mmHg de la TAS con una desviacin (sB) de 1,92 En primer lugar, calcularemos el estadstico de referencia, que corresponder a una t de Student con (nA-1) + (nB-1) grados de libertad, es decir t ~ t33. La frmula a aplicar aparece a continuacin:

Calculando las distintas frmulas, se obtiene que:


S2

En la tabulacin de la distribucin t de Student (ver Anexo), encontraramos que el valor de esta distribucin con 33 grados de libertad asociada al valor =0,05 es el 2,04. Como el valor que nosotros hemos encontrado (3,86) excede el valor terico (2,04), rechazamos la hiptesis nula y concluimos que existen diferencias entre ambos tratamientos. Otra forma sera buscar en las tablas el valor calculado 3,86 en las tablas para conocer la probabilidad que tiene asociada y, si sta es menor a 0,05, rechazar la hiptesis nula, tal y como se realiza en las herramientas de anlisis, donde generalmente se realiza el clculo de la probabilidad asociada al valor del estadstico muestral, el p-valor. Mediante el test de hiptesis se han observado diferencias y, mediante la muestra, el tratamiento A ha obtenido mejores resultados. Si adems quisiramos conocer la estimacin de la diferencia de valores, es decir, la estimacin del efecto del tratamiento deberamos calcular el intervalo de confianza de la diferencia de medias. El intervalo de confianza sera:

144

10-CAP 10

144

1/1/32, 00:42

Por lo tanto, la diferencia observada entre el tratamiento A y el tratamiento B es de 2,75 y podemos afirmar que est entre 1,71 y 3,79 mmHg a favor del tratamiento A con una confianza del 95%. Esta conclusin no indica que la efectividad de los tratamientos sea clnicamente distinta, si no que las diferencias observadas estn cuantificadas y slo un clnico puede determinar cul es la diferencia clnicamente relevante.

10.3. Tipos de pruebas estadsticas


Es importante establecer el objetivo o propsito de la prueba para la variable o variables seleccionadas y las limitaciones que pueden tener en cuanto a algunos supuestos que deben cumplirse, esto suele ocurrir en las denominadas pruebas paramtricas. Si despus de considerar esto, la prueba no se considera robusta, entonces es ms conveniente buscar una prueba de la estadstica no paramtrica y que resulte ms confiable.

10.3.1. Pruebas paramtricas


Para poder aplicar pruebas paramtricas se requieren una serie de supuestos, adems de asegurar de que la muestra que se toma debe haber sido seleccionada de forma aleatoria o probabilstica. En las pruebas paramtricas de muestra pequea, se requiere el supuesto de que las muestras sean extradas de una poblacin con distribucin normal y cuando se trata de dos o ms muestras tambin se requiere la igualdad de varianzas, que puede evaluarse mediante una prueba especfica. Existen pruebas estadsticas por medio de las cuales se podra comprobar esto, sin embargo suele no drsele importancia a esto y se pasa por alto. Las muestras de tamao grande, tienen menos supuestos, puesto que se pueden aplicar sin saber o comprobar si la poblacin o poblaciones eran normales, estas pruebas se dice que son robustas, porque no es necesario que se cumpla dicho supuesto (ver Teorema Central del Lmite). Se dispone de muchas pruebas estadsticas no paramtricas que tienen una aplicacin semejante a las paramtricas de muestra pequea en las que se tienen menos supuestos. Se suele utilizar media y desviacin estndar.

10.3.2. Pruebas no paramtricas


En estas tcnicas, solamente se necesitan conocimientos elementales de matemticas, pues los mtodos son relativamente ms sencillos que en las pruebas paramtricas. Existe toda una teora que no se basa en la distribucin de la funcin de probabilidades de las variables a estudiar. En muchos casos, resulta
145

10-CAP 10

145

1/1/32, 00:42

muy til y su enfoque es bastante claro. Entre ellas destacan la prueba ChiCuadrado (x2) y otras pruebas para evaluar diferencias de medias para variables que no siguen la ley normal. Una limitacin que tienen estas pruebas es que no son aplicables a casos en los que se desean manejar muchas variables al mismo tiempo, para estos casos, s se requerira una prueba paramtrica. Lo que s se requiere y en general es el supuesto que se debe cumplir en la mayora de las pruebas no paramtricas para confiar en ellas, es que la muestra haya sido seleccionada en forma probabilstica. Cuando se aplican pruebas no paramtricas las medidas resumen que se utilizan suelen ser la mediana y los cuartiles. Las pruebas que se mencionarn en los siguientes captulos son las que se podran necesitar con mayor frecuencia, se mencionarn sus principales caractersticas y aplicaciones, adems de la prueba paramtrica a la que podran sustituir.Toda prueba no paramtrica tiene una equivalente paramtrica, no siendo al contrario, del todo cierto.

10.4. Clculo del tamao de la muestra


El tamao de la muestra es el nmero de individuos que la componen. Es un factor esencial en las estimaciones y en las pruebas de significacin. En las estimaciones, el tamao de la muestra determina el intervalo de confianza y el error de la estimacin; en las pruebas de significacin, con los mismos resultados se puede aceptar o rechazar la hiptesis nula segn sea el tamao de la muestra. Por eso, es muy importante conocer el nmero mnimo de individuos necesario para una estimacin antes de realizar la recogida de datos. Esta se realiza con una muestra de tamao igual o superior al determinado previamente, puesto que en muchos estudios, existe un porcentaje de prdidas que debe ser tenido en cuenta. Existe una interdependencia entre el grado de significacin (p alfa), el poder estadstico (1-beta), el nmero de individuos estudiados (tamao muestral) y la magnitud de la diferencia observada, de tal forma que conociendo tres de estos parmetros, se puede calcular el cuarto. As, antes de iniciar un estudio, podremos determinar el nmero de individuos necesarios para detectar una diferencia determinada, fijando a priori un nivel de significacin y el poder estadstico deseado.

10.5. Consideraciones importantes


El grado de significacin estadstica no es una medida de la fuerza de la aso146

10-CAP 10

146

1/1/32, 00:42

ciacin, no mide si un tratamiento es ms eficaz o mejor que otro; simplemente nos da la probabilidad de que los resultados obtenidos sean fruto de la casualidad o el azar. La p tampoco mide la importancia clnica o la relevancia de las diferencias observadas puesto que un estudio puede demostrar diferencias muy significativas entre las variables y carecer de importancia clnica dado que el nivel de significacin disminuye aumentando el tamao de muestra an manteniendo las diferencias a detectar. Por ejemplo, si un frmaco A reduce la presin arterial 10 mmHg y otro B la reduce 9 mmHg y existen diferencias estadsticamente significativas entre ambos (p<0,05), ello no significa que deba usarse el frmaco A antes que el B, sino que hay que considerar el dudoso beneficio clnico que pueda reportar el reducir la presin arterial 1 mmHg ms, los efectos secundarios, la seguridad o el coste econmico. El nivel de significacin nos da la importancia o significacin estadstica de las diferencias pero nunca su relevancia clnica. Todas las pruebas de significacin estadstica (o pruebas de hiptesis) intentan rechazar o no la hiptesis nula, calculando la probabilidad de que los resultados sean debidos al azar, nos dan, por tanto el grado de significacin estadstica p. Las pruebas de significacin estadstica son mtodos de contraste de hiptesis utilizados para valorar el efecto del azar en una investigacin. Mediante los tests de hiptesis podemos calcular cmo de probable es que las diferencias observadas en una investigacin se deban al azar. Actualmente las pruebas de hiptesis reciben algunas crticas por varios motivos. En primer lugar, se desconoce la magnitud de la diferencia que se observa y por tanto, no se puede definir la relevancia clnica. En segundo lugar, damos como significativo un resultado con una p=0,045 y sin embargo aceptamos la hiptesis nula con una p=0,05.Y finalmente, con un tamao de muestra elevado, cualquier resultado puede cobrar significacin estadstica. En contraposicin, un intervalo de confianza es un recorrido de valores, basados en una muestra tomada de una poblacin, en el que cabe esperar que se encuentre el verdadero valor de un parmetro poblacional con cierto grado de confianza. En otras palabras, se puede tener gran confianza en que el intervalo resultante abarca el valor verdadero, pues dicho intervalo se ha obtenido por un mtodo que casi siempre acierta. Un intervalo de confianza posee la ventaja de que se puede calcular para cualquier valor. Si se desea determinar si es verdadera la diferencia observada entre dos grupos, se calcula el intervalo de confianza de 95% de la diferencia entre sus respectivas medias. Si el intervalo abarca el valor cero, no se puede descartar que no haya una diferencia; si no lo abarca, la probabilidad de que se est observando una diferencia que en realidad no existe se considera remota.
147

10-CAP 10

147

1/1/32, 00:42

La precisin de los resultados guarda relacin con el tamao muestral y con la variabilidad de los datos, de tal manera que cuanto ms grande la muestra, ms se acercarn los resultados al verdadero valor poblacional y ms estrecho ser el intervalo de confianza. Asimismo, mientras ms grande sea la desviacin estndar de los datos, menos precisos sern los resultados y ms amplio el intervalo de confianza.

148

10-CAP 10

148

1/1/32, 00:42

You might also like