Professional Documents
Culture Documents
medicamentos y productos
sanitarios en la teraputica
del cuidado
MODULO VIII:
Investigacin en disciplinas socio-
sanitarias
Investigacin en disciplinas socio-sanitarias
2
Investigacin en disciplinas socio-sanitarias
1. INTRODUCCIN A LA BIOESTADSTICA
1.1. Concepto.
1.2. Clasificacin de los datos.
1.3. Clasificacin de escalas de medida.
2. ESTADSTICA DESCRIPTIVA
2.1. Concepto.
2.2. Descripcin de los datos cuantitativos:
- Medidas de tendencia central.
- Medidas de dispersin.
- Medidas de asimetra. ndice de asimetra.
- Medidas de posicin.
- Medidas de apuntamiento o curtosis.
2.3. Descripcin de datos cualitativos.
2.4. Medidas de frecuencia:
- Razn.
- Proporcin.
- Odds.
- Tasa.
2.5. Principales ndices epidemiolgicos y estandarizacin de tasas:
- Prevalencia de un evento.
- Incidencia de un evento.
3. ESTADSTICA INFERENCIAL
3.1. Concepto.
3.2. Estimacin de parmetros y muestras:
- Conceptos de Parmetros estadsticos.
- Estadstica o censos.
- Estimacin puntual y por intervalos.
- Tamao de la muestra.
- Validez de la muestra.
3.3. Medidas de asociacin, efecto e impacto.
Investigacin en disciplinas socio-sanitarias
3
3.4. Prueba de hiptesis:
- Hiptesis nula e hiptesis alterna..
- Error tipo I y error tipo II .
3.5. Contraste de hiptesis:
- Estudio de relacin entre variables cualitativas: prueba del chi-
cuadrado.
- Relacin entre una variable cualitativa y otra cuantitativa: prueba t
de Student y anlisis de la varianza.
- Relacin entre dos variables cuantitativas: correlacin y regresin.
4. INVESTIGACIN ENFERMERA
4.1. Concepto.
4.2. Tipos de investigacin. Caractersticas principales.
4.3. Clasificacin de los estudios:
- Segn la manipulacin de la variable.
- Segn la existencia de seguimiento.
- Segn la ocurrencia de la informacin en relacin al estudio.
- Segn el sentido de la relacin causa-efecto
4.4. Principales tipos de estudios
- Estudios de intervencin.
- Estudios de observacin.
4.5. Medicin de los datos
- Validez.
- Fiabilidad.
- Parmetros de validez.
4.6. Tcnicas de recogida de datos:
- Recogida de datos en investigacin cuantitativa.
- Recogida de datos en investigacin cualitativa.
5. ESTRUCTURA DE LA INVESTIGACIN
5.1. Contenidos del proyecto de investigacin:
- Antecedentes y Justificacin.
- Material y mtodos.
- Aplicabilidad y utilidad de los resultados.
Investigacin en disciplinas socio-sanitarias
4
- Limitaciones y posibles sesgos del estudio.
- Organizacin del estudio.
- Presupuesto.
5.2. Contenidos del informe final de investigacin: el artculo cientfico:
- Estructura.
- Introduccin.
- Material y mtodos.
- Resultados.
- Discusin.
6. BIBLIOGRAFIA
Investigacin en disciplinas socio-sanitarias
5
1. INTRODUCCIN A LA BIOESTADSTICA
1.1. Concepto
La Estadstica es la ciencia de la sistematizacin, recogida, ordenacin
y presentacin de los datos referente a un fenmeno que presenta
variabilidad o incertidumbre para su estudio metdico, con objeto de
deducir las leyes que rigen esos fenmenos, y poder hacer previsiones
sobre los mismos, tomar decisiones u obtener conclusiones.
Segn esto podramos clasificar la Estadstica en descriptiva, cuando
los resultados del anlisis no pretenden ir ms all del conjunto de
datos, e inferencial cuando el objetivo del estudio es derivar las
conclusiones obtenidas a un conjunto de datos ms amplio.
1.2. Clasificacin de los datos
Los objetos o individuos manifiestan sus caractersticas segn variables
de diversas modalidades o rangos de valoracin. Por ejemplo, la
caracterstica sexo se manifiesta segn dos modalidades: varn o
hembra. La caracterstica color de ojos segn varias modalidades: azul,
marrn, verde, negro. La caracterstica altura segn infinitas modalidades.
Cada caracterstica que se desea estudiar en una muestra de individuos y
que se caracteriza por tomar en ellos diferentes valores, recibe el nombre
de variable.
Estas variables a su vez se clasifican en:
Variables Cualitativas o categricas. Sus valores se presentan como
cualidades o atributos. stos no se pueden asociar a un nmero y
por tanto no se pueden hacer operaciones algebraicas con ellos.
Pueden ser:
- Nominales, que se caracterizan porque sus valores no se pueden
ordenar. Si las variables tienen dos categoras se llaman
dicotmicas. Por ejemplo el sexo: hombre, mujer.
- Ordinales, cuando sus valores se pueden ordenar segn un
criterio creciente o decreciente. Por ejemplo, el dolor en
pacientes oncolgicos clasificndolo como: leve, moderado,
intenso.
Investigacin en disciplinas socio-sanitarias
6
Variables Cuantitativas. Sus valores son numricos, por lo que se
puede hacer operaciones algebraicas con ellos. Pueden ser:
- Discretas, cuando los distintos valores que presenta la variable
pueden ser contados, y entre dos valores consecutivos de la
variable no existen valores intermedios, es decir, son valores
enteros. Por ejemplo: nmero de hijos, de infartos, de partos,
- Continua, cuando los valores que toma la variable son
susceptibles de ser medidos y entre dos valores consecutivos de
la variable pueden existir infinitas modalidades intermedias: Por
ejemplo: temperatura, nivel de hemoglobina en sangre, presin
sangunea, tensin arterial
- Categorizada, cuando la informacin se agrupa en intervalos de
clase. Se puede considerar tambin como una variable cualitativa.
Por ejemplo: IMC (entre <20, 20-24, 25-29, etc).
1.3. Clasificacin de escalas de medida
Escalas nominales: su nica finalidad es clasificar datos cualitativos.
Se emplea cuando las categoras de una variable son excluyentes
entre s, y es la forma ms simple de observacin. Por ejemplo:
grupo sanguneo, color de pelo, sexo.
Escalas ordinales: son aquellas que permiten un enunciado "mayor
que" o "menor que".
Las transformaciones admisibles para estas escalas son nicamente
aquellas que preservan el orden. Por ejemplo, estatura: alto, medio,
bajo.
Escalas de intervalo lineal: son escalas de valor numrico obligado
que presentan distancias idnticas entre los valores consecutivos de
la escala.
Se diferencian de las escalas ordinales por esa caracterstica de
presentar distancias idnticas entre sus valores consecutivos. No
existe el cero absoluto. El ejemplo tpico sera la temperatura.
Investigacin en disciplinas socio-sanitarias
7
Escalas de razn o proporcin: son aquellas que soportan todas las
transformaciones anteriores y adems, la igualdad de razones; por
tanto tienen que preservar el orden, el intervalo y la razn.
Las caractersticas de estas escalas implican la existencia de un
cero absoluto, caracterstica que no tienen las escalas de intervalo
lineal. Un ejemplo, la longitud puesto que se puede partir de ese cero
absoluto
2. ESTADSTICA DESCRIPTIVA
2.1. Concepto
Parte de la estadstica que permite organizar, presentar y sintetizar la
informacin; constituye una herramienta bsica para garantizar calidad y
validez de la estadstica inferencial. Sus objetivos son:
Sintetizar la informacin contenida en los datos.
Aporta resmenes significativos de las distribuciones.
Contribuye a la realizacin de los posteriores anlisis estadsticos.
2.2. Descripcin de los datos cuantitativos
Para la descripcin de las variables cuantitativas se utilizan una serie de
ndices o medidas. En funcin de su finalidad se clasifican en medidas
de tendencia central, medidas de dispersin, medidas de asimetra y
medias de posicin.
Medidas de tendencia central
- Media, es el promedio de los valores de una variable. Se obtiene
sumando todos los valores y dividiendo por el tamao muestral.
Por ejemplo, la media de 2,4,5,6 es (2+4+5+6)/4= 4,25
Esta medida es conveniente cuando los datos presentan
distribuciones simtricas, pero queda afectada cuando existen
valores extremos y si las distribuciones son muy asimtricas no
representan realmente la tendencia central de esa distribucin.
- Mediana, es la observacin equidistante de los extremos. Divide
Investigacin en disciplinas socio-sanitarias
8
a las observaciones en dos grupos con el mismo nmero de
individuos. En caso de que el nmero de datos sea par, se elige
la media de los dos datos centrales.
Por ejemplo: - mediana de 1,2,3,4,5,6,7 es 4
- mediana de 1,2,3,4,5,6 es (3+4)/2= 3,5
Esta medida es conveniente cuando los datos son asimtricos.
- Moda, es el valor de la variable ms frecuente.
Por ejemplo, la moda de 1,2,2,3,4,5,6 es 2
En una distribucin normal o gaussiana: media, mediana y moda
coinciden.
Medidas de dispersin
- Varianza. Es la media de las diferencias cuadrticas de n
puntuaciones con respecto a su media aritmtica. Se realiza
llevando a cabo la media de la suma de cuadrados de las
diferencias entre cada valor de la variable y la media aritmtica
de la distribucin.
Su principal inconveniente es que es sensible a valores extremos.
- Desviacin estndar. Es la raz cuadrada de la varianza.
Slo tiene interpretacin prctica cuando la distribucin es normal
o gaussiana
- Amplitud o rango: Corresponde a la diferencia entre el valor ms
alto y el ms bajo de la variable.
Por ejemplo, las edades de 5 mujeres diagnosticadas de cncer
de mama son 35,38,42,49,54. Donde 35 es el valor ms bajo y 54
es el valor ms alto. A= 54-35=19. La amplitud de la distribucin
de las edades de estas mujeres es de 19 aos.
Medidas de asimetra. ndice de asimetra
Una distribucin es simtrica si la mitad izquierda de su distribucin
Investigacin en disciplinas socio-sanitarias
9
es la imagen especular de su mitad derecha. Existe:
- Asimetra positiva, cuando las frecuencias ms altas se
encuentran en el lado izquierdo de la media, mientras que en
derecho hay frecuencias ms pequeas
- Asimetra negativa- las frecuencias ms altas se encuentran en el
lado derecho de la media, mientras que en el izquierdo hay
frecuencias ms pequeas.
Hay que sospechar de asimetra cuando los ndices de tendencia
central no coinciden.
Medidas de posicin
- Percentiles, son 99 valores que dividen en cien partes iguales el
conjunto de datos ordenados. Ejemplo, el percentil de orden 15
deja por debajo al 15% de las observaciones, y por encima queda
el 85%
- Cuarteles, son los tres valores que dividen al conjunto de datos
ordenados en cuatro partes iguales, son un caso particular de los
percentiles:
. Primer cuartil = Percentil 25
. Segundo cuartil = Percentil 50
. Tercer cuartel = Percentil 75
- Deciles- son los nueve valores que dividen al conjunto de datos
ordenados en diez partes iguales, son tambin un caso particular
Investigacin en disciplinas socio-sanitarias
10
de los percentiles.
Medidas de apuntamiento o curtosis
Miden la mayor o menor cantidad de datos que se agrupan en torno
a la moda. Se definen 3 tipos de distribuciones segn su grado de
curtosis:
- Distribucin mesocrtica: presenta un grado de concentracin
medio alrededor de los valores centrales de la variable (el mismo
que presenta una distribucin normal).
- Distribucin leptocrtica: presenta un elevado grado de
concentracin alrededor de los valores centrales de la variable.
- Distribucin platicrtica: presenta un reducido grado de
concentracin alrededor de los valores centrales de la variable.
2.3. Descripcin de datos cualitativos
Para la descripcin de las variables cualitativas (aquellas que no estn
asociadas a un nmero y no permiten llevar a cabo operaciones
algebraicas) se presentan los siguientes ndices:
Frecuencias absolutas, que contabilizan el nmero de datos de cada
modalidad.
Frecuencias relativas, que corresponde a la frecuencia absoluta
dividida por el nmero total datos.
Frecuencias acumuladas, que es la acumulacin de frecuencias que
se han producido en cada clase de categora de estudio.
Investigacin en disciplinas socio-sanitarias
11
Ejemplo: Localizacin de tumores:
Frecuencia
Absoluta
Frecuencia
Relativa
Frecuencia
Acumulada
Porcentajes Porcentaje
acumulado
Mama 327 0,717 0,717 71,7 71,7
tero 102 0,224 0,941 22,4 94,1
Ovarios 27 0,059 1,0 5,9 100,0
Total 456 1,0 100,0
2.4. Medidas de frecuencia
Razn. Es todo ndice obtenido al dividir dos cantidades.
Si las cantidades son positivas, las razones van de 0 a infinito.
Proporcin. Es toda razn cuyo numerador est incluido en el
denominador.
Si se multiplica por 100, se habla de porcentaje. Hay 2 tipos de
proporciones:
- Frecuencia relativa, cuando el numerador y denominador
representan recuentos mutuamente excluyentes. Su valor va de 0
a 1. Ejemplo: nmero de fumadores de una clase
- Fraccin, cuando el numerador y denominador son dos nmeros
reales, que son el resultado de medir una determina magnitud.
Ejemplo: proporcin de agua corporal
Odds. Corresponde al cociente entre la probabilidad de recurrencia
de un evento y la probabilidad de no recurrencia. Sus valores van del
0 al infinito.
Por ejemplo: una muestra de 500 mujeres, extradas al azar, 300 son
primparas y 200 son multparas
Nmero
Primparas 300
Multparas 200
Total 500
- Proporcin de primparas: 300/300 + 200= 0,60. Esto que
significa que hay 60 primparas por cada 100 embarazadas y
Investigacin en disciplinas socio-sanitarias
12
representa la probabilidad de que una mujer sea primpara,
siempre y cuando la muestra se haya extrado al azar.
- Odds de primparas: 300/200= 1,5. Esto significa que hay 150
primparas por cada 100 multparas y representa la probabilidad
de que ser primpara es 1,5 veces la de no ser multpara.
Tasa. El concepto de tasa es similar al de una proporcin, con la
diferencia de que las tasas llevan incorporado el concepto de tiempo.
El numerador lo constituye la frecuencia absoluta de casos del
problema a estudiar. A su vez, el denominador est constituido por la
suma de los perodos individuales de riesgo a los que han estado
expuestos los sujetos susceptibles de la poblacin a estudio. De su
clculo se desprende la velocidad con que se produce el cambio de
una situacin clnica a otra. Existe:
- Tasa absoluta- cociente entre la variacin de una magnitud Y
respecto a una magnitud X.
Ta = Yo - Yi / Ti - To
- Tasa relativa- cociente entre la variacin relativa de una magnitud
Y respecto a la variacin de otra magnitud X.
Tr = [(Yo Yi) / Yo]/ (Ti To)
Ejemplo: 2000 mujeres se siguen durante 10 aos despus del
parto, apareciendo durante este periodo 400 casos de incontinencia
urinaria.
- Tasa absoluta = Yo - Yi / Ti To = 2000-1600/10= 40 casos/ao
- Tasa relativa = [(Yo Yi) / Yo] / (Ti To) =
[(2000-1600)/2000]/10=0.02 casos/sujeto/ao.
2.5. Principales ndices epidemiolgicos y estandarizacin de tasas
Prevalencia de un evento. Cuantifica la proporcin de individuos de
una poblacin que padecen una enfermedad en un momento o
periodo de tiempo determinado. Su clculo se estima mediante la
expresin:
Investigacin en disciplinas socio-sanitarias
13
Incidencia de un evento. Se define como el nmero de casos
nuevos de una enfermedad que se desarrollan en una poblacin
durante un perodo de tiempo determinado. Hay dos tipos de
medidas de incidencia:
- La incidencia acumulada (IA), que corresponde a la proporcin de
individuos sanos que desarrollan la enfermedad a lo largo de un
perodo de tiempo concreto.
Proporciona una estimacin de la probabilidad o el riesgo de que
un individuo libre de una determinada enfermedad la desarrolle
durante un perodo especificado de tiempo.
Como cualquier proporcin, suele venir dada en trminos de
porcentaje. Adems, al no ser una tasa, es imprescindible que se
acompae del periodo de observacin para poder ser
interpretada. Se calcula segn la frmula:
- La tasa de incidencia o densidad de incidencia (DI), se calcula
como el cociente entre el nmero de casos nuevos de una
enfermedad ocurridos durante el periodo de seguimiento y la
suma de todos los tiempos individuales de observacin:
3. ESTADSTICA INFERENCIAL
3.1. Concepto
Es la parte de la estadstica que permite establecer conclusiones
referidas a poblaciones a partir de los resultados obtenidos en muestras.
Sus objetivos son:
Investigacin en disciplinas socio-sanitarias
14
Estimacin de parmetros poblacionales.
Evaluar la variabilidad aleatoria.
Controlar los factores de confusin.
3.2. Estimacin de parmetros y muestras
Conceptos de Parmetros estadsticos.
- Parmetros son las medidas o datos que se obtienen sobre la
distribucin de probabilidades de la poblacin, tales como: la
media, la varianza, la proporcin, etc.
- Estadstico son los datos o medidas que se obtienen sobre una
muestra y por lo tanto una estimacin de los parmetros.
Estadstica o censos.
Consiste en obtener datos de todos los sujetos de una poblacin.
Este es un procedimiento preciso, pero si la poblacin es grande, o
su accesibilidad es limitada se puede convertir en algo imposible.
Otra opcin es obtener datos de una muestra representativa de la
poblacin. En este caso, el esfuerzo posiblemente sea menor y esto
nos permite obtener informacin de mayor calidad. El problema que
surge aqu es la precisin de los estimadores, o dicho de otra
manera, el error que se asocia al muestreo.
Estimacin puntual y por intervalos
La estimacin puntual se utiliza un solo nmero para estimar los
parmetros de la poblacin
El intervalo de confianza es un rango de valores en el cual se
encuentra el verdadero valor del parmetro, con una probabilidad
determinada.
La probabilidad de que el verdadero valor del parmetro se
encuentre en el intervalo construido se denomina nivel de confianza,
y se denota 1- !. La probabilidad de equivocarnos se llama nivel de
significancia y se simboliza Generalmente se construyen intervalos
con confianza 1- !=95% (o significancia !=5%).
Investigacin en disciplinas socio-sanitarias
15
Tamao de la muestra
El paso previo al inicio de cualquier estudio es conocer el nmero de
sujetos que necesitamos estudiar. Si estudiamos pocos sujetos las
conclusiones pueden ser poco fiables y es posible que no se
detecten diferencias que realmente existen. Por el contrario, si
estudiamos un nmero excesivo de sujetos puede suponer un coste
excesivo tanto humano como material, adems de un importante
problema tico.
Por lo general el clculo del tamao muestral depende del diseo del
estudio:
- Estudios descriptivos. En estos estudios se plantea la siguiente
pregunta: Cuntos individuos son necesarios estudiar para
poder estimar un parmetro determinado con el grado de
confianza deseado?
Para ello necesitamos conocer: la variabilidad del parmetro que
se pretende estudiar (prevalencia, media); la precisin de las
estimaciones (sta es fijada por el investigador) y el nivel de
confianza (tambin fijado por el investigador, aunque por lo
general suele ser del 95%, correspondiente a un nivel ! de 0,05)
- Estudios analticos. En estos estudios la pregunta que se plantea
es la siguiente: Cuntos sujetos son necesarios estudiar para
poder detectar una determinada diferencia entre los grupos de
estudio?
Para ello necesitamos conocer: si se trata de una hiptesis uni o
bilateral; el riesgo ! o de tipo I (por lo general del 5%); la potencia
(que es la capacidad de estudio para detectar una determinada
diferencia (1 "), siendo " el error tipo II, que generalmente no
suele ser superior al 20%); la magnitud mnima de la diferencia o
asociacin que se considera importante detectar y la variabilidad
de la variable de respuesta en el grupo referencia.
ste ltimo parmetro es el nico que se debe conocer, ya que
los otros cuatro son fijados por el investigador.
Investigacin en disciplinas socio-sanitarias
16
Validez de la muestra. La validez de una muestra depende del
sistema de seleccin de los sujetos a estudio:
La utilizacin de mtodos probabilsticas proporciona una mayor
probabilidad de obtencin de muestras representativas:
- Muestreo aleatorio simple. Es la forma ms comn de obtener
una muestra en la seleccin al azar, es decir, cada uno de los
individuos de una poblacin tiene la misma posibilidad de ser
elegido. Es el que tiene ms probabilidad de obtener muestras
representativas. Se puede realizar partiendo de listas de
individuos de la poblacin, y eligiendo individuos aleatoriamente.
Generalmente conlleva un alto coste.
- Muestreo sistemtico: La seleccin de sujetos se fija mediante un
procedimiento sistemtico. Por ejemplo: se seleccionan sujetos
mltiplos de 2: 2, 4, 6, 8, 10, etc.
- Muestreo por conglomerados: Se aplica cuando es difcil tener
una lista de todos los individuos que forman parte de la poblacin
de estudio, pero sin embargo sabemos que se encuentran
agrupados naturalmente en grupos. La unidad de muestreo no es
el individuo sino los grupos o colectivos (conglomerados). Se
realiza eligiendo varios de estos grupos al azar, y una vez
elegidos, podemos estudiar a todos los individuos del grupo
elegido o bien seguir aplicando dentro de ellos otras tcnicas de
muestreo. Por ejemplo: barrios, institutos, colegios
- Muestreo estratificado: Se aplica cuando sabemos que hay
ciertos factores que pueden influir en el estudio. Requiere separar
a la poblacin segn grupos llamados estratos, y despus elegir
una muestra aleatoria simple en cada estrato. La informacin de
las muestras aleatorias simples de cada estrato constituira
entonces una muestra global. Por ejemplo: Hay que elegir a 300
pacientes de un centro de salud, y pretendemos estratificar por
consultas: 100 pacientes de la consulta 1, 100 pacientes de la
consulta 2 y 100 pacientes de la consulta 3.
Investigacin en disciplinas socio-sanitarias
17
Cuando se utilizan mtodos no probabilsticas no se conoce la
probabilidad de ser elegidos. Este tipo de muestreos esconden
sesgos y los resultados no pueden ser extrapolados a la poblacin.
Hay 2 tipos:
- Consecutivo. Se van incluyendo al estudio segn van
apareciendo.
- Accidental o inclusin de voluntarios. No exiten reglas fijadas
previamente. Se van incluyendo en el estudio a aquellas
personas que le interesan al investigador.
3.3. Medidas de asociacin, efecto e impacto
Se trata de medidas que se usan para evaluar la asociacin entre un
evento y un factor de estudio, por ejemplo: tratamiento (factor) y
curacin (evento). Comparan medidas de frecuencia del evento entre
dos o ms grupos, definidos por diferentes categoras del factor. En aras
de la simplicidad, consideraremos slo 2 grupos, uno de ellos, usado
como referencia, no tiene el factor y el otro s. La categora de referencia
debera tener un tamao grande para obtener estimaciones precisas y
ser suficientemente homognea para facilitar la interpretacin.
Las principales medidas de asociacin e impacto son:
Diferencia de riesgo (RD). Es la diferencia entre la incidencia en los
expuestos y la incidencia en los no expuestos, e indica que cantidad
de riesgo es atribuida a la exposicin. Se puede interpretar como el
riesgo que se podra evitar si el grupo de expuestos no hubiera
estado expuesto. Esta medida exige seguimiento de sujetos.
Riesgo relativo (RR). Corresponde al cociente entre la incidencia de
expuestos y la incidencia de los no expuestos. Indica el nmero de
veces que la enfermedad es ms probable que se desarrolle en los
expuestos que en los no expuestos. Esta medida exige seguimiento
de sujetos.
El significado de la diferencia de riesgo y de riesgo relativo es el
siguiente:
Investigacin en disciplinas socio-sanitarias
18
- Si RD=0 RR=1, el riesgo de enfermar es el mismo en los
expuestos y en los no expuestos.
- Si RD>0 RR>1, el riesgo de enfermar es mayor en los
expuestos que en los no expuestos. Hay una asociacin positiva
entre exposicin y enfermedad. La exposicin es un factor de
riesgo para la enfermedad.
- Si RD<0 RR<1- el riesgo de enfermar es menor en los
expuestos que en los no expuestos. Hay una asociacin negativa
entre exposicin y enfermedad. La exposicin es un factor
protector.
Ejemplo:
Cncer No fumador Fumador Total
Si 1 9 10
No 999 1191 2190
Total 1000 1200 2200
RD= (9/1200)-(1/1000) = 0,0065. Esto indica que en el grupo de
fumadores hay un 6,5 por mil casos de cncer que en los no
fumadores.
RR= (9/1200)/(1/1000) = 7,5. Esto indica que la proporcin de
casos de cncer es 7,5 veces mayor en los fumadores que en los
no fumadores.
Con la diferencia de riesgo podemos obtener una medida bsica
dentro del mundo de la enfermera basada en la evidencia (EBE).
Esta medida se llama NNT y se obtiene como el inverso de la
diferencia de riesgos y representa el nmero de sujetos que ser
necesario tratar de forma experimental para prevenir un resulta
adverso o bien para conseguir un resultado positivo.
En el ejemplo anterior:
NNT= 1/RD= 1/0,0065= 153,84 (se redondea al nmero entero
superior), por lo que sera NNT= 154. Esto indica que para evitar
un caso de cncer 154 personas deberan dejar de fumar.
Investigacin en disciplinas socio-sanitarias
19
3.4. Prueba de hiptesis
La estadstica inferencial se ocupa tanto de la estimacin de parmetros
como de la verificacin de hiptesis. Esto ltimo consiste en formular un
valor aproximado respecto al valor de la media de la poblacin y luego
verificar si dicha estimacin aproximada es compatible con los datos
observados. ste es el mtodo denominado prueba de hiptesis, que
consiste, en definitiva, en un proceso de toma de decisiones.
Normalmente antes de iniciar una investigacin se parte de una
hiptesis, lo que implica siempre la exclusin de otras.
Hiptesis nula e hiptesis alternativa
La hiptesis nula (Ho) se refiere siempre a un valor especificado del
parmetro de poblacin, no a una estadstica de muestra. El
planteamiento de la hiptesis nula siempre contiene un signo de
igualdad con respecto al valor especificado del parmetro.
La hiptesis alternativa (H1) es cualquier hiptesis que difiera de la
hiptesis nula. El planteamiento de la hiptesis alternativa nunca
contiene un signo de igualdad con respecto al valor especificado del
parmetro.
Error tipo I y error tipo II
Un error tipo I se presenta si la hiptesis nula es rechazada cuando
de hecho es verdadera y deba ser aceptada.
Un error tipo II se presenta si la hiptesis nula es aceptada cuando
de hecho es falsa y deba ser rechazada.
3.5. Contraste de hiptesis
Estudio de relacin entre variables cualitativas: prueba del chi-
cuadrado
La prueba # de Pearson es considerada como una prueba no
paramtrica que mide la discrepancia entre una distribucin
observada y otra terica, indicando en qu medida las diferencias
existentes entre ambas, de haberlas, se deben al azar en el
contraste de hiptesis. Tambin se utiliza para probar la
Investigacin en disciplinas socio-sanitarias
20
independencia de dos variables entre s, mediante la presentacin de
los datos en tablas de contingencia.
La frmula que da el estadstico es la siguiente:
As, el estadstico 2 mide la diferencia entre el valor que debiera
resultar si las dos variables fuesen independientes y el que se ha
observado en la realidad. Cuanto mayor sea esta diferencia (y, por
tanto, el valor estadstico), mayor ser la relacin entre ambas
variables. El hecho de que las diferencias entre los valores
observados y esperados estn elevados al cuadrado convierte
cualquier diferencia en positiva. El test 2 es as un test no dirigido,
que nos indica si existe o no relacin entre dos factores pero no en
qu sentido se produce tal asociacin.
Para obtener los valores esperados, se calcula el producto de los
totales marginales dividido por el nmero total de casos (n). El caso
ms sencillo, es decir, una tabla de 2 x 2, sera:
Tabla de contingencia general para la comparacin de dos
variables dicotmicas.
Caracterstica A
Caracterstica
B
Presente Ausente Total
Presenta A b a + b
Ausente C d c + d
Total a + c b + d $
Supongamos que se quiere estudiar la posible asociacin entre el
hecho de que una gestante fume durante el embarazo y que el nio
presente bajo peso al nacer. Por lo tanto, se trata de ver si la
probabilidad de tener bajo peso es diferente en gestantes que fumen
o en gestantes que no fumen durante la gestacin. Para responder a
esta pregunta se realiza un estudio de seguimiento sobre una
cohorte de 2000 gestantes, a las que se interroga sobre su hbito
tabquico durante la gestacin y se determina adems el peso del
Investigacin en disciplinas socio-sanitarias
21
recin nacido. Los resultados de este estudio se muestran en la
siguiente tabla:
Tabla de contingencia para estudiar la asociacin entre
fumar durante la gestacin y el bajo peso del nio al nacer.
Estudio de seguimiento de 2000 gestantes.
Recin nacido de bajo peso
Gestante
S No Total
Fumadora 43 (a) 207 (b) 250
No
fumadora
105 (c) 1645 (d) 1750
Total 148 1852 2000
Los valores esperados se calculan a travs del producto de los
totales marginales dividido por el nmero total de casos (n). Para el
caso ms sencillo de una tabla 2x2 como la Tabla 1, se tiene que:
Para los datos del ejemplo en la Tabla 2 los valores esperados se
calcularan de la siguiente firma:
5 , 18
2000
250 148
11
=
= E
5 , 129
2000
1750 148
21
=
= E
5 , 231
2000
250 1852
12
=
= E
5 , 1620
2000
1750 1852
22
=
= E
De modo que los valores observados y esperados para los datos del
ejemplo planteado se muestran en la siguiente tabla
Tabla de contingencia para estudiar la asociacin
entre fumar durante la gestacin y el bajo peso del
nio al nacer. Valores observados y valores
esperados (entre parntesis) si los factores fuesen
independientes.
Recin nacido de bajo peso
Gestante S No Total
Fumadora 43 (18.5) 207 (231.5) 250
No fumadora 105 (129.5)
1645
(1620.5)
1750
Total 148 1852 2000
( ) ( )
n
c a b a
E
+ +
=
11
( ) ( )
n
c a d c
E
+ +
=
21
( ) ( )
n
d b d c
E
+ +
=
22
( ) ( )
n
d b b a
E
+ +
=
12
Investigacin en disciplinas socio-sanitarias
22
El valor del estadstico
2
=
A la vista de este resultado, lo que tenemos que hacer ahora es
plantear un contraste de hiptesis entre la hiptesis nula y la
hiptesis alternativa:
- H0: No hay asociacin entre las variables (en el ejemplo, el bajo
peso del nio y el hecho de fumar durante la gestacin son
independientes, no estn asociados).
- Ha: S hay asociacin entre las variables, es decir, el bajo peso y
el fumar durante la gestacin estn asociados.
Bajo la hiptesis nula de independencia, se sabe que los valores del
estadstico
2