You are on page 1of 5

Anlisis de datos en los estudios epidemiolgicos I Julia Garca Salinero

Anlisis de datos en los estudios epidemiolgicos I


Introduccin En este capitulo, de continuacin de nuestra serie temtica de formacin en metodologa de la investigacin, vamos a centrarnos en el anlisis de datos de los denominados estudios epidemiolgicos. Dada la amplitud del tema, pensamos que sern necesarios varios captulos para aproximarnos con alguna profundidad al tema en estudio. Aunque actualmente cualquier estudio epidemiolgico, de cierto rigor, utiliza para el anlisis de datos paquetes estadsticos, como el EPIINFO y el SPSS, no por ello debemos de pasar de largo sobre los conceptos estadsticos y epidemiolgicos, en los que estos programas se basan. Conceptos conocidos por todos los profesionales de la salud pero probablemente olvidados, ya que, como ocurre con otras muchas reas de conocimiento, la cercana de la estadstica se consigue con la prctica. El anlisis de datos es el final de la investigacin, el momento en que vamos a conocer de manera precisa qu ha ocurrido con la informacin, con los datos obtenidos en nuestro estudio. Esta etapa de anlisis a su vez consta de varias fases, entre ellas la de decidir el tipo de anlisis que quiero realizar. Ya se indic, en los captulos dedicados al diseo de los estudios epidemiolgicos, que en el propio diseo de la investigacin se deba indicar el tipo de anlisis que se va a realizar. Tambin se indic que a pesar de la existencia de elementos comunes, cada tipo de estudio por su parte requera un anlisis concreto y que, siendo cierto que tanto los estudios descriptivos como los analticos requeran una descripcin detallada de las variables en estudio, los estudios de cohortes casos control y experimentales, que pretenden encontrar asociacin o causalidad entre variables, precisan adems un abordaje ms complejo. Etapas del anlisis epidemiolgico. En cualquier estudio bien diseado los datos obtenidos en el mismo contienen la informacin necesaria para conseguir los objetivos planteados, datos que deben ser sometidos a distintas etapas de anlisis. Comprobacin. En primer lugar debemos proceder a comprobar que los datos son correctos, tenemos que analizar que no falten datos, que estn completos, valoraremos su precisin o exactitud y su consistencia. Procesamiento de datos, tambin denominada sumarizacin. La presentacin de los datos es un aspecto esencial del proceso de anlisis, no podemos dar los datos tal y como los hemos obtenido, estos datos se deben transformar en resultados reduciendo la extensin de los mismos. La sumarizacin de los datos facilitar el subsiguiente anlisis. La forma ms simple de agrupar los datos es utilizar tablas de frecuencia, proceso conocido como tabulacin. Dependiendo del tipo de anlisis que deseamos realizar deberemos utilizar tablas de distribucin de frecuencias o tablas de contingencia, en las que se tabula la distribucin de las observaciones en funcin de las variables estudiadas. Agrupacin de datos. Distribuciones de frecuencias. Como ya indicamos anteriormente, los datos en bruto no nos informan de casi nada, por el contrario pueden resultarnos abrumadores. Para que nos resulten tiles necesitamos ordenarlos, agruparlos, etc. El conjunto de datos obtenidos en un estudio se pueden describir en base a tres elementos esenciales: La distribucin de los valores obtenidos La tendencia y posicin de los mismos en cuanto a un valor central La variabilidad que presentan.

Las distribuciones de frecuencias Las tablas de distribucin de frecuencia Realizar una tabla de distribucin de frecuencias con los datos obtenidos en una investigacin es el primer paso para imponer un cierto orden al conjunto de informaciones. Este proceso supone una sistematizacin de los valores numricos obtenidos, as como un recuento del nmero de veces que se ha obtenido ese valor. Construir una distribucin de frecuencias es un proceso simple ya que consta bsicamente de dos componentes, los valores obtenidos (X) y el nmero de veces o frecuencia con la que se ha obtenido ese valor (f). El nico requisito de una tabla de frecuencias es que las clases en las que ordenamos los datos sean mutuamente excluyentes y exhaustivas en su conjunto, es decir un valor no puede estar a la vez incorporado a dos clases distintas.

Nure Investigacin, n16, Junio 2005

Anlisis de datos en los estudios epidemiolgicos I Julia Garca Salinero

Observemos lo anterior en el siguiente ejemplo: Pensemos que estamos realizando un estudio para conocer los valores de glucemia basal de los nios de un colegio de primaria. Tomamos una muestra representativa de 25 nios y nias obtenemos los siguientes valores: 90,105, 106, 79, 90, 100, 103, 105, 90, 98, 90, 95, 100, 103, 102, 105, 90, 110, 86, 90, 100, 110, 90, 86, 90. Como podernos observar en esta distribucin difcilmente podemos apreciar nada. Procedemos entonces a ordenar los datos, de menor a mayor, colocando los mismos en una tabla de distribucin de frecuencias. A menudo nos interesa no slo saber el recuento de las frecuencias absolutas sino tambin de las frecuencias relativas y de los porcentajes. As como el sumatorio de todas las frecuencias debe ser igual al nmero de sujetos estudiados (N), la suma de los porcentajes de cada puntuacin deber ser igual al 100%. Valores de glucemia 79 86 90 95 98 100 102 103 105 106 110 Recuento I II IIIIIIII I I III I II III I II Frecuencia absoluta 1 2 8 1 1 3 1 2 3 1 2 N = 25 Frecuencia relativa o proporcin 0,04 0,08 0,32 0.04 0,04 0,12 0,04 0,08 0,12 0,04 0,08 1 Porcentaje 4% 8% 32% 4% 4% 12% 4% 8% 12% 4% 8% 100%

En esta tabla ya tenemos realizada una primera ordenacin de los datos. No nos vamos a detener en la explicacin de todos estos conceptos, puesto que entendemos son conocidos por los profesionales de enfermera, pero si en la de algunos que quizs no se hayan estudiado suficientemente. La frecuencia acumulada Como su nombre indica es la acumulacin de frecuencias que se han producido en cada clase o categora de la variable en estudio. Se calcula a partir de la categora inferior a la que se van sumando el resto de los valores de cada una de las categoras. Lgicamente la frecuencia acumulada de la categora ltima debe coincidir con el nmero total de casos. De forma similar se realiza la proporcin acumulada y el porcentaje acumulados. Vamos a realizarlo a partir del ejemplo anterior. Valores de glucemia 79 86 90 95 98 100 102 103 105 106 110 Frecuencia absoluta 1 2 8 1 1 3 1 2 3 1 2 N = 25 Frecuencia relativa o proporcin 0.04 0,08 0,32 0.04 0,04 0,12 0,04 0,08 0,12 0,04 0,08 1 Porcentaje 4% 8% 32% 4% 4% 12% 4% 8% 12% 4% 8% 100% Frecuencia acumulada 1 3 11 12 13 16 17 19 22 23 25 Proporcin acumulada 0,04 0.12 0,44 0,48 0,52 0,64 0,68 0,76 0,88 0,92 1 Porcentaje acumulado 4% 12% 44% 48% 52% 64% 68% 76% 88% 92% 100%

Evidentemente el valor de glucemia es una variable cuantitativa continua, que se convierte en una variable discreta con los instrumentos de medida. Si queremos realizar la tabla de distribucin de frecuencias para las variables cuantitativas continuas debemos de proceder de otro modo. Debemos en primer lugar ordenar los datos en base a intervalos, para ello procederemos del siguiente modo: Determinar la amplitud de los intervalos. Es decir el intervalo dentro del cual varan los datos de la muestra. Se calcula restando la puntuacin mxima de la mnima A= X max- X Min. Determinar el nmero de intervalos que vamos a utilizar. Esto depender del tamao de nuestra muestra. Normalmente se suele utilizar una regla que es la raz cuadrada del nmero de sujetos (N).

Nure Investigacin, n16, Junio 2005

Anlisis de datos en los estudios epidemiolgicos I Julia Garca Salinero

Calcular la amplitud del intervalo. La amplitud se suele representar con la letra i y se obtiene dividiendo la amplitud de la distribucin por el nmero de intervalos: I= Amplitud de la distribucin nmero de intervalos

Determinar el lmite inferior del primer intervalo, es decir, la puntuacin ms pequea a partir de la cual comenzamos a contar el resto.

Las representaciones grficas Con frecuencia los investigadores prefieren presentar sus datos en forma de grficos. Para realizar una correcta presentacin grfica tenemos que tener en cuenta el tipo de variables de estudio. En el cuadro siguiente presentamos el tipo de tabulacin y el grfico ms adecuado a cada tipo de variable lo cual nos permitir tambin recordar algunos conceptos sobre las variables, ya tratados en los temas anteriores. Tipo de variable Cualitativa Tabulacin Frecuencia Proporcin Porcentaje Frecuencia Proporcin Porcentaje Proporcin acumulada Frecuencia acumulada Porcentaje acumulado Frecuencia Proporcin Porcentaje Proporcin acumulada Frecuencia acumulada Porcentaje acumulado Frecuencia Proporcin Porcentaje Proporcin acumulada Frecuencia acumulada Porcentaje acumulado Representacin grfica Diagramas de barras Diagramas de sectores Pictogramas Diagramas de barras Diagramas de sectores Pictogramas

Cuasi cuantitativa

Cuantitativa Discreta

Diagramas de barras

Cuantitativa continua

Histogramas Polgonos de frecuencias

Diagramas de barras. Consiste en un conjunto de barras o rectngulos sobre un eje de coordenadas. La altura de cada barra estar determinada por la frecuencia de la modalidad que representa.
Causas de m ortalida inf ant il

3 0 % 2 8 %

2 5 %

2 0 %

19%

19% 18%

1 5 %

S erie1

1 0 % 7 % 5 % 5 % 4%

0 % Inf ecciones resp ira torias D iarreas Perinatal S ram pin Malaria S ID A O tro s

Nure Investigacin, n16, Junio 2005

Anlisis de datos en los estudios epidemiolgicos I Julia Garca Salinero

Diagrama de sectores. Consiste en representar mediante sectores circulares las distintas modalidades de una variable. Cada una de las modalidades se representa proporcionalmente a los 360 del crculo.

Causas de Mortalidad Materna

Causas Indirectas 19% Otras Causa 7%

Hemorragia Severa 24%

Aborto Inseguro 12%

Infecciones 14% Parto Obstruido 12% Eclampsia 12%

Histogramas. Consiste en un conjunto de barras o rectngulos dibujados sobre un eje de coordenadas. Cada modalidad se representa por un rectngulo que tiene como base la amplitud del intervalo y como altura la frecuencia de dicho intervalo. Polgono de frecuencias. Consiste en una lnea quebrada que une los puntos medios de cada intervalo y su frecuencia. Comienza y termina en el eje de abscisas en los puntos medios de los intervalos anterior y posterior a los histogramas.

Actualmente hay programas informticos, como EXCELL, que permiten realizar de manera muy simple estos grficos,

Nure Investigacin, n16, Junio 2005

Anlisis de datos en los estudios epidemiolgicos I Julia Garca Salinero

Bibliografa Carrasco J L. El mtodo estadstico en la investigacin mdica. 6 Edicin. Editorial Ciencia 3; 1995 Rodrguez Mion P. Estadstica Aplicada a la Biologa. 3 Edicin. Editorial UNED; 1984. Polit Dense, Hungler Bernadette. Investigacin cientfica en ciencias de la salud. 6 edicin. Edit McGraw-Hill Interamericana; 2000. Fernando Villar et al. Diseo y anlisis Epidemiolgico. Revista Rol de Enfermera 1987. 112: 13-17.

Nure Investigacin, n16, Junio 2005

You might also like