Professional Documents
Culture Documents
ESCUELA DE SALUD
BIOESTADISTICA CCB1107
GUIA CATEDRA IV BIOESTADISTICA
Nadie duda que el análisis de los datos en general y biológicos en particular hoy en día se ha
simplificado gracias al desarrollo de software con completísimos paquetes estadísticos y al
acceso a computadores y calculadoras científicas de bolsillo. Los avances desarrollados en
esta línea permiten manejar grandes números de datos con cálculos que sin software y el
uso de computadores tardarían varias semanas y el empleo de mucha gente. Estos
programas de computador además permiten tener la certeza absoluta que los cálculos
desarrollados no tienen posibilidad de generar valores errados, el error sólo podría
presentarse en la digitación de los datos al sistema. Al contrario, si el cálculo se realizara
manualmente lo más probable que se cometan errores involuntarios en su desarrollo.
Sin embargo, ni el software ni la computadora por muy avanzados que estos sean piensan
por quien esta manejando el experimento, tampoco tienen opinión ni les preocupa si los
datos ingresados reúnen los requisitos para el análisis o prueba que se ejecuta. Por
consecuencia, el paquete estadístico y la maquina solo cumplen en dar una respuesta
(resultado). En este caso, la validez del resultado sólo dependerá de la responsabilidad y
honradez del investigador, cumpliéndose la premisa de que “si basura se introduce como
dato basura saldrá como resultado”, siendo lo anterior independiente del software
estadístico y la computadora empleada.
En otros casos, siendo los datos adecuados y especulando que la prueba realizada también
sea la adecuada, es posible que un iniciado genere errores de interpretación o simplemente
no saque el provecho suficiente a los datos debido, a que desconoce para que sirve o que
implican muchos de los resultados generado por la prueba estadística. En estos casos, lo
más importante de los resultados pasa a segundo plano o bien se ignora.
También es muy posible que el resultado sea usado por quien se inicia en el análisis de datos
como un resultado indesmentible de lo que se desea probar, al respecto se vuelve a recalcar
que, quien desarrolla el trabajo deberá darle la validez que corresponda y para ello la
estadística solo cumple un rol de herramienta al servicio del investigador o analista.
RECORDAR…….
ESTADÍSTICA DESCRIPTIVA
ESTADÍSTICA INFERENCIAL
PARÁMETRO VS ESTADÍGRAFO
PARÁMETRO – Un índice estadístico calculado a base de los datos de una población y que
cuantifica una característica de esa población. Generalmente son datos comprobados
mediante registros. Ejemplo: La tasa de desempleo se ha mantenido en 18%. Es un índice
estadístico que va dirigido a describir a la población. Muchos de estos índices se obtienen
mediante registros oficiales de agencias del Gobierno, tales como la tasa de mortalidad, de
divorcios, entre otras.
Las medidas de resumen sirven para describir en forma resumida un conjunto de datos que
constituyen una muestra tomada de alguna población.
Existen diferentes tipos de medidas de resumen o estadísticos, algunos de ellos se
clasifican como:
Medidas de posicionamiento
MEDIDAS DE POSICIÓN
Localización
Señalan otras ubicaciones,
aparte del centro, dentro
de la masa de datos.
Me
Pp o Pi
Dividen la distribución Qq
en partes iguales
Dc
Q
MEDIANA: (Me, Md, X0,5)
Me o X0.5 = X3+X4 / 2
Ej.:
Sea X = 3,5; 2,0; 3,3; 5,0; 5,4; 4,9
R.: 2,0
3,3
*3,5
*4,9
5,0
5,4
En este caso corresponde al promedio de los 2 valores centrales
Observaciones:
DECILES (Dp): Los deciles dividen la distribución en 10 partes iguales, o sea realiza 9
divisiones correspondientes a 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80% y 90%.
PERCENTILES (PP) O CENTILES: El número total de datos se divide en 100 partes, o sea
realiza 99 divisiones desde el 1% al 99% y se avanza desde el dato menor al mayor y se
extrae el valor del recorrido de la variable que corresponda.
Existe un valor donde coinciden los cuartiles, deciles y percentiles, y surge cuando estos
son iguales a la mediana.
Pp0____________________________Pp50_____________________________Pp100
Me
Q2
Dp5
MEDIDAS DE TENDENCIA CENTRAL O DE CENTRALIZACIÓN
MODA moda, mode o promedio típico MO: Se puede calcular sobre variables de escala de
medida cualitativa o cuantitativa, corresponde al valor de la variable que más veces se
repite, el valor que tiene la mayor frecuencia, no es afectada por valores extremos, una
distribución de datos puede ser amodal, o sea no existir moda o bi, tri o polimodal
Ej.: Sea X una variable cualitativa, color preferido de un grupo de adolescentes
X = {amarillo, amarillo, verde, café, azul, amarillo, azul, azul } 2 modas= distribución
bimodal
Observaciones:
Observaciones:
Se representa como:
∑xi*wi ni
∑wi ni
Siendo:
Ej.:
• Las medidas de dispersión nos indican que tan dispersos están los datos respecto a
una medida de posición, como la media (cuanto varían, que tan diferente es cada
punto del recorrido de una variable)
• Muy usadas para complementar la media
• Para describir la variabilidad o dispersión de un grupo de datos
• Para comparar un grupo de datos con otro.
• Rango
• Varianza
• Desviación estándar
• Error estándar
• Rango interquartilico
• Coeficiente de variación
CARACTERÍSTICAS DE LAS MEDIDAS DE VARIABILIDAD
RANGO (Rx): El rango corresponde a la diferencia entre el valor máximo y el valor mínimo,
que toma la variable, es el más tosco de los estimadores de dispersión, puede ser
gravemente afectado por valores extremos.
Rx = (Máx. – Mín.)
Ej:
Sea X una variable cuantitativa (edad de un grupo de pacientes que reciben un
quimioterápico
DESVIACIÓN ESTANDAR (s): La D.E. está basada en cada uno de los datos, permite por
lo tanto una mejor descripción de la dispersión, está calculada con respecto a la media
aritmética. O sea mide la dispersión alrededor de la media, la D.E. tiene un alto nivel de
interpretación porque las unidades de medida son las mismas que las de la variable original.
• La D.E. está basada en cada uno de los datos, permite por lo tanto una mejor
descripción de la dispersión.
• La D.E. esta calculada con respecto a la media aritmética. O sea mide la dispersión
alrededor de la media.
• La D.E. tiene un alto nivel de interpretación porque las unidades de medida son las
mismas que las de la variable original.
ERROR ESTÁNDAR (E.E.): El error estándar de la media, estima la variabilidad entre las
medias de las muestras que se obtendría si se tomaran múltiples muestras de la misma
población. El error estándar de la media estima la variabilidad entre las muestras mientras
que la desviación estándar mide la variabilidad dentro de una muestra.
C.V = s * 100
X
Observaciones: el grupo con el coeficiente de variación más pequeño nos indica menor
variabilidad entre sus datos.
4 7 11
1 2 5
3 6 55
12 45 7
SIMETRIA Y KURTOSIS
C.A. = (X – Mo)
D.E.
Solo en caso de distribuciones unimodales
Donde:
Q3 = 7, Q1 = 3.2, Q2 = 5.5
1.- Defina los conceptos de moda, mediana, media, varianza, desviación estándar,
coeficiente de variación.
2.- Un estudiante realiza 3 evaluaciones de bioestadística; obteniendo los siguientes
resultados: 2,5; 6,0; 3,7, Calcular la media aritmética
3.- Determine la mediana de las siguientes notas obtenidas durante un año.
3,5; 2,0; 3,3; 5,0; 5,4; 4,9
4.- Calcule la moda e indique el tipo de distribución al que corresponde,
X = ⎨3, 3, 3, 4, 5, 6, 6, 6, 8,9,12, 2⎬
5.- Estime la varianza y d.e del siguiente conjunto de datos
X = peso ⎨23, 13, 21, 24, 35, 28, 22, 19, 28,19,20, 21⎬