Professional Documents
Culture Documents
se sigue para
analizar los datos?
Diagramas de barras
Alturas proporcionales a las frecuencias (abs. o rel.)
Se pueden aplicar tambin a variables discretas
Pictogramas
Fciles de entender.
El rea de cada modalidad debe ser proporcional a la frecuencia.
De los dos, cul es incorrecto?.
2
419
400 375
255
Recuento
215
127
sean discretas o continuas. Valor con frec. 100
absolutas o relativas. 54
24 23
Diagramas barras para v. discretas
17
Nmero de hijos
Recuento
El rea que hay bajo el histograma 150
20 40 60 80
Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se realizan a
partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad (frecuencia)
de individuos que poseen un valor inferior o igual al mismo. No los construiremos en clase. Se pasan
de los diferenciales a los integrales por integracin y a la inversa por derivacin (en un sentido ms
general del que visteis en bachillerato.)
4
+ Proceso de Investigacion Cuantitativa
Programa de computador.
La Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando
experimentos para validar o rechazar dichas leyes
Los modelos que crea la ciencia son de tipo determinista o aleatorio (estocstico)
La Bioestadstica [...] ensea y ayuda a investigar en todas las reas de las Ciencias de la Vida
donde la variablidad no es la excepcin sino la regla
Carrasco de la Pea (1982)
11
Definicin
La Estadstica es la Ciencia de la
12
TIPOS DE ESTADSTICA
Estadstica Descriptiva Estadstica Inferencial
Mtodo de recolectar, organizar, Mtodos usados para determinar algo
resumir y presentar los datos en acerca de la poblacin, basado en una
forma informativa. muestra.
Ejemplo 1: Una encuesta desarrollada
Ejemplo 1: Los datos del Censo de para saber sobre los beneficios de los
poblacin de ao. celular.
Ejemplo 2: Cual es el promedio de Ejemplo 2: Investigacin sobre la
accidentes ocurridos en seis meses motivacin y la produccin de una
en la empresa Electro Per. empresa.
OBJETIVOS DE LA INVESTIGACIN CIENTFICA
Descriptiva Inferencial
ESTADSTICA
Uno de los objetivos de la estadstica es conocer acerca del comportamiento de parmetros poblacionales
tales como:
la media ( ),
la varianza ( )
o la proporcin ( p ).
DISTRIBUCIN DISTRIBUCIN
MUESTRAL DE LA MEDIA MUESTRAL DE LA
POPORCIN
La distribucin muestral es la
distribucin de los resultados que se
presentan si en realidad se seleccionaron
todas las muestras posibles
15
DISTRIBUCIONES MUESTRALES
1 Distribucin Muestral de la Media
2
2 3
1
DISTRIBUCIONES MUESTRALES
Si se est muestreando una poblacin que tiene una distribucin normal con media y desviacin estndar
conocida, independientemente del tamao de la muestra n, la distribucin muestral de la media tendr una
distribucin normal con media muestral igual a la media poblacional y un error estndar de la media muestral.
La distribucin normal
tiene un promedio La prueba de Hiptesis para la
terico de 0 y una media poblacional se realizar
desviacin estndar haciendo uso de los puntajes
terica de 1. z de la curva normal.
Si se est muestreando una poblacin que tiene una distribucin normal con media y desviacin estndar desconocida, la
distribucin muestral de la media que se utilizar es la t de student siempre que el n sea inferior a 30. Cuando la muestra es mayor a
ese nmero, la distribucin se asemeja a la distribucin normal y el contraste de hiptesis se realizacin con la distribucin z.
1) Para la mayor parte de las distribuciones poblacionales, sin importar su forma, la distribucin muestral de la
media tiene una distribucin aproximadamente normal cuando se seleccionan muestras de por lo menos 30
elementos.
2) Si la distribucin poblacional es bastante simtrica, la distribucin muestral de la media es aproximadamente
normal en muestras tan pequeas como las de 5 elementos.
3) SI la poblacin tiene una distribucin normal, la distribucin muestral de la media tambin tiene una
distribucin normal, independientemente del tamao de la muestra.
1 101 10201
2 98 9604
3 76 5776 374,64
4 123 15129
5 143 20449
6 98 9604
7 88 7744 1- 19,35
8 100 10000 0,9
5
9 105 11025
639,17 663,16
10 132 17424
106,4 116956 20
ALGUNOS CONCEPTOS ASOCIADOS A LA PRUEBA DE HIPOTESIS
Error tipo I
Rechazar una Hiptesis nula (Ho) siendo esta verdadera. Tiene asociada una probabilidad
Error tipo II
Aceptar una Hiptesis nula (Ho) siendo esta falsa. Tiene asociada una probabilidad .
Nivel de confianza
Es aceptar una Hiptesis nula (Ho) siendo esta verdadera por lo tanto es una decisin acertada; tiene
asociada una probabilidad de 1 . Los niveles de confianza ms usados son el 0,99 (99%) y el 0,95 (95%)
Potencia de Prueba
Rechazar una Hiptesis nula (Ho) siendo esta falsa (Acierto). Tiene asociado una probabilidad que es 1
(Es la probabilidad de estar en potencia de prueba). Es un complemento al error tipo II.
21
PASOS PARA LA PRUEBA DE HIPOTESIS
3) Determinar un nivel de significacin (), la cual es la probabilidad de cometer el error tipo I (Rechazar una
hiptesis siendo esta verdadera).
- ms usados: 0,01 (1%) y 0,05 (5%).
- SPSS: el programa calcula y entrega automticamente un nivel de error que tcnicamente se denomina p
value o valor p (nivel de significacin mnima o mnimo para poder rechazar la Ho.
- si p 0,01: se rechaza la Ho con un p < 0,01 (1% de significacin)
- si p > 0,01 y 0,05: se rechaza Ho con un p < 0,05
- si p > 0,05: se acepta Ho con un p > 0,05 (95% de confianza)
22
DISTRIBUCION VARIABLE VARIABLE RELACIN ENTRE LAS PRUEBA ESTADSTICA
INDEPENDIENTE DEPENDIENTE MUESTRAS
(PREDICTORA) (RESULTADO)
No normal Una sola muestra (se Binomial
(No paramtricos) compara con valor Chi-cuadrado de Pearson
terico) Chi-cuadrado de Mantel-Haenzsel
Prueba de Kolmogorow-Smirnov
Prueba de las Rachas
COVARIACION (medidas de dos variables en los mismos sujetos o unidades de anlisis del estudio)
Paramtrico Cuantitativa Cuantitativa Correlacin de Pearson
No paramtrico Cuantitativa Cuantitativa Correlacin de Spearman
CORRELACIONES
Procedimiento estadstico que intenta probar el grado de asociacin que hay entre dos o
ms variables
Correlaciones Correlaciones
Bivariadas Mulivariadas
Es un nmero que nos dice hasta donde los cambios o variaciones que presenta una variable se explican
por las variaciones o cambios que presenta otra variables (Juego de varianzas)
La correlacin no implica causalidad, la nica vez que yo puedo atribuir causalidad es cuando la
correlacin es perfecta (-1 o +1).
24
COEFICIENTES DE CORRELACIN
- Es un derivado de Pearson
- Correlacin entre una variables dicotmica real o genuina (nominal) con otra
4 Punto Biserial (rpb) variable que es cuantitativa continua medida a lo menos en una escala intervalar.
- El signo no se interpreta, sino que hay que ver las medias de los grupos
- En SPSS se realiza mediante el coeficiente de correlacin de Pearson
- Es un derivado de Pearson
25
5 Biserial (rb) - Correlacin entre una variable es que cuantitativa medida a lo menos en una escala
intervalar con otra variable que es dicotmica aparente o artificial
COEFICIENTES DE CORRELACIN
- Sirve para calcular la correlacin entre dos variables dicotmicas reales o una
dicotmica real y una aparente.
6 Phi (r) - El signo no se interpreta, pues son variables cualitativas. Para interpretar hay que
recurrir a la tabla de contingencia.
- Condicin: Si existe una frecuencia esperada menor a 5, se interpreta mediante el
estadstico exacto de Fisher (Chi cuadrado)
- Es un derivado de Pearson
- Tradicionalmente se utiliza para calcular la correlacin entre 2 variables
7 Contingencia (C) dicotmicas (reales o aparentes), dos policotmicas (reales o aparentes) o una
dicotmicas y una policotmicas..
- Su uso se restringir a dos variables policotomicas o una policotmica y una
dicotmica
- Toma valores que van entre 0 y 1
- Condicin: si ms del 20% de las frecuencias esperadas son inferiores a 5, no se
puede calcular.
8 Tetracorico (rt) - Se utiliza para calcular la correlacin entre dos variables dicotmicas aparentes
- Es derivado de Pearson
- La dicotoma por lo general se realiza en la mediana.
26
COEFICIENTES DE CORRELACIN
27
Identifica y grafica los diagramas de
dispersin, analiza e interpreta la correlacin
positiva y negativa.
TALLER DE APLICACIN
REYNALDO CARVAJAL ORTIZ
CAPITULO 5
93
REYNALDO CARVAJAL ORTIZ
Aceptar una Hiptesis alterna significa que existe una verdadera asociacin
entre exposicin efecto o que las diferencias obtenidas en el estudio
son reales.
94
REYNALDO CARVAJAL ORTIZ
95
REYNALDO CARVAJAL ORTIZ
Capacidad que tiene el estudio para rechazar una Hiptesis nula falsa.
Capacidad que tiene el estudio de detectar diferencias cuando
realmente las hay
Probabilidad de que los resultados del estudio sean verdaderos
96
DATOS BIVARIADOS
Son valores de dos diferentes variables que se obtienen a partir del mismo
elemento de poblacin (es decir, de la misma unidad estadstica). No se trata
de elegir dos variables cualesquiera, es una observacin simultnea de
variables que tengan entre s alguna relacin. Se representan como pares
ordenados (X;Y).
Pueden calcularse
Porcentajes basados en el total porcentajes
basados en el total
de columnas: de la columna
6
100 75%
8
TABLAS BASADOS AL TOTAL DE LAS FILAS
2
100 16, 7%
12
EJEMPLO N3 :VARIABLE MIXTAS
VARIABLES:
Una variable cualitativa y una variable
cuantitativa.
0
3
5
5
2
N DE HIJOS
5
4
1
1
3
0
2
0 1 2 3 4 5 6
N DE TRABAJADORES
Interpretaciones Varn Mujer
N cigarrillos al da 3 6 8 20 25
1.4
1.2
1
20, 1.2
cigarros al da es
0.8
0.6 6, 0.5
mayor el ndice
0.4
8, 0.5
de mortalidad.
Correlacin
0.2 3, 0.2
0
0 5 10 15 20 25 30
N de CIGARRILLOS POR DA positiva.
Comparando dos variables cuantitativas: N de
horas de estudios y N horas de ver televisin
N de horas de estudio 1 2 3 4 5
N de horas de televisin 5 4 3 3 1
6
CORRELACIN NEGATIVA INTERPRETACIN:
A mayor N
N DE HORAS DE VER TELEVISIN
5 1, 5
4 2, 4
horas de estudio,
3 3, 3 4, 3
2
menor N de ver
1 5, 1 televisin
0
0 1 2 3 4 5 6 Correlacin
N DE HORAS DE ESTUDIO Negativa.
EJEMPLON4: Dos variables cuantitativas
Pares
ordenados DIAGRAMA DE DISPERSIN
(4;5)
(1;2)
(0;2)
.
.
NUBE DE PUNTOS
.
Recuerda: Las grficas para comparar variables.
Barras agrupadas
Comparar dos variables cualitativas.
Comparar una variable cuantitativa y
otra cualitativa. (mixtas).
Diagrama de dispersin
Cuando comparamos dos variables
cuantitativas.
Series de tiempo.
Comparamos dos variables que
involucre el tiempo.
GRFICOS ESTADSTICOS
Carl Friedrich Gauss
(1777-1855)
PROPSITO DE CLASE
Diferencia un cuadro estadstico de un
grfico estadstico.
Identifica los grficos estadsticos.
Construye grficos estadsticos y analiza e
interpreta los resultados.
Valora la utilidad de los grficos estadsticos
para la organizacin de datos y la
informacin que estas brindan.
Cuadro Estadstico
COMPONENTES DE UN CUADRO
cundo?, y dnde se hicieron las observaciones?.
El cuerpo
El cuadro en s, donde debe considerar el o los tipos de variables a relacionar, el
pblico a quien va dirigido y presentarse las frecuencias que sean ms necesarias.
Fuente
Corresponde al rea de la empresa o institucin responsable de la elaboracin de
la informacin.
Notas Explicativas
En ella se presentan aclaraciones respecto a la informacin que se est
presentando. Este componente es opcional..
Ejemplo
Qu
grfico
elegir?
GRFICO ESTADSTICO
Una grfica o diagrama estadstico es un dibujo complementario a una tabla o cuadro, que permite
observar las tendencias de un fenmeno en estudio y facilita el anlisis estadstico de las variables ah
relacionadas.
Componentes
Un histograma es una grfica adecuada para representar variables continuas, aunque tambin
se puede usar para variables discretas. Es decir, mediante un histograma se puede mostrar
grficamente la distribucin de una variable cuantitativa o numrica.
Los datos se deben agrupar en intervalos de igual tamao, llamados clases. Para
construir el polgono de frecuencia se toma la marca de clase que coincide con el punto
medio de cada rectngulo.
Ejemplo:
Es una grfica que se elabora con los valores de las frecuencias acumulados (menor
que y mayor que) y los lmites de las clases de una distribucin de frecuencia.
La ojiva es una representacin grfica que consiste en una lnea, que puede ser
ascendente o descendente y se utiliza para representar las distribuciones de frecuencias
acumuladas menor que y mayor que, segn los datos utilizados.
En los estudios de anlisis estadsticos la ojiva es de gran utilidad porque permite obtener con gran
aproximacin cierta informacin requerida, en un momento determinado.
Ejemplo:
Ejemplo:
7. Tallo y Hojas
El diagrama de Tallo y hojas permite obtener simultneamente una distribucin de frecuencias de la variable y su
representacin grfica. Para construirlo basta separar en cada dato el ltimo dgito de la derecha (que constituye la hoja) del
bloque de cifras restantes (que formar el tallo).
Esta representacin de los datos es semejante a la de un histograma pero adems de ser fciles de elaborar, presentan ms
informacin que estos.
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
El diagrama de Pareto es una representacin grfica que permite identificar y seleccionar los
aspectos prioritarios que hay que tratar en un determinado problema. Tambin se conoce como
diagrama ABC o Ley de las prioridades 20-80, que dice: el 80% de los problemas que ocurren en
cualquier actividad son ocasionados por el 20% de los elementos que intervienen en producirlos.
Sirve para conseguir el mayor nivel de mejora con el menor esfuerzo posible. El objetivo de esta
representacin es clasificar dichos elementos es en dos grupos: los pocos vitales y los muchos
triviales.
Los pasos para la elaboracin del diagrama de Pareto son:
a. Construya una tabla de distribucin de frecuencias ordenando las categoras en forma
descendente respecto a la frecuencia.
b. La categora Otros deber ser colocada en la ltima posicin, no importa cun grande sea,
porque est compuesta de un grupo de categoras cuyas frecuencias son menores en relacin al
valor de la variable con frecuencia ms pequea listado individualmente.
c. Agregue a la tabla de distribucin de frecuencias una columna para las frecuencias acumuladas
absolutas F.
d. Elabore un diagrama de barras y agregue la lnea de frecuencias acumuladas relativas Hi.
Ejemplo:
Para crear un diagrama de Pareto debemos preparar los datos. Posteriormente insertar una
grfica de columnas seleccionando toda la tabla de datos.
Ahora debemos convertir el grfico del porcentaje acumulado en un grfico de lnea. Tambin
debemos agregar el eje secundario. Para ello se selecciona la grfica de lnea y en las opciones de
Formato elige trazar el eje secundario. As mismo tenemos un diagrama de Pareto bsico;
podemos terminar dndole algn formato especial y de manera opcional agregar una lnea que
muestre una constante del 80%
Distintos diagramas de dispersin