You are on page 1of 92

ESTADSTICA

Jorge Ulises Camacho Livano

La palabra viene del latn statisticus que significa del


estado

Por mucho tiempo, la palabra estadstica se refera a


informacin numrica sobre los estados o territorios
polticos.

John Graunt (1620-1674) fue el primero en publicar sobre


el anlisis estadstico y su trabajo llev al desarrollo de las
ciencias actuariales utilizadas por las compaas de
seguros; estudiaba los expedientes de los nacimientos y
muertes descubri que nacan ms nios que nias, pero
tambin encontr que por estar los hombres ms
expuestos a accidentes ocupacionales , a enfermedades y
la guerra, el nmero de hombres y mujeres en la edad de
casarse era ms o menos la misma.

INTRODUCCIN
2

Es una coleccin de mtodos para planificar y


realizar experimentos, obtener datos y luego
analizar, interpretar, y formular una conclusin
basada en esos datos.

La estadstica se puede definir como la ciencia


que recopila, organiza, analiza e interpreta la
informacin numrica o cualitativa, mejor
conocida como datos, de manera que pueda
llevar a conclusiones vlidas.

QU ES?
3

La estadstica descriptiva es la ciencia que recopila,


organiza e interpreta la informacin numrica cualitativa.
Los peridicos, revistas, radio y televisin usan la
estadstica descriptiva para informar y persuadirnos acerca
de ciertas acciones a tomar y en la formacin de opiniones.

La estadstica inferencial es la ciencia que interpreta


informacin de manera que pueda llevar a conclusiones
vlidas. Los gobiernos y las organizaciones utilizan la
estadstica para tomar decisiones que afectan directamente
nuestras vidas.

Elemento es cada unidad utilizada para un


estudio estadstico.

Por ejemplo, el conjunto de los datos 3, 5, 5, 3,


7, 2, 4, 1 contiene 8 elementos.

Poblacin es la totalidad de los elementos del


grupo particular que se estudia.

Por ejemplo una empresa que est llevando a


cabo un estudio a todos los 350 empleados de
la empresa; la poblacin es todos los
empleados de la empresa.

ELEMENTO, POBLACIN,
MUESTRA
6

Una muestra es un subconjunto de una


poblacin.

Una muestra es representativa de la poblacin


si al escogerla cada elemento tiene la misma
probabilidad de salir o de ser escogido.

Por ejemplo, la empresa del ejemplo anterior


escoger 100 empleados de los 350 para
hacerles un estudio.

MEDIDAS DE TENDENCIA
CENTRAL
8

La media es la suma de los valores de los


elementos dividida por la cantidad de stos. Es
conocida tambin como promedio, o media
aritmtica.
Frmula de la media:

Media Poblacional =

= sumatoria
= media
N = nmero de
elementos
X = valores o datos

MEDIA, MEDIANA, MODA


9

Esta frmula se lee:

mu es igual a la sumatoria de x dividido entre N

Media Muestral:

Ejemplo: Calcular la media de los siguientes nmeros:

10 , 11 , 12 , 12 , 13

1. Sumar las cantidades < 10 + 11 + 12 + 12 + 13 =


58>

2. Dividir la suma por la cantidad de elementos < 58/5>

3. El resultado es la media <11.6>

MEDIA
10

La mediana es el valor del elemento


intermedio cuando todos los elementos se
ordenan.

Frmula de la mediana:
La parte de [n/2 + 1/2]
representa la posicin

Mediana = X[n/2 +1/2]

Donde X es la posicin de los nmeros y n es el


nmero de elementos.

MEDIANA
11

Ejemplo: Buscar la mediana de los siguientes nmeros:


2413563

Primero, hay que ordenarlos:


1

2 3 3 4 5

X1 X2 X3 X4 X5 X6 X7 ( Las posiciones de los nmeros)

Mediana = X[7/2 + ]

X[3.5 + .5] < Se cambi el a .5>

X4 < La mediana est en la posicin 4>

Por lo tanto, la mediana es 3.

MEDIANA
12

Nota: Si el nmero de elementos es impar, la


mediana es el nmero del elemento
intermedio. Si el nmero de elementos es par,
hay que utilizar los dos nmeros intermedios.

10 , 11 , 12 , 13 , 14 , 15 , 16, 18

Ahora, para buscar la mediana:

1. Sumar ambos nmeros. <13 + 14 = 27>

2. Dividirlo entre 2. < 27/2 = 13.5>

3. El resultado es la mediana. < 13.5>

MEDIANA
13

La moda es el valor que se presenta el mayor


nmero de veces.

Ejemplo 1: Buscar la moda de:

5 12 9 5 8 7 1

Como la moda es el nmero que ms se repite,


la moda es 5.

MODA
14

Ejemplo 2: Buscar la moda de :

23 35 45 33 47 31 29 22

Como ningn nmero se repite, no tiene moda.

MODA
15

PRUEBAS ESTADISTICAS

16

Se llaman as porque su clculo implica una estimacin de


los parmetros de la poblacin con base en muestras
estadsticas. Mientras ms grande sea la muestra ms exacta
ser la estimacin, mientras ms pequea, ms distorsionada
ser la media de las muestras por los valores raros extremos.

PRUEBAS PARAMTRICAS
17

VENTAJAS DE LAS PRUEBAS


PARAMTRICAS

Tienen mas poder de contraste


Ms poder de eficiencia.
Ms sensibles a los rasgos de los datos recolectados.
Menos posibilidad de errores.
Completas (dan estimaciones probabilsticas bastante
exactas).

18

Coeficiente de Correlacin de Pearson y la regresin


lineal

Prueba t de student

Prueba de contraste de la diferencia de proporciones

Anlisis de varianza unidireccional (ANOVA Oneway)

Anlisis de varianza factorial (ANOVA)

Anlisis de covarianza (ANCOVA)

CULES SON LOS MTODOS O


PRUEBAS ESTADSTICAS
PARAMTRICAS MS UTILIZADAS?

19

TIPOS DE PRUEBAS
Prueba t (student): Es una prueba parametrica
que es utilizada para comparar las medias de dos
grupos independientes. Nos permite establecer
diferencias estadsticamente significativas entre
las medias de dos grupos.
Para esto se ve el valor de p o de significancia
estadstica debe ser mayor que 0.05.

20

Que es el nivel de significancia?


La probabilidad de que un evento ocurra oscila entre 0 y 1,
donde:
0= significa la imposibilidad de ocurrencia

1=la certeza de que ocurra el fenmeno

21

Anova:
Es una prueba estadstica para analizar si dos o
mas grupos difieren significativamente entre si,
en cuanto a sus medias y varianzas.Se utiliza
para la comparacin de medias de 2 o mas
grupos.

22

PRUEBAS NO PARAMTRICAS
Se denominan pruebas no paramtricas aquellas
que no presuponen una distribucin de
probabilidad para los datos, por ello se conocen
tambin como de distribucin libre (distribution
free).

23

CULES SON LOS MTODOS O


PRUEBAS ESTADSTICAS NO
PARAMTRICAS MS UTILIZADAS?

La Ji cuadrada o Chi cuadradra

Prueba de Wilcoxon para contrastar datos pareados.

Prueba de Mann-Whitney para muestras independientes

Prueba de Kruskal-Wallis para comparar K muestras

Prueba de Friedman para comparar K muestras pareadas


(bloques)

Coeficiente de correlacin de Spearman para rangos

Prueba de rachas de Wald-Wolfowitz

24

QU ES LA JI CUADRADA O CHI
CUADRADO?

Definicin:
Es una prueba estadstica para evaluar la hiptesis acerca de
la relacin entre dos variables categricas
Se simboliza por x2
Hiptesis a probar: Correlacionales
Variables Involucradas: Dos
Nivel de medicin de las variables :
Nominal u ordinal (o intervalos o razn reducida a ordinales)
La Chi cuadrada se calcula a travs de una tabla de
contingencia o tabulacin cruzada, de dos dimensiones y
cada una representa una variable.
25

NULA (H0): Es aquella en la que se asegura


que los dos parmetros analizados son
independientes uno del otro.

ALTERNATIVA (H1): Es aquella en la que se


asegura que los dos parmetros analizados s
son dependientes.

TIPOS DE HIPOTESIS
26

T DE STUDENT, ANOVA
Y CHI CUADRADA
27

Distribucin t de Student

HISTORIA

La distribucin de Student fue descrita en 1908 por William


Sealy Gosset. Gosset trabajaba en una fbrica de cerveza,
Guinness, que prohiba a sus empleados la publicacin de
artculos cientficos debido a una difusin previa de secretos
industriales. De ah que Gosset publicase sus resultados bajo el
seudnimo de Student.

28

Distribucin t de Student

HISTORIA

R.A.
Fisher
quien
apreci
la
importancia de los trabajos de Gosset
sobre muestras pequeas, tras recibir
correspondencia de Gosset en la que
le deca le envo una copia de las
Tablas de Student, ya que es la nica
persona que probablemente las use
jams!
La
estadstica
de
Gosset
era
z=t/(n-1). Fisher introdujo la
forma t debido a que se ajustaba a su
teora de grados de libertad Fisher es
responsable tambin de la aplicacin
de la distribucin t a la regresin.

29

Distribucin t de Student

DEFINICIN
En probabilidad y estadstica
la distribucin t de student
es
una
distribucin
de
probabilidad que surge del
problema de estimar la
media de una poblacin
normalmente
distribuida
cuando el tamao de la
muestra es pequea

30

DEFINICIN
Se utiliza para hacer estimaciones de parmetros
de las poblaciones a partir de los valores de los
estadsticos correspondientes en las muestras,
cuando se desconoce el valor de la varianza o la
desviacin estndar de la poblacin.

31

Propiedades

o 1. cada curva t tiene forma de campana con centro en 0.


o Cada curva t, es mas dispersa que la curva normal estndar.
o A medida de que aumenta, la dispersin de la curva t

correspondiente disminuye.
o a medida de que k tiende a infinito, la secuencia de curvas t se
aproxima a la curva normal estndar.

32

ERROR ESTNDAR
Cuando la desviacin estndar del estadstico se estima a
partir de datos, el resultado se llama error estndar del
estadstico. El error estndar se calcula usando la formula:

33

Cuando conocemos el valor de la desviacin estndar ,


basamos los intervalos de confianza y las pruebas para
la media en ele estadstico z de una muestra.
o

T= media muestra-media/ desviacin estndar/ raz n

34

GRADOS DE LIBERTAD
o Representan el nmero de datos independientes que se

pueden tomar de la poblacin para construir la muestra,


de tal manera que los valores de los estadsticos en la
muestra sean cercanos a los valores de los parmetros
correspondientes en la poblacin.
o Al escoger una muestra de tamao n, el numero de datos
independientes que se pueden tomar es n-1, ya que el
ultimo dato que se escoja, es el que viene a definir el valor
del estadstico en la muestra gl=n-1

35

REPRESENTACIN GRAFICA

36

REPRESENTACIN GRAFICA

37

ANOVA

38

En estadstica, el anlisis de la varianza (ANOVA,


ANalysis Of VAriance, segn terminologa inglesa) es una
coleccin de modelos estadsticos y sus procedimientos
asociados, en el cual la varianza est particionada en
ciertos componentes debidos a diferentes factores
(variables).

Es una prueba estadstica para analizar si dos o mas


grupos difieren significativamente entre si, en cuanto a
sus medias y varianzas.Se utiliza para la comparacin de
medias de 2 o mas grupos.

QU ES EL ANLISIS DE
VARIANZA?
39

Las tcnicas iniciales del anlisis de


varianza fueron desarrolladas por el
estadstico y genetista R. A. Fisher en los
aos 1920 y 1930 y es algunas veces
conocido como "Anova de Fisher" o
"anlisis de varianza de Fisher", debido al
uso de la distribucin F de Fisher como
parte del contraste de hiptesis.

CMO SURGE ANOVA?


40

El anlisis de varianza lo vamos a


utilizar
para
verificar
si
hay
diferencias
estadsticamente
significativas entre medias cuando
tenemos ms de dos muestras o
grupos en el mismo planteamiento.

PARA QU HACER UN ANOVA?


41

Su verdadero objetivo no es
la variabilidad, sino otros
contrastes, como la igualdad
de medias o el ajuste en un
problema de Regresin.

PARA QU HACER UN ANOVA?


42

43

44

45

46

47

DESVIACION ESTANDAR

48

49

50

51

52

53

54

55

56

57

58

59

CONTROL DE PESO CON 3 DIETAS

60

61

62

63

64

65

66

67

68

69

70

71

72

CHI CUADRADA

73

PRUEBA CHI-CUADRADO
2

Chi-Cuadrado ( ) es el nombre de una prueba de hiptesis


que determina si dos variables estn relacionadas o no.

Pasos:
1)

Realizar una conjetura.

2)

Escribir la hiptesis nula2y la alternativa.

3)

Calcular el valor de

4)

Determinar el valor de p y el grado de libertad.

5)

Obtener el valor crtico.

6)

Realizar una comparacin entre el chi-cuadrado calculado y el


valor crtico.

7)

Interpretar la comparacin.

calc
.

74

Es la tabla que contiene los datos obtenidos


contados y organizados.

Ejemplo:

USO DE CINTURN DE
SEGURIDAD
GNERO

NO

FEMENINO

50

25

MASCULINO

40

45

TABLA DE CONTINGENCIA
75

NULA (H0): Es aquella en la que se asegura


que los dos parmetros analizados son
independientes uno del otro.

ALTERNATIVA (H1): Es aquella en la que se


asegura que los dos parmetros analizados s
son dependientes.

FORMULACIN DE HIPTESIS
76

Melissa conjetura que el uso de cinturn de


seguridad,
en
los
conductores,
est
relacionado con el gnero.

H0: El uso del cinturn de seguridad es


independiente del gnero.

H1: El uso del cinturn de seguridad no es


independiente del gnero.

EJEMPLO
77

Para calcular todos y cada uno de los valores de la tabla de


frecuencias esperadas se realiza:

Total Columna Para dicha celda gTotal Fila Para dicha celda

SumaTotal

TABLA DE FRECUENCIAS
ESPERADAS
78

REALIZAR UNA TABLA CON LOS VALORES DE LA TABLA DE


CONTINGENCIA Y AADIR UNA FILA EN LA PARTE INFERIOR Y
UNA COLUMNA EN LA PARTE DERECHA.

50

25

40

45

79

REALIZAR LAS SUMAS POR FILAS, POR COLUMNAS Y LA SUMA TOTAL

FRECUENCIAS
DE
VALORES
OBSERVADOS

50

25

75

40

45

85
SUMA DE FILAS

90

SUMA DE COLUMNAS

70

160

SUMA TOTAL

80

Usar la frmula para obtener las frecuencias esperadas.

90 75
160

42.187 32.812
5
5

70 75
160

90 85
160

47.812 37.187
5
5

70 85
160

FRECUENCIAS
ESPERADOS

DE

VALORES

81

Para obtener el valor de


Calculado se tiene la frmula

2
calc

f0 fe

Chi-Cuadrado

fe

f0 : Frecuencia del valor observado.


fe : Frecuencia del valor esperado.

CHI CUADRADO CALCULADO


82

EJEMPLO
TABLA DE VALORES OBSERVADOS TABLA DE VALORES ESPERADOS

50
40
2
calc

2
calc

f0 fe
fe

25

42.187 32.812
5
5

45

47.812 37.187
5
5

2
2
2
2
50 42.1875
25 32.8125
40 47.8125
45 37.1875

42.1875

32.8125

47.8125

2
calc
1.4468 1.8601 1.2766 1.6413 6.2248

37.1875

83

Para calcular el grado de libertad (v) se realiza:

v Cantidad de filas 1 Cantidad de columnas 1

GRADO DE LIBERTAD V
84

EJEMPLO
TABLA DE VALORES OBSERVADOS

50

25

40

45

v 2 1 2 1
v 1 1 1

85

NIVEL DE SIGNIFICANCIA

Es el error que se puede cometer al rechazar la hiptesis


nula siendo verdadera.

Por lo general se trabaja con un nivel de significancia de


0.05, que indica que hay una probabilidad del 0.95 de que
la hiptesis nula sea verdadera.

86

EJEMPLO

Melissa conjetura que el uso de cinturn de seguridad,


en los conductores, est relacionado con el gnero. Los
datos se muestran en la tabla inferior. Melissa realiza
la prueba de su conjetura usando chi-cuadrado con un
nivel de significancia del 1%.
USO DE CINTURN DE
SEGURIDAD

GNERO

NO

FEMENINO

50

25

MASCULINO

40

45

Entonces se tiene un nivel de significancia del 0.01.

87

Para calcular el valor de p se realiza:

p 1 Nivel de significancia

Ejemplo:

p 1 0.01 0.99

VALOR DEL PARMETRO P


88

TABLA PARA VALORES DE CHICUADRADO CRTICO

89

EJEMPLO

90

COMPARACIN ENTRE LOS VALORES


DEL CHI-CUADRADO CALCULADO Y EL
CRTICO

Si el valor del chi-cuadrado calculado es menor o igual que


el chi-cuadrado crtico entonces se acepta la hiptesis nula,
caso contrario no se la acepta.

Ejemplo:

2
calc
Valor crtico
6.2248 6.635
Entonces se acepta la hiptesis nula, la cual es El uso del
cinturn de seguridad es independiente del gnero.

91

MUCHAS GRACIAS

92

You might also like