Professional Documents
Culture Documents
http://reyesestadistica.blogspot.com.co/2011/07/estadistica-inferencial-con-microsoft.html
1. INTRODUCCION:
La inferencia es la rama de la estadstica que se dedica a elaborar conclusiones vlidas para toda
una poblacin, a partir de un conjunto de datos, que generalmente son solamente una fraccin del
total de datos (muestra).
Existe una variedad de tcnicas para elaborar dichas conclusiones, las que dependen bsicamente
de tres cosas:
a) La naturaleza de los datos (cuantitativos, cualitativos)
b) La cantidad de datos
c) La naturaleza de la comparacin realizada
Microsoft Excel es una herramienta ampliamente utilizada en la sociedad actual, sin embargo se
desconocen muchas de sus capacidades de clculo en diferentes reas. El objetivo de este curso
corto es dar a conocer las aplicaciones de Excel en la inferencia estadstica, que estn disponibles
para el usuario.
2.
POBLACIN: Es un conjunto, cuyos elementos poseen caractersticas comunes, las cuales son
del inters del investigador, y que pueden ser observadas (medidas)
La estadstica como ciencia se dedica al estudio de las poblaciones. Sin embargo en la mayora de
situaciones no es posible estudiar a la poblacin completa. La solucin es estudiar una fraccin de
la poblacin (muestra) y elaborar conclusiones para toda la poblacin a partir de dichos datos.
MUESTRA: Es una fraccin de la poblacin extrada para el estudio de la misma. Para que los
resultados sean vlidos, es necesario que la muestra sea REPRESENTATIVA de la poblacin de
donde proviene. Para ello, debe reunir los siguientes requisitos
a) Debe extraerse al azar
b) Debe generar suficiente varianza
c) Debe tener un tamao apropiado
NIVEL DE CONFIANZA: Debido a que la mayora de veces se trabaja con muestras, siempre
existir la posibilidad de cometer errores al momento de elaborar una inferencia. Para enfrentar
esta situacin, se define una probabilidad de xito llamada Nivel de confianza. Debido a
costumbres que han ido quedando, se trabaja con un nivel de confianza del 95%, sin embargo el
investigador tiene el derecho de escoger otro nivel a su gusto o conveniencia.
NIVEL DE SIGNIFICANCIA: Es el complemento del nivel de confianza. Usualmente se representa
con la letra griega alfa (). Corresponde a la probabilidad de fracaso.
HIPTESIS
Cualquier suposicin preliminar acerca de cualquier fenmeno. En el caso de la estadstica, la
suposicin se realiza sobre los parmetros de una poblacin. Bsicamente existen dos tipos de
hiptesis: la Nula (Ho), que se plantea con la intencin de ser rechazada, y la alterna (Ha) que se
plantea con la intencin de ser aceptada.
El procedimiento para una prueba de hiptesis, incluye las siguientes etapas:
a) Planteamiento de las hiptesis
b) Clculo de un estadstico de prueba (Z, t, F, o Chi cuadrado)
Anlisis de Datos
El rango de entrada puede tener una o ms variables, las cuales pueden estar ordenadas por filas
o por columnas. Se debe definir esto activando el indicador respectivo. Si en la primera fila o
columna hay nombres de variables, se debe activar la opcin Rtulos en la primera fila
Los resultados se pueden mostrar en una hoja nueva, un libro nuevo, pero usualmente es en la
misma hoja, para lo cual se debe definir el lugar .
Si se desea un detalle de las estadsticas ms importantes se marca la casilla Resumen de
Estadsticas.
Si se desea un intervalo de confianza para la media, debe marcarse la casilla y definirse un nivel
de confianza.
Se pueden obtener los nmeros mayor y menor del conjunto o bien los segundos, terceros, etc,
para lo cual se marcan las casillas y se indica el orden (1,2,3)
EJERCICIO:
Para el siguiente conjunto de datos, calcule las estadsticas ms importantes y un intervalo de
confianza al 97%
15 9 20 11 18 12 14 19 22 18 17 19 14 12 10 10 18 10 15
SECCION
A
B
1
62
33
2
48
38
3
55
15
4
33
39
5
65
57
6
46
45
7
70
38
8
55
40
9
40
42
10
49
55
SECCION
A
B
1
62
33
2
48
38
3
55
15
4
33
39
5
65
57
6
46
45
7
70
38
8
55
40
9
40
42
Pruebe la hiptesis que los alumnos de la seccin A tienen mayor promedio que los de la seccin
B , con un 97% de confianza.
10
49
55
Ejemplo: Se desea probar si hay diferencia entre los salarios diarios de los empleados de dos
diferentes empresas. Los resultados del muestreo son los siguientes.
POBLACION 1
Empresa1
35
0
Empresa 2
37
0
2
41
9
42
5
3
385
4
360
5
405
6
395
7
389
8
409
9
375
369
375
389
385
395
425
400
Ejercicio: con los datos del archivo nuevo compruebe si las notas de los graduados de
establecimientos pblicos son iguales que las de graduados de establecimientos privados.
ORIGEN
JAPONES
COREANO
1
66
61
2
67
69
3
68
66
4
66
59
5
67
60
6
67
62
7
68
69
8
65
63
9
68
65
En este caso se trata de dos poblaciones que de alguna manera estn correlacionadas, por
ejemplo Antes/despus. El nmero de datos es el mismo para cada poblacin porque hay una
correspondencia de uno a uno entre los mismos. Se aplica una prueba de t de student .
Ejemplo
Un investigador compara las calificaciones de diez estudiantes antes y despus de tomar una
pastilla a base de Ginko biloba (que se supone mejora la inteligencia). En base a los resultados
indique con un 97% de confianza si se produce un aumento de 10 puntos en los resultados, si se
usan las cpsulas.
JUAN PEDRO CARLOS ESTELA MARTIN JUANY KARLA JOSE MANUEL STEFANI
ANTES
45
DESPUES 48
52
55
61
59
33
33
49
54
75
80
64
64
39
39
54
53
Ejercicio: con los datos del archivo nuevos compruebe si las notas de lgebra son iguales a las
notas de fsica .
9.
Anlisis de varianza de un factor (completamente al azar)
Excel puede realizar anlisis de varianza para diseo al completo azar, ya sea balanceado (iguales
repeticiones por tratamiento) o desbalanceado (desiguales repeticiones por tratamiento). En el
men de anlisis de datos se escoge la opcin Anlisis de Varianza de un factor.
Ejemplo No. 1: Diseo balanceado
En el centro de investigacin de los Hombres de Negro, se ensayan nuevas armas para atacar a
una especie extraterrestre de plantas mutantes. El producto usado hasta la fecha es Alien X. Se
aplicaron a especimenes dosis de los productos y se midi la variable respuesta: porcentaje de
destruccin de tejidos. Los resultados finales fueron:
X-1 45
M6 42
ALIEN X 65
M6 44
L4 82
X-1 52
ALIEN X 60
L4 86
60
68
L4 88
X-1 50
ALIEN X 62
M6 42
M6 42
L4 88
X-1 61
ALIEN X 65
X1
ALIEN X
L4
M6
52
60
86
44
45
65
82
42
61
62
88
42
50
65
88
42
Datos
II
III
IV
A CONTROL
3.96
6.24
5.42
11.11
B 1PPM
27.31 26.96
32.21
30.13
C 2PPM
35.30 34.71
Perdido
38.38
D 3PPM
41.09 43.99
48.70
41.78
E 4PPM
48.90 47.61
50.38
Perdido
Sillones/operador
1
2
3
4
JOSE
15
12
18
10
CARLOS
9
14
17
10
XIMENA
20
25
19
18
KARLA
11
19
14
10
MANUEL
18
22
12
15
Anlisis de Regresin
Excel puede realizar anlisis de regresin para modelos simples y mltiples, El mdulo de anlisis
tiene una opcin para regresin:
Se debe definir el rango que contiene los datos de la variable dependiente (y)
En el rango de x, si el modelo es mltiple se ingresan varias columnas segn la cantidad de
variables independientes.
Ejemplo:
Los siguientes datos muestran el crecimiento poblacional de una aldea del interior del pas:
ao
1900
1925
1950
1975
2000
habitantes
300
750
1500
4000
7500
efecte el ajuste del modelo lineal y estime que poblacin habr en la aldea para el ao 2012