Professional Documents
Culture Documents
1
Inferencia Estadística
¿Qué es estadística?
2
Inferencia Estadística
¿Qué es estadística?
• La ciencia utiliza modelos para describir
fenómenos.
3
Inferencia Estadística
¿Qué es estadística?
• La ciencia utiliza modelos para describir
fenómenos.
• Un modelo es una explicación teórica del
fenómeno objeto de estudio. Esta explicación
suele expresarse en forma verbal, muchas
veces mediante ecuaciones matemáticas.
4
Inferencia Estadística
¿Qué es estadística?
• La ciencia utiliza modelos para describir
fenómenos.
• Un modelo es una explicación teórica del
fenómeno objeto de estudio. Esta explicación
suele expresarse en forma verbal, muchas
veces mediante ecuaciones matemáticas.
• Existen modelos determinísticos y modelos
no determinísticos.
5
Inferencia Estadística
¿Qué es estadística?
• Modelo determinístico:
6
Inferencia Estadística
¿Qué es estadística?
• Modelo determinístico: Es posible conocer un
valor preciso de la variable de interés a partir
de otras.
7
Inferencia Estadística
¿Qué es estadística?
• Modelo determinístico: Es posible conocer un
valor preciso de la variable de interés a partir
de otras.
• Modelo no determinístico:
8
Inferencia Estadística
¿Qué es estadística?
• Modelo determinístico: Es posible conocer un
valor preciso de la variable de interés a partir
de otras.
• Modelo no determinístico: No es posible
determinar un valor preciso de la variable de
interés pues está presente la incertidumbre.
9
Inferencia Estadística
No determinísticos
10
Inferencia Estadística
No determinísticos
11
Inferencia Estadística
No determinísticos
12
Inferencia Estadística
No determinísticos
13
Inferencia Estadística
¿Qué es estadística?
La Estadística nos enseña cómo realizar juicios
inteligentes y tomar decisiones en presencia de
incertidumbre.
¿Qué es estadística?
Asociado a modelos no determinísticos está el
concepto de probabilidad.
15
Inferencia Estadística
¿Qué es estadística?
Estadística Descriptiva:
Técnicas para describir o representar conjuntos
de datos (gráficos y cálculo de medidas
numéricas).
16
Inferencia Estadística
¿Qué es estadística?
Estadística Descriptiva:
Técnicas para describir o representar conjuntos
de datos (gráficos y cálculo de medidas
numéricas).
Estadística Inferencial:
Métodos para derivar conclusiones acerca de
un gran grupo de objetos al observar una parte
de ellos.
17
Inferencia Estadística
Población y muestra
POBLACIÓN:
18
Inferencia Estadística
Población y muestra
POBLACIÓN:
19
Inferencia Estadística
Población y muestra
MUESTRA:
20
Inferencia Estadística
Población y muestra
MUESTRA:
21
Inferencia Estadística
Población y muestra
MUESTRA:
23
Inferencia Estadística
24
Inferencia Estadística
25
Inferencia Estadística
26
Inferencia Estadística
27
Inferencia Estadística
28
Inferencia Estadística
29
Inferencia Estadística
30
Inferencia Estadística
31
Inferencia Estadística
32
Inferencia Estadística
33
Inferencia Estadística
35
Inferencia Estadística
36
Inferencia Estadística
37
Inferencia Estadística
38
Inferencia Estadística
Parámetro y estadístico
39
Inferencia Estadística
Parámetro y estadístico
PARAMETRO: Son las medidas o datos que se obtienen sobre la
población.
40
Inferencia Estadística
Parámetro y estadístico
PARAMETRO: Son las medidas o datos que se obtienen sobre la
población.
41
Inferencia Estadística
Parámetro y estadístico
PARAMETRO: Son las medidas o datos que se obtienen sobre la
población.
42
Inferencia Estadística
Tipos de muestreo
• PROBABILISTICO
• NO PROBABILISTICO
43
Inferencia Estadística
Muestreo probabilístico
44
Inferencia Estadística
Muestreo probabilístico
Los métodos de muestreo probabilístico son aquellos que se basan en el
principio de equiprobabilidad.
45
Inferencia Estadística
Muestreo probabilístico
Los métodos de muestreo probabilístico son aquellos que se basan en el
principio de equiprobabilidad.
46
Inferencia Estadística
Muestreo probabilístico
Los métodos de muestreo probabilístico son aquellos que se basan en el
principio de equiprobabilidad.
47
Inferencia Estadística
Muestreo no probabilístico
A veces, para estudios exploratorios, el muestreo probabilístico resulta
excesivamente costoso y se acude a métodos no probabilístico, aun
siendo conscientes de que no sirven para realizar generalizaciones, pues
no se tiene certeza de que la muestra extraída sea representativa, ya que
no todos los sujetos de la población tienen la misma probabilidad de se
elegidos.
48
Inferencia Estadística
Muestreo no probabilístico
A veces, para estudios exploratorios, el muestreo probabilístico resulta
excesivamente costoso y se acude a métodos no probabilístico, aun
siendo conscientes de que no sirven para realizar generalizaciones, pues
no se tiene certeza de que la muestra extraída sea representativa, ya que
no todos los sujetos de la población tienen la misma probabilidad de se
elegidos.
49
Inferencia Estadística
50
Inferencia Estadística
• BOLA DE NIEVE
51
Inferencia Estadística
EJERCICIO 1
Decida, para cada uno de los problemas siguientes, si es apropiado un estudio
estadístico o no. En caso afirmativo explique la razón de su respuesta e
identifique la población:
52
Inferencia Estadística
EJERCICIO 1
Decida, para cada uno de los problemas siguientes, si es apropiado un estudio
estadístico o no. En caso afirmativo explique la razón de su respuesta e
identifique la población:
1. Se investigará la opinión de 50000 trabajadores que se verán afectados por
el cambio de la jornada laboral tradicional, de ocho horas diarias durante
cinco días a la semana, a la de diez horas diarias por espacio de cuatro días
a la semana.
53
Inferencia Estadística
EJERCICIO 1
Decida, para cada uno de los problemas siguientes, si es apropiado un estudio
estadístico o no. En caso afirmativo explique la razón de su respuesta e
identifique la población:
1. Se investigará la opinión de 50000 trabajadores que se verán afectados por
el cambio de la jornada laboral tradicional, de ocho horas diarias durante
cinco días a la semana, a la de diez horas diarias por espacio de cuatro días
a la semana.
2. Un despacho de arquitectos debe presentar una cotización para un proyecto
de cableado. Están disponibles siete contratistas eléctricos para la tarea. Se
pretende determinar el costo promedio estimado del proyecto y el tiempo
promedio proyectado que se requeriría para que cualquiera de los
contratistas realice el proyecto.
54
Inferencia Estadística
EJERCICIO 1
Decida, para cada uno de los problemas siguientes, si es apropiado un estudio
estadístico o no. En caso afirmativo explique la razón de su respuesta e
identifique la población:
1. Se investigará la opinión de 50000 trabajadores que se verán afectados por
el cambio de la jornada laboral tradicional, de ocho horas diarias durante
cinco días a la semana, a la de diez horas diarias por espacio de cuatro días
a la semana.
2. Un despacho de arquitectos debe presentar una cotización para un proyecto
de cableado. Están disponibles siete contratistas eléctricos para la tarea. Se
pretende determinar el costo promedio estimado del proyecto y el tiempo
promedio proyectado que se requeriría para que cualquiera de los
contratistas realice el proyecto.
3. Un sistema de cómputo está conectado a cierto número de terminales
distantes. A fin de decidir si se aumenta dicho número o no, es necesario
estudiar la variable aleatoria X, el tiempo por sesión de cada usuario en las
terminales actualmente instaladas.
55
Inferencia Estadística
EJERCICIO 2
Se quiere estimar la cantidad de tiempo promedio que los profesores del INTEC
emplean calificando las tareas de cierta semana.
Describa una forma de obtener
a) Una muestra aleatoria simple
b) Una muestra sistemática
c) Una muestra estratificada
56
Distribuciones muestrales de
medias y de proporciones
57
Inferencia Estadística
Considere la población 1, 3, 5, 7
Considere la población 1, 3, 5, 7
59
Inferencia Estadística
EJERCICIO 1
60
Inferencia Estadística
EJERCICIO 2
62
Estimación
63
Inferencia Estadística
Estimación
64
Inferencia Estadística
Estimación
65
Inferencia Estadística
Estimación
66
Inferencia Estadística
Estimación
67
Inferencia Estadística
Estimación
68
Inferencia Estadística
Estimación
69
Inferencia Estadística
Estimación
Estimación
71
Inferencia Estadística
Estimación
Parámetro Estimador
Ejemplos μ x
σ² s²
σ s
p p
72
Inferencia Estadística
Estimación
73
Inferencia Estadística
Estimación
74
Inferencia Estadística
Estimación
75
Inferencia Estadística
Estimación
76
Inferencia Estadística
Estimación
78
Inferencia Estadística
79
Inferencia Estadística
80
Inferencia Estadística
81
Inferencia Estadística
83
Intervalos de confianza para
la media poblacional
84
Inferencia Estadística
85
Inferencia Estadística
86
Inferencia Estadística
87
Inferencia Estadística
88
Inferencia Estadística
89
Inferencia Estadística
90
Inferencia Estadística
Algunos conceptos
91
Inferencia Estadística
Algunos conceptos
92
Inferencia Estadística
Algunos conceptos
93
Inferencia Estadística
Algunos conceptos
Ejemplo: α = 5% = 0.05
1 – α = 95% = 0.95
94
Inferencia Estadística
95
Inferencia Estadística
97
Inferencia Estadística
σ σ
x - 1.96 ≤ μ ≤ x + 1.96
√n √n
98
Inferencia Estadística
99
Inferencia Estadística
100
Inferencia Estadística
Ejercicio 1
s s
x - 1.96 ≤ μ ≤ x + 1.96
√n √n
102
Inferencia Estadística
Ejercicio 2
104
Inferencia Estadística
p (1-p ) p (1-p )
p - 1.96 ≤ p ≤ p + 1.96
√ n √ n
105
Inferencia Estadística
Ejercicio 1
106
Inferencia Estadística
Ejercicio 2
107
Inferencia Estadística
Ejercicio 3
108
Inferencia Estadística
Ejercicio 4
109
Inferencia Estadística
Ejercicio 5
110
Intervalos de confianza para
la diferencia de medias y la
diferencia de proporciones
111
Inferencia Estadística
112
Inferencia Estadística
2 2
σ1 σ2
( x1 - x2 ) - z + ≤ μ 1 - μ2 ≤
√ n1 n2
2 2
σ1 σ2
( x1 - x2 ) + z +
√ n1 n2
113
Inferencia Estadística
114
Inferencia Estadística
como antes.
115
Inferencia Estadística
Ejercicio 1
116
Inferencia Estadística
117
Inferencia Estadística
Ejercicio 2
119
Inferencia Estadística
Ejercicio 3
120
Inferencia Estadística
Ejercicio 4
121
Inferencia Estadística
Ejercicio 5
En una muestra aleatoria de 300 personas que
comen en una cafetería de una tienda
departamental solo 102 pidieron postre.
Si usamos 102/300 = 0.34 como una estimación de
la verdadera proporción correspondiente, ¿con qué
confianza podemos afirmar que nuestro error es
menor que 0.05?
122
Límites de confianza para la
varianza poblacional y para
el cociente de dos varianzas
123
Inferencia Estadística
124
Inferencia Estadística
126
Inferencia Estadística
Ejercicio 1
127
Inferencia Estadística
128
Inferencia Estadística
2 2
Si s 1 y s 2 son los valores de dos varianzas de
129
Inferencia Estadística
2 2 2
s1 1 σ1 s1
< < Fα , n -1, n -1
2 2 2
s2 F α , n -1, n -1 σ2 s2 2
2 1
1 2
2
130
Inferencia Estadística
Tabla de la distribución F
131
Inferencia Estadística
Ejercicio 2
132
Inferencia Estadística
133
Inferencia Estadística
134
Inferencia Estadística
Ejercicio 3
135
Inferencia Estadística
Ejercicio 4
136
Inferencia Estadística
137
Intervalos de confianza para
muestras pequeñas
138
Inferencia Estadística
Muestras pequeñas
139
Inferencia Estadística
140
Inferencia Estadística
Ejercicio 1
141
Pruebas de hipótesis
142
Inferencia Estadística
143
Inferencia Estadística
144
Inferencia Estadística
145
Inferencia Estadística
146
Inferencia Estadística
Ejemplo
Se quiere probar que los estudiantes de INTEC tienen, en
promedio, más alto IQ que los estudiantes de otra
universidad. Se formula la hipótesis de que no hay
diferencias, es decir, que μ = μ
1 2
147
Inferencia Estadística
148
Inferencia Estadística
Prueba de hipótesis
149
Inferencia Estadística
150
Inferencia Estadística
Realidad
151
Inferencia Estadística
Realidad
Ho es cierta
152
Inferencia Estadística
Realidad
Ho es cierta Ho es falsa
153
Inferencia Estadística
Realidad
Ho es cierta Ho es falsa
Decisión
estadística
154
Inferencia Estadística
Realidad
Ho es cierta Ho es falsa
No rechazar
Ho
Decisión
estadística
155
Inferencia Estadística
Realidad
Ho es cierta Ho es falsa
No rechazar
Ho
Decisión
estadística
Rechazar Ho
156
Inferencia Estadística
Realidad
Ho es cierta Ho es falsa
No rechazar
ok
Ho
Decisión
estadística
Rechazar Ho
157
Inferencia Estadística
Realidad
Ho es cierta Ho es falsa
No rechazar
ok
Ho
Decisión
estadística
Rechazar Ho (error Tipo I)
158
Inferencia Estadística
Realidad
Ho es cierta Ho es falsa
No rechazar
ok (error Tipo II)
Ho
Decisión
estadística
Rechazar Ho (error Tipo I)
159
Inferencia Estadística
Realidad
Ho es cierta Ho es falsa
No rechazar
ok (error Tipo II)
Ho
Decisión
estadística
Rechazar Ho (error Tipo I) ok
160
Inferencia Estadística
Prueba de hipótesis
161
Inferencia Estadística
Prueba de hipótesis
162
Inferencia Estadística
164
Inferencia Estadística
Caso I
H0: μ=μ0
H1: μ≠μ0
σ μ0 σ
μ0 - z μ0 + z
√n √n
165
Inferencia Estadística
Caso II
H0: μ=μ0
H1: μ>μ0
σ μ0 σ
μ0 - μ0 + z
√n √n
166
Inferencia Estadística
Caso III
H0: μ=μ0
H1: μ<μ0
σ μ0 σ
μ0 - z μ0 +
√n √n
167
Inferencia Estadística
X – μ0
el estadístico z =
s
√n
168
Inferencia Estadística
Ejercicio 1
Ejercicio 2
170
Ejercicio 3
Inferencia Estadística
X – μ0
el estadístico t = que tiene una distribución t
s con n-1 grados de libertad
√n
172
Inferencia Estadística
Ejercicio
173
Inferencia Estadística
Ho: μ1 – μ2 = δ
x1 – x2 – δ
z=
2 2
σ1 + σ2
√ n1 n2
175
Inferencia Estadística
x1 – x2 – δ
z=
2 2
s1 + s2
√ n1 n2
176
Inferencia Estadística
Ejercicio
Se hace un experimento para determinar si el contenido promedio de
nicotina de una clase de cigarrillos excede al de otra clase en 0.20
miligramos. Si 50 cigarrillos de la primera clase tuvieron en promedio un
contenido de nicotina de 2.61 miligramos con una desviación estándar
de 0.12 miligramos en tanto que 40 cigarrillos de la otra clase tuvieron
un contenido promedio de nicotina de 2.38 miligramos, con una
desviación estándar de 0.14 miligramos, pruebe la hipótesis nula “el
contenido promedio de nicotina de la primera clase de cigarrillos excede
en 0.20 miligramos al de la segunda” contra la hipótesis alternativa “el
contenido promedio de nicotina de la primera clase de cigarrillos no
excede en 0.20 miligramos al de la segunda”. Considere el nivel de
significación 0.1.
177
Inferencia Estadística
p - p0
z=
p0 (1 – p0)
√ n
178
Inferencia Estadística
Ejercicio
179
Inferencia Estadística
p1 - p2
z=
x1+x2 x1+x2 1 1
1- +
√ n1+n2 n1+n2 n1 n2
es estadístico de prueba.
180
Inferencia Estadística
Ejercicio
181
Inferencia Estadística
(n-1) s²
Usaremos el estadístico χ² =
σ²
0
182
Inferencia Estadística
Distribución
Prueba chi-cuadrado
chi-cuadrado de bondad de
ajuste
183
Inferencia Estadística
184
Inferencia Estadística
Ejercicio
185
Inferencia Estadística
s1²
Usaremos el estadístico
s2²
Ejercicio
187
Ajuste a distribuciones
teóricas.
Tablas de contingencia.
Prueba de chi-cuadrado
188
Inferencia Estadística
189
Inferencia Estadística
191
Inferencia Estadística
192
Estadística No Paramétrica
Ejercicio 1
193
Inferencia Estadística
Prueba de chi-cuadrado
Estadístico de prueba
r c
194
Inferencia Estadística
Prueba de chi-cuadrado
Rechazamos H0 cuando
Χ² ≥ Χ²
α , (r -1)(c -1)
195
Inferencia Estadística
Tabla de contingencia
11 12 13 14 15
r 21 22 23 24 25
31 32 33 34 35
41 42 43 44 45
c 196
Inferencia Estadística
Ejercicio 1
Habilidad en Matemáticas
Bajo Promedio Alto
Interés en Bajo 63 42 15
Estadística Promedio 58 61 31
Alta 14 47 29
197
Inferencia Estadística
Ejercicio 2
199
Inferencia Estadística
Función de potencia
200
Inferencia Estadística
Función de potencia
Recordemos que:
201
Inferencia Estadística
Función de potencia
Recordemos que:
Entonces
1 – β : probabilidad de rechazar H0 siendo falsa
probabilidad de no cometer error de tipo II
202
Inferencia Estadística
Función de potencia
203
Inferencia Estadística
Función de potencia
204
Inferencia Estadística
Función de potencia
Ejemplo
Supongamos que el fabricante de un nuevo medicamento
quiere decidir, sobre la base de muestras, si el 90% de
todos los pacientes que reciben ese nuevo medicamento se
recuperarán de cierta enfermedad.
Su estadístico de prueba es X, el número de éxitos
observados (recuperaciones) en 20 intentos.
Consideremos H0: θ = 0.90
H1: θ < 0.90
Investigue la función de potencia correspondiente al criterio
de prueba “aceptar la hipótesis nula si X>14 y rechazarla si
X≤14”
205
Inferencia Estadística
Función de potencia
Ejemplo
Calculemos las probabilidades α(θ) de rechazar H0 siendo
verdadera.
Si H0 es verdadera, entonces
p(X≤14) = p(X=0) + p(X=1) + p(X=2) + … + p(X=14)
20 a 20-a
Siendo p(X=a) = (0.90) (1 – 0.90)
a
Función de potencia
Ejemplo
Calculemos las probabilidades β(θ) de no rechazar H0
(aceptar H0) siendo H0 falsa (H1 verdadera).
207
Inferencia Estadística
Función de potencia
Ejemplo
Si θ=0.85
p(X>14) = p(X=15) + p(X=16) + p(X=17) + … + p(X=20)
20 a 20-a
Siendo p(X=a) = (0.85) (1 – 0.85)
a
208
Inferencia Estadística
Función de potencia
209
Inferencia Estadística
Función de potencia
π(θ) Curva de potencia
1.0000
0.9000
0.8000
Las funciones de
0.7000
potencia son las
0.6000
probabilidades de
0.5000
tomar la decisión
0.4000
correcta.
0.3000
0.2000
0.1000
0.0000
0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00
θ
210
Inferencia Estadística
1.0000
0.9000
0.8000
0.7000
0.6000
0.5000
0.4000
0.3000
0.2000
0.1000
0.0000
0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00
θ
212
Correlación y regresión lineal
213
Inferencia Estadística
Ejemplos
• ventas potenciales de un nuevo producto en función de
un precio.
• gastos familiares en entretenimiento en función del
ingreso familiar.
• consumo percápita de ciertos alimentos en función de sus
valores nutricionales y la cantidad de dinero que se gasta en
hacerles publicidad en la televisión.
214
Inferencia Estadística
216
Inferencia Estadística
Ejemplo
Horas 4 9 10 14 4 7 12 22 1 17
Nota 31 58 65 73 37 44 60 91 21 84
217
Inferencia Estadística
Ejercicio
218
Inferencia Estadística
Ejercicio
219
Inferencia Estadística
220
Inferencia Estadística
Ejercicio
Una prueba de rendimiento es confiable si el estudiante que tomar la
prueba varias veces obtendrá consistentemente puntuaciones altas
(bajas). Una forma de verificar la confiabilidad de una prueba es dividirla
en dos partes, por lo general problemas con numeración par y
problemas con numeración impar, y observar la correlación entre las
puntuaciones que los estudiantes obtienen. Los datos siguientes son las
calificaciones de una muestra de 20 estudiantes en una prueba, x para
las preguntas impares, y para las preguntas pares. Calcule el valor del
coeficiente de correlación r.
X 27 36 44 32 27 41 38 44 30 27
y 29 44 49 27 35 33 29 40 27 38
X 33 39 38 24 33 32 37 33 34 39
y 42 31 38 22 34 37 38 35 32 43
221
Regresión múltiple
222
Inferencia Estadística
223
Inferencia Estadística
Regresión múltiple
y = a + bx
y = a + b1 x1 + b2 x2 + … + bk xk
224
Inferencia Estadística
225
Ejemplo
Inferencia Estadística
226
Análisis de varianza (ANOVA)
227
Inferencia Estadística
Análisis de varianza
228
Inferencia Estadística
Análisis de varianza
Ejemplos
229
Inferencia Estadística
230
Inferencia Estadística
231
Inferencia Estadística
234
Inferencia Estadística
ANOVA bifactorial
Los datos sobre los tiempos (en minutos) que le tomó a cierta persona
conducir su vehículo hasta su trabajo, de lunes a viernes, por cuatro
rutas diferentes, fueron las siguientes:
Lunes Martes Miércoles Jueves Viernes
Ruta 1 22 26 25 25 31
Ruta 2 25 27 28 26 29
Ruta 3 26 29 33 30 33
Ruta 4 26 28 27 30 30
235
Inferencia Estadística
ANOVA bifactorial
Considere los siguientes datos de un experimento para comparar tres
marcas diferentes de plumas y cuatro tratamientos de lavado distintos
con respecto a su capacidad de eliminar manchas en un tipo particular
de tela. La variable de respuesta es un indicador cualitativo del cambio
de color total de la tela, mientras más bajo es este valor más manchas
fueron eliminadas. ¿Existe alguna diferencia entre el cambio de color
promedio verdadero debido a las diferentes marcas de pluma o a los
distintos tratamientos de lavado? Considere α=0.05
Tratamiento 1 Tratamiento 2 Tratamiento 3 Tratamiento 4
236