Professional Documents
Culture Documents
Estadstica
Unidades de Aprendizaje
Unidad I
: Estadstica descriptiva
Aprendizajes Esperados
Qu es Estadstica?
Conjunto de tcnicas y herramientas matemticas que permiten recolectar, organizar, resumir,
analizar, describir e interpretar informacin cualitativa o cuantitativa de un grupo de observaciones para apoyar procesos de toma de decisiones.
Tipos de Estadstica
Estadstica Descriptiva:
Este tipo de estadstica se ocupa de la
recopilacin y visualizacin de los datos
recolectados, para su posterior anlisis.
Tipos de Estadstica
Estadstica Inferencial
Es una parte de la Estadstica que comprende
los mtodos y procedimientos para deducir
propiedades (hacer inferencias) de una poblacin, a partir de una pequea parte de la misma (muestra).
Poblacin
La constituye un conjunto de elementos,
personas o medidas, que tienen entre s
alguna caracterstica comn, que permita
obtener un objeto u objetivo de estudio.
1. Los estudiantes de una determinada
carrera del DuocUC
2. Los habitantes de un pas
3. Conjunto de piezas defectuosas y no
defectuosas que produce una fbrica
en un da determinado.
Muestra
La constituye un subconjunto de la poblacin. Por ejemplo:
1. 30 de los estudiantes de una determinada carrera del DuocUc.
2. 2500 habitantes de un pas.
3. 1200 piezas seleccionadas para un control de calidad en un da determinado.
Estadstico o Estadgrafo
Es la medida de una caracterstica relativa a
una
muestra
que
permite
obtener
conclusiones respecto del comportamiento de
ciertos parmetros.
Moda
Media
Mediana
Varianza
Desviacin estndar
Variable
Caracterstica o propiedad que toma cualquier
valor (cualitativo o cuantitativo)
Tipos de Variable
Variables Cuantitativas:
Son las variables que se expresan mediante
cantidades numricas. Estas pueden ser:
1. Discretas: Es la variable que presenta
separaciones o interrupciones en la escala de
valores que puede tomar. Por ejemplo:
Tipos de Variable
2. Continuas: Es la variable que puede adquirir
cualquier valor dentro de un intervalo
especificado de valores.
Tipos de Variable
Variables Cualitativas:
Sus valoren corresponden a conceptos, atributos, o cualidades. Ests se pueden clasificar en:
1. Nominales. Permiten clasificar o distinguir entre categoras. Nombran, pero no miden la variable. Por ejemplo:
Nacionalidad.
Estado civil.
Tipos de Variable
2. Ordinales. Permiten establecer relaciones de orden entre los datos de la variable:
mayor, menor o igual.
Rendimiento
acadmico
regular, deficiente).
Etc.
(excelente,
En resumen
En resumen
Variables
Cuantitativas
Discretas
Continuas
Cualitativas
Nominales
Ordinales
Ejercicio:
En los siguientes casos identifique la Poblacin, la Variable en
cuestin y determine su clasificacin:
a) En la empresa Alfa se desea estudiar el nmero de horas
no trabajados por sus empleados.
b) En una fbrica se desea medir el tiempo que cada
trabajador demora en armar cierto producto.
c) En una empresa de seguros se desea estudiar el monto
de las primas contratadas por los clientes.
d) En la Municipalidad de Santiago se estudia las marcas de
automviles
que
tienen
su
patente
en
dicha
Municipalidad.
e) En un instituto Profesional se estudia las carreras que los
alumnos siguen.
f) En una cooperativa se desea estudiar el nivel de
educacin que tienen sus socios.
Tablas de distribucin
de Frecuencia
Aprendizajes Esperados
ESTADISTICA
DESCRIPTIVA
Carga mxima (ton)
Mc
h (%)
H (%)
9,2 - 9,8
9,5
9,8 - 10,4
10,1
12
20
12
20
10,4 - 11,0
10,7
18
38
18
38
11,0 - 11,6
11,3
20
58
20
58
11,6 - 12,2
11,9
30
88
30
88
12,2 - 13,0
12,6
12
100
12
100
Totales
100
100
TABLA DE FRECUENCIA
Cmo presentara usted los siguientes datos,
correspondendientes a los montos de ventas
(en miles de pesos) de una tienda en sus
primeras 200 transacciones existosas con
tarjetas de pago electrnica (dbito o crdito)
usando la clave denominada PinPass?
TABLA DE FRECUENCIA
33,67
55,50
134,00
55,50
188,00
92,00
40,33
60,50
97,00
89,00
37,33
103,00
38,00
116,00
70,50
64,00
69,00
84,00
97,50
54,00
155,00
61,00
64,50
60,00
170,00
187,00
116,00
55,67
42,00
199,00
59,00
76,50
146,00
34,33
79,00
63,50
42,67
165,00
53,00
47,00
53,67
93,00
58,67
135,00
42,00
53,33
80,00
174,00
33,67
64,33
142,00
61,00
65,00
61,67
111,00
188,00
99,50
134,00
71,50
135,00
146,00
155,00
192,00
91,50
66,67
56,67
52,67
112,00
142,00
61,33
129,00
163,00
125,00
51,00
35,33
55,00
178,00
72,00
54,00
64,33
68,00
61,00
53,50
135,00
105,00
123,00
171,00
128,00
76,00
56,50
90,50
34,67
35,33
57,00
143,00
39,33
60,67
83,00
163,00
89,50
82,00
57,67
45,33
161,00
45,00
120,00
73,00
91,00
117,00
66,67
122,00
61,00
64,67
82,00
61,33
119,00
86,50
131,00
39,00
66,00
33,33
142,00
189,00
58,00
98,50
55,50
193,00
51,00
169,00
167,00
67,50
169,00
177,00
186,00
152,00
156,00
41,33
66,67
61,33
173,00
178,00
53,67
84,50
54,67
61,00
91,50
61,00
41,67
103,00
65,50
67,50
66,50
35,00
110,00
59,50
35,67
199,00
55,50
188,00
90,00
75,00
44,33
59,33
35,00
92,00
71,50
40,67
84,50
40,00
34,67
34,33
62,00
58,00
164,00
66,67
44,00
176,00
58,00
151,00
65,50
51,33
65,00
144,00
118,00
160,00
133,00
53,33
66,67
63,00
88,50
64,00
186,00
149,00
205,80
125,00
90,50
145,00
50,00
64,67
34,33
TABLA DE FRECUENCIA
TABLA DE FRECUENCIA
TABLA DE FRECUENCIA
Frecuencia absoluta:
Este tipo de frecuencia la denotaremos por fi y
representa el nmero de elementos que
pertenecen a la clase (Intervalo) i-sima .
Frecuencia absoluta acumulada:
Se denota por Fi y corresponde a la suma de la
frecuencia absoluta de la i-sima
(Intervalo) y todas las anteriores.
clase
TABLA DE FRECUENCIA
Frecuencia relativa:
Se denota por hi y corresponde al cociente entre
la frecuencia absoluta de la i-sima clase (Intervalo) y n. Tambin es posible expresarla en forma porcentual multiplicando este cociente por
100.
Frecuencia relativa acumulada:
Se denota por Hi y corresponde a la suma de la
frecuencia relativa de la i-sima clase (Intervalo) y todas las anteriores.
TABLA DE FRECUENCIA
Ejercicio:
Grficos
Y
Tablas de Frecuencia
Aprendizajes Esperados
ESTADISTICA
DESCRIPTIVA
Carga mxima (ton)
Mc
h (%)
H (%)
9,2 - 9,8
9,5
9,8 - 10,4
10,1
12
20
12
20
10,4 - 11,0
10,7
18
38
18
38
11,0 - 11,6
11,3
20
58
20
58
11,6 - 12,2
11,9
30
88
30
88
12,2 - 13,0
12,6
12
100
12
100
Totales
100
100
TABLA DE FRECUENCIA
TABLA DE FRECUENCIA
fi : Frecuencia absoluta
Fi : Frecuencia absoluta acumulada
hi : Frecuencia relativa
Hi: Frecuencia relativa acumulada
Mci : Marca de clase
obs.
10
16
8
12
4
14 - 16; 8%
6 - 8; 20%
12 - 14; 24%
10 - 12; 16%
8 - 10; 32%
6-8
8 - 10
10 - 12
12 - 14
14 - 16
Histograma
Tiempo de espera (min)
6-8
8 - 10
10 - 12
12 - 14
14 - 16
obs.
10
16
8
12
416
14
12
10
8
16
10
4
8
12
0
4
6-8
8 - 10
10 - 12
12 - 14
14 - 16
Ojiva ascendente
25
36
63
47
12
25
61
124
171
183
Frecuencia
Sueldos mensuales
(miles de $)
100 200
200 300
300 - 400
400 - 500
500 - 600
140
120
100
80
60
40
20
- Se aplica a variables
ordinales y cuantitativas.
0
100-200
200-300
300-400
Sueldos (MM$)
400-500
500-600
Polgono de Frecuencias
25
36
63
47
12
25
61
124
171
183
Frecuencia
Sueldos mensuales
(miles de $)
100 200
200 300
300 - 400
400 - 500
500 - 600
50
40
30
20
10
0
0-100
Sueldos (MM$)
Se pide:
a) Identifique la poblacin en estudio, la variable y de qu tipo
es.
18
12
8
7
3
50-60
60-70
70-80
80-90
90-100 100-110
Se pide:
a) Identifique la poblacin en estudio, la variable y de qu tipo
es.
Grficos y Tablas de
Frecuencia
en Excel
Aprendizajes Esperados
TABLA DE FRECUENCIA
54,00
155,00
61,00
64,50
60,00
170,00
187,00
116,00
55,67
42,00
199,00
59,00
76,50
146,00
34,33
79,00
63,50
42,67
165,00
53,00
47,00
53,67
93,00
58,67
135,00
42,00
53,33
80,00
174,00
33,67
64,33
142,00
61,00
65,00
61,67
111,00
188,00
99,50
134,00
71,50
135,00
146,00
155,00
192,00
91,50
66,67
56,67
52,67
112,00
142,00
61,33
129,00
163,00
125,00
51,00
35,33
55,00
178,00
72,00
54,00
64,33
68,00
61,00
53,50
135,00
105,00
123,00
171,00
128,00
76,00
56,50
90,50
34,67
35,33
57,00
143,00
39,33
60,67
83,00
163,00
89,50
82,00
57,67
45,33
161,00
45,00
120,00
73,00
91,00
117,00
66,67
122,00
61,00
64,67
82,00
61,33
119,00
86,50
131,00
39,00
66,00
33,33
142,00
189,00
58,00
98,50
55,50
193,00
51,00
169,00
167,00
67,50
169,00
177,00
186,00
152,00
156,00
41,33
66,67
61,33
173,00
178,00
53,67
84,50
54,67
61,00
91,50
61,00
41,67
103,00
65,50
67,50
66,50
35,00
110,00
59,50
35,67
199,00
55,50
188,00
90,00
75,00
44,33
59,33
35,00
92,00
71,50
40,67
84,50
40,00
34,67
34,33
62,00
58,00
164,00
66,67
44,00
176,00
58,00
151,00
65,50
51,33
65,00
144,00
118,00
160,00
133,00
53,33
66,67
63,00
88,50
64,00
186,00
149,00
205,80
125,00
90,50
145,00
50,00
64,67
34,33
Regla de Sturges:
Calculamos el tamao de la muestra:
Regla de Sturges:
Calculamos el nmero de intervalos:
Regla de Sturges:
Construimos la tabla de frecuencias:
Lmite Inferior Lmite Superior
33,33
52,50
52,50
71,67
71,67
90,84
90,84
110,01
110,01
129,18
129,18
148,35
148,35
167,52
167,52
186,69
186,69
205,86
Usaremos para esto la aplicacin Anlisis de Datos.
Medidas de Tendencia
Central
Aprendizajes Esperados
MEDIA
La media (o promedio) es la suma de todos los
datos, dividida por la cantidad total de datos.
Su smbolo es:
x
Ejemplo:
x
i 1
MEDIANA
MODA
Es el dato que tiene una mayor frecuencia, es
decir, es el dato que ms se repite en una
muestra.
18
23
24
25
44
37
24
28
14
36
45
39
22
17
21
35
33
18
16
37
38
44
25
13
39
26
42
41
13
15
14
45
24
42
20
16
41
36
12
29
21
18
25
20
35
45
25
19
14
16
17
16
19
21
23
14
29
38
31
15
43
18
19
18
45
43
43
37
34
50
36
35
39
23
33
15
37
16
23
27
15
30
26
20
24
39
34
45
30
43
43
28
21
17
20
31
36
17
43
44
16
35
33
22
32
24
33
27
24
17
29
43
38
21
28
14
44
41
34
23
38
12
30
27
23
23
26
32
16
43
27
12
23
26
24
30
24
42
13
45
35
12
26
21
44
12
13
48
34
19
37
26
42
34
38
38
40
28
32
24
23
27
25
38
36
37
45
34
40
34
39
26
39
22
26
31
44
37
15
Frmula
Media
Moda
Mediana
PROMEDIO(A1:T9)
MODA(A1:T9)
MEDIANA(A1:T9)
Valor
Interpretacin
28,82
23
27,5
EN RESUMEN
MEDIDAS DE TENDENCIA CENTRAL
- MEDIA
- MODA
- MEDIANA
Medidas de Posicin
Aprendizajes Esperados
Los
Los
Los
Los
Cuartiles
Quintiles
Deciles y
Percentiles.
CUANTILES
Los percentiles son valores que dividen a la
muestra ordenada en forma ascendente (o
descendente) en 100 partes iguales.
Un percentil de orden k, denotado por Pk , es
aquel valor de la variable que deja atrs al k% de
los datos.
As mismo definimos a los Cuartiles, los Quintiles
y los Deciles, en donde particionaremos la
muestra en 4, 5 y 10 respectivamente.
CUANTILES
Y podemos hacer distintas asociaciones, por
ejemplo, decir que:
Q1 corresponde al percentil 25
Me corresponde al percentil 50
Q3 corresponde al percentil 75
4,5 4,2 4,6 4,1 4,8 5,0 3,8 6,0 5,5 5,9 5,0 6,6 4,9 5,0 4,4 4,5 4,8 4,9 4,8 4,5
5,4 5,9 5,4 5,0 4,6 5,2 4,0 4,6 4,6 4,9 4,0 5,2 4,2 3,7 5,5 5,0 5,0 5,0 5,1 4,2
5,8 4,5 4,9 4,8 4,4 5,1 5,2 5,5 5,7 6,6 3,9 5,2 4,7 4,5 4,7 5,0 5,4 5,1 5,3 4,6
4,5 5,2 3,4 3,5 4,0 4,6 5,1 5,5 4,5 4,5 4,3 3,6 6,0 3,9 5,0 4,6 4,4 5,1 4,7 3,5
6,0 4,3 5,4 4,7 4,9 4,1 4,9 4,7 4,9 6,0 6,4 4,8 4,6 5,6 5,3 4,3 3,9 5,5 3,9 4,9
4,5 3,2 5,8 5,0 4,8 5,4 6,5 5,2 5,3 4,1 4,8 5,1 4,4 4,9 4,0 4,3 4,0 4,9 4,9 5,4
4,9 5,3 5,2 6,7 3,6 5,1 5,1 5,1 5,3 5,4 4,7 4,8 4,7 5,2 3,8 4,4 5,6 5,0 4,7 4,8
6,4 4,2 5,1 6,2 4,4 5,1 6,3 4,5 4,0 5,4 4,4 4,8 5,1 4,5 5,5 6,1 4,7 4,4 5,1 5,4
5,1 5,2 6,6 4,0 4,0 4,7 5,4 4,6 4,6 4,7 5,0 5,4 4,2 4,2 5,6 4,5 6,0 5,2 4,7 4,8
5,7 5,7 4,3 5,5 4,8 4,6 4,3 4,6 4,8 5,2 5,9 6,0 5,4 6,0 3,7 4,2 3,5 4,8 4,6 3,2
Frmula
a)
PERCENTIL(B2:U11;75%)
Valor
Interpretacin
5,3
b)
PERCENTIL(B2:U11;25%)
4,5
c)
PERCENTIL(B2:U11;15%)
4,2
RANGO.PERCENTIL(B2:U11;6,5)
d)
RANGO.PERCENTIL(B2:U11;5,2)
e)
1-RANGO.PERCENTIL(B2:U11;4)
obtener
el
92%
Medidas de
Dispersin
Aprendizajes Esperados
Estadstica Descriptiva
Medidas de dispersin
Las medidas de tendencia central no reflejan la variabilidad o
dispersin del grupo de datos.
Ejemplo: edades de dos grupos.
Grupo 1
Grupo 2
19-20-20-19-22
28-32-30-4-6
Media: 20
Media: 20
Medidas de dispersin
1.
Rango:
xmax xmin
X: variable cuantitativa
Rango Intercuartil:
Q3 Q1
Medidas de dispersin
2.
Varianza
X X
n 1
Medidas de dispersin
3.
Desviacin Estndar:
x x
i
X 2 X
n 1
Medidas de dispersin
Una propiedad importante de la desviacin estndar en datos que
se distribuyen en forma normal.
Medidas de dispersin
Coeficiente de Variacin:
S
CV
X
X
Observaciones:
1. Si se multiplica por 100 queda la dispersin en porcentaje.
2. Permite comparar grupos de datos de distintas variables.
Medidas de dispersin
Datos
ms homogneos
CV
+
Datos
ms dispersos
Medidas de dispersin
Medidas de dispersin
Ejemplo: Edades y sueldos de 5 personas.
Edades (aos)
Sueldos (M$)
30-28-29-35-26
540-620-580-640-510
CV = 11,4%
CV = 9,3%
EJERCICIO:
Medidas de Distribucin:
Coeficiente de Asimetra y
Coeficiente de Curtosis
Aprendizajes Esperados
Coeficiente de asimetra de
Fisher
Coeficiente de asimetra de
Fisher
Interpretacin
Esta medida nos permite identificar si los datos se
distribuyen de forma simtrica alrededor del punto
central (Media aritmtica).
Se dice que la asimetra es positiva cuando la
mayora de los datos se encuentran por encima del
valor de la media aritmtica, la curva es Simtrica
cuando se distribuyen aproximadamente la misma
cantidad de valores en ambos lados de la media y se
conoce como asimetra negativa cuando la mayor
cantidad de datos se aglomeran en los valores menores
que la media.
EN RESUMEN
Medidas de distribucin
Coeficiente de Asimetra de Fisher (sesgo):
Muestra cmo se distribuyen los datos con respecto a la media.
g1 < 0
g1 = 0
( 0,5)
g1 > 0
Coeficiente de Curtosis
(Apuntamiento)
(g2 = 0) la distribucin es
Mesocrtica: Al igual que en la
asimetra
es
bastante
difcil
encontrar
un
coeficiente
de
Curtosis de cero (0), por lo que se
suelen
aceptar
los
valores
cercanos ( 0.5 aprox.).
(g2 > 0) la
Leptocrtica.
distribucin
es
(g2 < 0)
Platicrtica.
distribucin
es
la
Coeficiente de Curtosis
(Apuntamiento)
Interpretacin
Esta medida determina el grado de concentracin
que presentan los valores en la regin central de la
distribucin. Por medio del Coeficiente de Curtosis,
podemos identificar si existe una gran concentracin de
valores (Leptocrtica), una concentracin normal
(Mesocrtica) una baja concentracin (Platicrtica).
EN RESUMEN
Medidas de distribucin
Coeficiente de Curtosis (apuntamiento):
Muestra la concentracin de los datos alrededor de la media.
g2 > 0
g2 = 0
( 0,5)
g2 < 0
Distribucin de
Frecuencias
Bidimensionales
Aprendizajes Esperados
TABLAS BIDIMENSIONALES
TABLAS BIDIMENSIONALES
TABLAS BIDIMENSIONALES
En donde
nij
ni
nj
n
yj
EJEMPLO 1:
Se obtuvo la siguiente informacin acerca del nmero de
aos de estudio Y y la edad X, de un grupo de personas de
una localidad del sur de Chile:
EJEMPLO 1
Se quiere calcular el promedio de edad de las personas que
estudiaron 14 aos.
EJEMPLO 1
Se transforma en un problema de una sola variable.
EJEMPLO 2:
Se desea estudiar el promedio de Aos de estudio, pero
slo de aquellas personas menores de 26 aos
EJEMPLO 2
Nuevamente se transforma en un problema de una sola
variable.
EJERCICIO 1:
EJERCICIO 2:
Modelos de Regresin
I Parte
Qu vamos a estudiar?
Las diferentes formas de describir la relacin (si es que existe)
entre dos variables, cada vez que estemos trabajando con
variables numricas.
Por ejemplo:
Estudiar si hay relacin entre la altura y el peso de una
persona.
Modelos de Regresin
Un modelo de regresin es a una funcin Matemtica f que
intenta modelar probabilsticamente una Variable Respuesta en
estudio, en relacin a uno o ms predictores de inters.
El anlisis de regresin sirve para predecir una medida Y en
funcin de otra medida X (o varias).
En tal caso, diremos que:
Y = Variable dependiente.
X = Variable independiente, explicativa o predictora.
Y se escribe Y = f(X) (Se lee: Y est en funcin de X)
Tipos de Modelos
Existen numerosos tipos de modelos de regresin, sin
embargo, siempre debe ser el comportamiento de las variables lo
que nos indique la conveniencia de utilizar uno u otro para
realizar estimaciones o intentar predecir algn valor a partir de
dicho modelo.
Entre los
encontraremos:
-
modelos
de
regresin
ms
conocidos,
Diagrama de Dispersin
Variable dependiente
Variable independiente
o predictora.
Grfico de una
funcin Lineal
Grfico de una
funcin Logartmica
Grfico de una
Funcin Exponencial
Sxy,
330
280
Incorrelacin
230
180
130
80
30
140
150
160
170
180
Incorrelacin.
190
200
Modelo de Regresin
Lineal
Ejemplo:
Observamos dos variables en varios
individuos de una muestra.
En cada fila tenemos los datos de un
individuo
Cada columna representa los valores que
toma una variable sobre los mismos.
Las individuos no se muestran en ningn
orden particular.
Construimos un diagrama de dispersin
para intentar reconocer a partir del mismo si
hay relacin entre las variables, de qu tipo,
y si es posible predecir el valor de una de
ellas en funcin de la otra.
Altura
en cm.
Peso
en Kg.
162
61
154
60
180
78
158
62
171
66
169
60
166
54
176
84
163
68
Diagrama de dispersin
Rxy
xy
S S
x
Adems:
Rxy
Propiedades de
-
Rxy
-1
Variables
incorrelacionadas
Relacin
directa
casi
perfecta
A modo de ejercicio
Si una persona mide 170 cm, podramos segn el modelo, estimar
que esta debera pesar:
Peso = 0,8007 * 170 - 67,468 = 68,65 (kilos)
As mismo, una persona que mide 185 cm, segn nuestro modelo,
se estima que debera pesar:
Peso = 0,8007 * 185 - 67,468 = 80,66 (kilos)
Interpretacin de
Coeficientes de
Regresin Lineal
Aprendizajes Esperados
Interpreta el coeficiente de correlacin
lineal y el coeficiente de determinacin.
Interpreta el coeficiente de posicin y la
pendiente de un modelo de regresin
lineal.
Construye un modelo de regresin lineal
con Excel.
REGRESIN LINEAL
Ejemplo:
El Director de un Camping ha observado durante la temporada de verano, la temperatura media y los litros de
agua que los clientes han comprado en el supermercado del
Camping en cada semana .
Lts Agua
22
1000
31
1950
30
1800
28
1750
25
1600
26
1550
30
2000
20
1050
18
900
REGRESIN LINEAL
Qu significa que r sea 0,97?
Significa que existe una alta correlacin lineal, con
pendiente positiva.
REGRESIN LINEAL
Qu significa que b sea 87,35?
Significa que por cada grado de temperatura promedio
semanal aumenta en 87,35 litros el consumo de agua.
EJERCICIO:
Una agencia de publicidad estudia el aumento de las ventas
dado un aumento en los gastos de publicidad.
% Aumento
Publicidad
1
11
9
8
6
7
10
% Aumento
Ventas
2
14
11
9
4
9
11