You are on page 1of 115

Prof.

: David Becerra Rojas 1


Contenidos
1. Introduccin
2. Estadstica Descriptiva:
Univariante
Bivariante
3.- Probabilidades
4.- Distribucin de probabilidades


5.- Distribucin en el Muestreo
6.- Estimacin de Parmetros
7.- Dcimas de Hiptesis

Prof.: David Becerra Rojas 2
Bibliografa
1. Murray y Espieges Estadstica
2. Paul Newbold Estadstica para los negocios
3. Mario Triola Probabilidad y Estadstica
4. L. Chao
5. R. Levin
6. Mongomery
7. www.elprisma.com ( Matemtica,.)
3
ESTADISTICA
CIENCIA QUE NOS PERMITE
TOMAR DECISIONES BAJO
CIERTA INCERTIDUMBRE
Prof.: David Becerra Rojas 4
Trminos Comunes
Proceso de realizar una observacin o una medicin.
Caracterstica o fenmeno, que puede tomar distintos valores.
Resultado de la observacin de una variable.
Conjunto total de elementos o individuos, que poseen una
caracterstica comn, acerca de la cual se quiere informacin
Subconjunto de la poblacin, seleccionada de acuerdo a una regla o un plan.
Obtencin de todos los datos de inters que posee la poblacin
Funcin o formula que depende de los datos de la muestra
Estimacin del parmetro a travs del estadstico
Funcin o formula que depende de los datos de la poblacin
Muestra
Censo
Estadstico
Parmetro
Inferencia
Experimento
Variable
Dato
Poblacin
Prof.: David Becerra Rojas 5
Mtodo Cientfico
1. Planteamiento del Problema
2. Diseo del Experimento
3. Experimentacin y Recoleccin
4. Organizacin y Descripcin de
Resultados
5. Inferencia Estadstica
Prof.: David Becerra Rojas 6
Muestreo
Notacin:

N : Tamao de la Poblacin
n : Tamao de la Muestra
Prof.: David Becerra Rojas 7
Tipos de Muestreos Aleatorios
Aleatorio Simple
Estratificado
Sistemtico
Por Conglomerado
Prof.: David Becerra Rojas 8
Muestreo Aleatorio Simple
Todos los elementos de la poblacin, tienen la misma
oportunidad de estar contenidos en la muestra.
Se enumeran todos los elementos, y luego se extraen
de uno en uno, aleatoriamente, hasta completar el
tamao de la muestra.
Cuando la poblacin es muy grande, se puede
recurrir a los nmeros aleatorios.
Prof.: David Becerra Rojas 9
Muestreo Estratificado
Mtodo de seleccin, utilizado cuando la poblacin,
est dividida en grupos llamados estratos, cada uno,
formado por una gran cantidad de elementos
homogneos.
Se toma una muestra aleatoria simple, en cada
estrato.
Los estratos, pueden ser de igual o distinto tamao,
si son distintos, una manera posible de determinar el
tamao de la muestra al interior de cada estrato, es
que esta sea proporcional al tamao del mismo, a
este tipo de asignacin, se le conoce como Afijacin
Proporcional, que no siempre resulta la mejor,
debido al costo de muestreo en cada estrato.
Prof.: David Becerra Rojas 10
Muestreo Sistemtico
Este mtodo, se utiliza cuando la poblacin tiene sus
elementos ordenados. Se divide la poblacin (de
tamao N) en tantas sub poblaciones, como sea el
tamao de la muestra (n), todas de igual tamao
(k = N/n).
Se selecciona al azar un elemento de la primera sub
poblacin, y de ah en adelante, de las sub
poblaciones siguientes, se extrae el elemento
correspondiente.
Prof.: David Becerra Rojas 11
Muestreo por Conglomerado
Se utiliza, cuando la poblacin, est dividida en una
gran cantidad de pequeos grupos, llamados
Conglomerados, cada uno formado por elementos
heterogneos. Se toma una muestra aleatoria de
Conglomerados, y luego se censan todos los
conglomerados seleccionados.
Prof.: David Becerra Rojas 12
Tipos (Gnero) de Variable
1.- Numricas : a.- Discretas
b.- Continuas
2.- Categricas: a.- Ordinales
b.- Nominales
Prof.: David Becerra Rojas 13
Organizacin de Datos
Consideremos que la variable X, se divide
En k clases o categoras, denominadas:

C
1
, C
2
, C
i
, C
k
Dando origen a la Siguiente tabla de Frecuencia
Prof.: David Becerra Rojas 14
Tablas de Frecuencia
i X ni fi Ni Fi
1 C1 n1 f1 N1 F1
2 C2 n2 f2 N2 F2
: : : : : :
i Ci ni fi Ni Fi
: : : : : :
k Ck nk fk Nk Fk
T o t a l n 1 /// ///
Prof.: David Becerra Rojas 15
Tablas de Frecuencias
Frecuencia Absoluta: (n
i
)
Frecuencia Relativa : ( f
i
=n
i
/n )
Frecuencia Acumulada Absoluta: (N
i
)
Frecuencia Acumulada Relativa : (F
i
=N
i
/n )
Prof.: David Becerra Rojas 16
Ejemplo 1:
M MB B B R M MM R MB MB R B B M R
B B R MB B B B R M MM B R R B R
B R
Tabla
i X
1 MM
2 M
3 R
4 B
5 MB
Total
Determine: a.- La variable x:
b.- El tpo de Variable:
c.- Una tabla de frecuencia
ni
2
4
10
12
4
32
f
i
.06
.13
.31
.38
.12
1.0
N
i
2
6
16
28
32
//
F
i
.06
.19
.50
.88
1.0
//
Opinin de alumnos por una bebida nueva
d.- Determine e Interprete
k= f
4
=
n
3
= N
3
=
n= F
3
=
e.- Cuantos alumnos consideran que
la bebida es al menos regular?
5
10
32
.38
16
.50
26 alumnos
Opinin de los alumnos..
Categrica Ordinal
Prof.: David Becerra Rojas 17
Ejemplo 2:
4 3 5 8 3 6 3 2 2 4 4 3 3
5 8 6 8 3 6 6 4 3 5 2 2 4
6 6 3 5
Tabla
i X

1 2
2 3
3 4
4 5
5 6
6 7
7 8
Total
Determine: a.- La variable X:
b.- El tpo de Variable:
c.- Una tabla de frecuencia
ni

4
8
5
4
6
0
3
30
f
i

.13
.27
.17
.13
.20
.00
.10
1.0
N
i

4
12
17
21
27
27
30
//
F
i

.13
.40
.57
.70
.90
.90
1.0
//
Nmero de artculos defectuosos por da.
d.- Determine e Interprete
k= f
4
=
n
3
= N
4
=
n= F
3
=
e.- En cuantos das el nmero de artculos
defectuosos fue de al menos 4?
7
5
30
.13
21
.57
18 das
Nmero de artic. Defec. Por da
Numrica Discreta
f.- Cul fu el nmero mximo de artculos
def. por da en los 15 das que hubieron menos?
4 artculo
g.- Cuntos artculos en total, se juntaron en
Los 6 das en que hubieron ms?
42 art.
Prof.: David Becerra Rojas 18
Tabla de Frecuencia con
Intervalos de Clase
1. Rango: R = |Valor Mx. Valor mn.| + 1
u


(1u: Una unidad de medida)
2. Cantidad de Intervalos, Segn Sturgers:
k = 1 + 3.3 log(n) keN
3. Amplitud: a = Rk (a ~ valor superior cuando no es exacto)
Aparentes (X
A
)
6. Marcas de Clases (X
i
)
Ej. Si 1
u
= 0.01
y a= R/k = 4.571 ~ 4.58 ( se expresa en la unidad de medida)
4. Adicionales: p = a*k R
5. Intervalos :
X
i
= ( Ls + Li ) 2
Caractersticas (X
A
):
1.- Limite inferior del primer intervalo corresponde al valor
mnimo menos las p* unidades adicionales correspondientes .
2.- Limite superior del ltimo intervalo corresponde al valor
mximo ms las p** unidades adicionales correspondientes.
3.- Se expresan en la unidad de medida.
4.- Estn separados por una unidad de medida.
Reales (X
R
)
Caractersticas ( X
R
):
Se obtienen a partir de los Intervalos Aparentes, ampliando
estos en media unidad de medida hacia cada extremo, de tal
manera, que el limite superior de un intervalo, corresponda al
inferior del intervalo siguiente.

Obs.: La amplitud (a), se puede obtener de la diferencia entre dos limites
inferiores o superiores consecutivos, o entre dos marcas de clases
consecutivas
Prof.: David Becerra Rojas 19
Ejemplo
Sea Valor mnimo = 4.7
Valor Mximo = 12.6
n = 42

Determine los intervalos aparentes y
reales con sus respectivas marcas de
clase.
Prof.: David Becerra Rojas 20
1. Rango R = | 12.6 4.7 | + 0.1 = 8.0
2. K = 1 +3.3 log(42) = 6.4 ~ 6
3. a = 8.0 6 = 1.33 ~ 1.4
4. P = 1.4*6 -8.0=0.4
5. =Intervalos : i X
A
X
R
X
i
1
2
3
4
5
6
4.5 5.8
5.9 7.2
7.3 8.6
8.7 10.0
10.1 11.4
11.5 12.8
4.45 5.85
5.85 7.25
7.25 8.65
8.65 10.05
10.05 11.45
11.45 12.85
5.15
6.55
7.95
9.35
10.75
12.15
Prof.: David Becerra Rojas 21
Ejemplo 2:
Considere los siguientes datos:
0.94 1.05 0.86 0.94 0.96 1.03 1.01
0.78 0.84 0.86 1.04 0.76 0.65 0.70
Confeccione una tabla de frecuencia
Con 5 intervalos.
Prof.: David Becerra Rojas 22
1. Rango R = | 1.05 0.65 | + 0.01 = 0.41
2. K = 5
3. a = 0.41/5=0.082 ~ 0.09
4. P = 0.09*5 -0.41=0.04
5. =Intervalos :
i X
A
X
R
X
i
n
i
f
i
N
i
F
i
1
2
3
4
5

0.63 0.71
0.72 0.80
0.81 0.89
0.90 0.98
0.99 1.07

0.625 0.715
0.715 0.805
0.805 0.895
0.895 0.985
0.985 1.075

0.67
0.76
0.85
0.94
1.03
2
2
3
3
4
14
0.14
0.14
0.21
0.21
0.29
1.00
2
4
7
10
14
0.14
0.28
0.49
0.70
1.00
Prof.: David Becerra Rojas 23
Complete la siguiente Tabla
1 - 12
2 - 0.20 12.6
3 - 48
4 - 0.80 18.4
5 - 120
Total //// ///// /////
i X
R
n
i
f
i
N
i
F
i
X
i
120
24
12
96 48
24
9.7








21.3
15.5
8.25
11.15 14.05

14.05 16.95

16.95 19.85


19.85 22.75
36
12
120
Luego como a = 2.9
11.15
Prof.: David Becerra Rojas 24
TIPOS de GRFICOS
Grfico de Barras
Grfico de Sectores
Histograma
Polgono
Ojiva
Pctograma
Diagrama de Caja y Bigote (Tarea)
Categricas y Numricas Discretas
Categricas
Numricas Continuas
Numricas Continuas
Numricas
Numricas y Categricas
Principalmente en variables :
Prof.: David Becerra Rojas 25
Grfico de Barras
0
5
10
15
20
25
30
H A K M B
n
i
x
i
Prof.: David Becerra Rojas 26
Grfico de Sectores ( Circular)
1
2
3
4
Prof.: David Becerra Rojas 27
Histograma
3.5 5.5 7.5 9.5 11.5 13.5 XR







|
|
|
|
|
|
|
_________________________
n
i

120

100

80

60

40

20
Prof.: David Becerra Rojas 28
0
20
40
60
80
100
120
Polgono
2.5 4.5 6.5 8.5 10.5 12.5 X
i
n
i
Prof.: David Becerra Rojas 29
Ojiva
,00%
20,00%
40,00%
60,00%
80,00%
100,00%
1 2 3 4 5 6 7 8 9 10
F
i
Prof.: David Becerra Rojas 30
Pictograma
1990
1995
2000
2005
1000 ejemplares
Consumo de carne de vacuno
Prof.: David Becerra Rojas 31
Ejemplo 1
i x
i
n
i
f
i
1 H 10
.143
2 A 18
.257
3 K 12
.171
4 M 5
.071
5 B 25
.357
To tal 70
1.00
f
i
x360
51.4
92.5
61.6
25.6
128.5
360
Confeccione un grfico de Barras y uno de Sectores
()ac
51.4
143.9
205.5
231.1
360.0
/////
Prof.: David Becerra Rojas 32
i
1
2
3
4
X
4 - 5
6 - 7
8 - 9
10 - 11
T otal
ni
40
75
105
30
250
fi
.16
.30
.42
.12
1.0
Ni
40
115
220
250
Fi
.16
.46
.88
1.0
Xi
4.5
6.5
8.5
10.5
Ejemplo 2
Confeccione un: Histograma, un Polgono, y un Ojiva
Prof.: David Becerra Rojas 33
Ejercicio
Supongamos que los datos siguientes representan los
tiempos, que demoran unos atletas en terminar una
maratn.

1:35 1:28 1:45 1:52 1:40 1:30 1:38
1:47 1:37 1:30 1:40 1:36 1:29 1:35
1:37 1:36 1:40 1:36 1:48 2:05 1:32
2:28 1:45 1:50 1:47 2:29 1:44 1:49
1. Identifique la variable
2. Indique el gnero ( tipo)
3. Construya una tabla de frecuencia de 5 intervalos
4. Confeccione un; Histograma, Ojiva
Prof.: David Becerra Rojas 34
ESTADISTICOS ( o Estimadores)
CUANTILES ( Estadsticos de Orden)
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE DISPERSIN
Prof.: David Becerra Rojas 35
CUANTILES: ( ESTADSTICOS DE ORDEN)
Cuartles : ( K
k
)

Quintles : (Qq)

Decles : ( D
d
)

Percentles : ( P
p
)
Prof.: David Becerra Rojas 36
Cuartiles:
K
1
K
2
K
3
25%
50%
75%
k = 1, 2, 3
Prof.: David Becerra Rojas 37
Quintiles:


Q
q
q x 20%
Q = 1, 2, 3, 4
Prof.: David Becerra Rojas 38
Deciles:
D
d
(10*d)%
d = 1, 2, .., 9
Prof.: David Becerra Rojas 39
Percentles:


P
p
p%
p = 1, 2, ., 99
Prof.: David Becerra Rojas 40
Ejercicio
La tabla siguiente, representa los aos de
Servicio de los trabajadores de una empresa.
i X
i
n
i

1 3 15
2 6 18
3 9 26
4 10 38
5 12 30
6 18 25
Total 152
1.- Calcular : K
1
, Q
3
, D
2
, P
45

N
i

15
33
59
97
127
152
F
i

0.09
0.22
0.39
0.64
0.84
1.00
2.- Cul es el ao de servicio mnimo
de los 30 trabajadores ms antiguos
12 aos
K
1
= 9
P
45
= 10


Q
3
= 10

D
2
= 6


Prof.: David Becerra Rojas 41
Cuantiles:
Li : Limite real inferior del intervalo que contiene el cuantil t, que es aquel
donde por primera vez la frecuencia acumulada pasa el (t/Sx100)%.
S : 4, 5, 10, 100 ( Cuartil, Quintil, Decl, Percentil , respectivamente)
N
t-1
: frec. Acumulada anterior al intervalo que contiene el C
t
.
n
t
: frec. Absoluta del intervalo que contiene el C
t
.
a : Amplitud del intervalo.
n : Tamao de Muestra ( Total de Datos)
t
t t
n
a
N
S
n t
Li C *
*
1
(

+ =

t : 1,2,3 Cuartiles
1,2,3,4 Quintiles
1,2..9 Deciles
1,2,99 Percentiles
Cuando los datos estn ordenados en una tabla de frecuencia
Con intervalos de clase, se puede utilizar la siguiente expresin
Prof.: David Becerra Rojas 42
Ejemplo
8
6 . 0
* 4
10
50 * 1
95 . 2
1
(

+ = D
5
6 . 0
* 37
4
50 * 3
75 . 4
3
(

+ = K
i X
1 2.4 - 2.9
2 3.0 - 3.5
3 3.6 - 4.1
4 4.2 - 4.7
5 4.8 - 5.3
6 5.4 - 5.9
Total
n
i
4
8
15
10
5
8
50
N
i
4
12
27
37
42
50
f
i
.08
.16
.30
.20
.10
.16
1.0
F
i
.08
.24
.54
.74
.84
1.0
= 4.81
= 3.025
Determine : K
3
, D
1
, P
35
, y P
74
, Q
3
= 3.77
Si la variable X representa la utilidad en M$ por da determine:
i.- Cul fue la utilidad mxima de los 15 das que gan menos?
ii. En cuntos das la utilidad fue de al menos M$ 5.0?
11 das
P
74
= 4.75
M$ 3.67
15
6 . 0
* 12
100
50 * 35
55 . 3
35
(

+ = P
Q
3
= 4.33

Prof.: David Becerra Rojas 43
MEDIDAS DE TENDENCIA
CENTRAL
MODA
MEDIANA
MEDIA ARITMTICA
MEDIA ARMNICA
MEDIA GEOMTRICA

Prof.: David Becerra Rojas 44
MODA ( MODO)
La denotaremos por : Mo

a.- Est dada por la observacin que ms se repite
la de mayor frecuencia.
b.- Es posible calcularla para cualquier tipo de
variable.
c.- Pueden existir muchas o ninguna.
Prof.: David Becerra Rojas 45
MODA
Ejemplo 1: Sean los siguientes datos:

F D R F T D R U D U U D

i X
i
n
i
1 F 2
2 D 4
3 R 2
4 T 1
5 U 3
Total 12
Luego; en este caso la
Moda es:
Mo = D
Prof.: David Becerra Rojas 46
MODA
Ejemplo 2 :
2 3 5 1 1 5 2 5 4 2 4 2 5 1 6
i X
i
n
i
1 1 3
2 2 4
3 3 1
4 4 2
5 5 4
6 6 1
Total 15
En este caso tenemos dos Mo:
Mo
1
= 2 Mo
2
= 5

Prof.: David Becerra Rojas 47
MODA
La moda para datos tabulados, se obtiene a partir de la
siguiente expresin:
Donde: Li : Limite real inferior del intervalo que contiene la Mo que es
aquel que tiene mayor frecuencia
A
1
: Diferencia entre las frecuencias absolutas del intervalo modal y
el intervalo anterior.
A
2
: Diferencia entre las frecuencias absolutas del intervalo modal y
el intervalo posterior.
a : Amplitud del intervalo.
a Li M
o
*
2 1
1
(

A + A
A
+ =
Prof.: David Becerra Rojas 48
i
1
2
3
4
X
4 - 5
6 - 7
8 - 9
10 - 11
T otal
n
i

42
68
102
38
250
Ejemplo :
2 *
64 34
34
5 . 7
(

+
+ =
o
M
= 8.19
Calcule la Moda
a Li M
o
*
2 1
1
(

A + A
A
+ =
Prof.: David Becerra Rojas 49
MEDIANA
La denotaremos como : Md
Puntuacin que divide la distribucin de los
datos ( la muestra) en dos partes iguales.
Es decir nos indica el punto hasta donde se
tiene acumulado el 50% de las observaciones.
Nota: - Para su determinacin, los datos se
ordenan previamente.
- No tiene sentido cuando la variable
es categrica nominal.
Prof.: David Becerra Rojas 50
MEDIANA
Si el nmero de observaciones impar,
entonces la Md estar dada por la
observacin central.
Si el nmero de observaciones par,
entonces la Md estar dada por el
promedio de las dos observaciones
centrales.
Prof.: David Becerra Rojas 51
MEDIANA
Ejemplo: 1
2 3 5 7 9 10 27 29 30 38 40 n=11
En este caso la Md = 10

Ejemplo: 2
2,3 2,6 3,6 5,8 6,8 7,9 n=6



Luego ; Md = (3,6+5,8)/2 = 4,7
Prof.: David Becerra Rojas 52
MEDIANA
La mediana para datos tabulados, se obtiene a partir de
la siguiente expresin:
Donde: Li : Limite real inferior del intervalo que contiene la Md, que es aquel
donde por primera vez la frecuencia acumulada pasa el 50%.
n : Tamao de la muestra
N
d-1
: Frec. acumulada anterior al intervalo que contiene la Mediana.
n
d
: Frec. Absoluta del intervalo que contiene la Md

a : Amplitud del intervalo.
d
d d
n
a
N
n
Li M *
2
1
(

+ =

Prof.: David Becerra Rojas 53
Ejemplo: dado los siguientes datos:


MEDIANA

i X
i

1 4
2 5
3 6
4 7
5 8
6 9
Total

n
i
3
2
2
3
4
3
17
Determine; Md
4 4 4 5 5 6 6 7 7 7 8 8 8 8 9 9 9
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
N
i
3
5
7
10
14
17
F
i
.18
.29
.41
.59
.82
1.0
Md = 7
Prof.: David Becerra Rojas 54
Ejemplo de Mediana
i X
1 4 - 5
2 6 - 7
3 8 - 9
4 10 - 11
5 12 - 13
6 14 - 15
Total
n
i
4
8
15
18
2
3
50
N
i
4
12
27
45
47
50
f
i
.08
.16
.30
.36
.04
.06
1.0
F
i
.08
.24
.54
.90
.94
1.0
Luego la M
d
= 9.23
y la Moda Mo = 9.82
Determine; M
d
, M
o


15
2
* 12
2
5 . 7
(

+ =
n
M
d
Prof.: David Becerra Rojas 55
Ejercicio.
4.8 3.6 5.2 6.1 6.0
2.9 3.5 4.8 4.3 4.2
4.8 3.1 4.8 2.9 5.5
5.0 4.8 5.6 6.0
1. Calcular Mo , Md
2. Construya una tabla de frecuencia
3. Calcule de la tabla Mo , Md.
4. Comente.
Prof.: David Becerra Rojas 56
MEDIA ARITMTICA
La media Aritmtica tambin llamada Promedio
simplemente Media, y esta dada para datos no
tabulados por : (Se calcula solamente en variables numricas)
Donde: X
i
: Corresponde a las Observaciones
n : Tamao de la Muestra
N : Tamao de la Poblacin
n
X
X
n
i
i
=
=
1
N
X
N
i
i
=
=
1

Muestral
Poblacional
Prof.: David Becerra Rojas 57



Donde: Xi : Observacin Marca de Clase
n : Tamao de la muestra
n
i
: Frecuencia Absoluta de la observacin o del
intervalo

k : Nmero de intervalos
MEDIA ARITMTICA
Para datos Tabulados la Media est dada por :
n
X n
X
k
i
i i
=
=
1

=
=
k
i
i i
x f
1
Prof.: David Becerra Rojas 58
Ejemplo: La tabla siguiente representa una muestra de los
aos de servicio de trabajadores.
i
1
2
3
4
5
Xi
5
10
12
15
20

ni
4
7
8
3
2
24
Xi*ni
20
70
96
45
40
271
fi
0.167
0.292
0.333
0.125
0.083
1.00
fixxi
0.835
2.920
3.996
1.875
1.660
11.286
--------------------------------------------
--------------------------------------------
Total
Determine la Media:
= =

=
5
1 i
i i
x f X
= 11.286
= =

=
5
1 i
i i
n
x n
X
286 . 11
24
271
= = X
Prof.: David Becerra Rojas 59
Ejemplo 2: Se toma una muestra de 21 observaciones,
calcule la Media.
807 . 2
21
95 . 58
=
2 . 0
21
15
95 . 2

+ =
i X
1 2.3 - 2.4
2 2.5 - 2.6
3 2.7 - 2.8
4 2.9 - 3.0
5 3.1 - 3.2
6 3.3 - 3.4
Total

n
i
4
5
3
2
4
3
21

x
i
2.35
2.55
2.75
2.95
3.15
3.35
n
i
*x
i
9.40
12.75
8.25
5.90
12.60
10.05
58.95
Luego como
u
i
-3
-2
-1
0
1
2
n
i
*u
i
-12
-10
-3
0
4
6
-15
= 2.807
a
n
u n
A X
k
i
i i
=
+ =
1
= =

=
6
1 i
i i
n
x n
X
Prof.: David Becerra Rojas 60
MEDIA PONDERADA
_ _ _
_ n
1
x
1
+ n
2
x
2
+.+n
k
x
k

x
T
= ---------------------------------
n
1
+ n
2
+ .+ n
k

_
100x480 + 300x320 + 400x Xc
290 = ---------------------------------------
100 + 300 + 400
Ejemplo: En una empresa donde se distinguen tres tipos de trabajadores, el
salario medio es de 290. Los 100 trabajadores de la categora A
tienen un salario medio de 480, los 300 de la categora B tienen un
salario medio de 320, Cunto es el salario medio de los 400 de la
categora C?
_
Luego X
c
= 220
=
=
k
1 i
x * n
n
i
i
Prof.: David Becerra Rojas 61
Tarea N
Ventajas y Desventajas de: Moda,
Mediana y Media.
Defina y de un ejemplo de :
Media Geomtrica : (G)
Media Armnica : (H)
Sesgo
Curtosis
Prof.: David Becerra Rojas 62
Media Geomtrica:
n
n
n
x x x
i
n
i
G
x
* ..... * *
1
2 1
=
=
=
H
Media Armnica:

=
=
n
i
i
x
n
H
1
1
Prof.: David Becerra Rojas 63
MEDIDAS DE DISPERSIN
Desviacin Media: (DM)
Desviacin Intercuartlica: (K)
Desviacin Tpica: ( s )
Varianza: ( s
2
)
Rango: (R)
Prof.: David Becerra Rojas 64
MEDIDAS DE DISPERSIN
Rango: (R)

R = V. Mximo V. Mnimo + 1 Unidad de Medida

Prof.: David Becerra Rojas 65
MEDIDAS DE DISPERSIN
Desviacin Intercuartlica: (K)
2
1 3
K K
K

=
Prof.: David Becerra Rojas 66
MEDIDAS DE DISPERSIN
Desviacin Media: (DM)

Para datos No Tabulados
Para datos Tabulados

n
X X
DM
n
1 i
i

=

=
n
X X n
DM
k
i
i i
=

=
1
Prof.: David Becerra Rojas 67
MEDIDAS DE DISPERSIN
Varianza: (s
2
,o
2
)

Poblacional
Muestral : Para datos No Tabulados
( )
1
1
2
2

=

=
n
X X
S
n
i
i
) 1 n ( n
x x n
2
n
1 i
i
n
1 i
2
i

|
|
.
|

\
|

=

= =
2
1
2
1
2
2
) (

o =

=

= =
N
x
N
x
N
i
i
N
i
i
Prof.: David Becerra Rojas 68
MEDIDAS DE DISPERSIN
( )
1
1
2
2

=

=
n
X X n
S
k
i
i i
) 1 (
2
1 1
2

|
.
|

\
|

=

= =
n n
x n x n n
k
i
i i
k
i
i i
Muestral : Para datos Tabulados
Prof.: David Becerra Rojas 69
Ejemplo
6
5
30
= = X
( )
5 . 7
4
30
1
1
2
2
= =

=

=
n
X X
S
n
i
i
2
5
10
1
= =

=

=
n
X X
DM
n
i
i
Obs. : x
1
x
2
x
3
x
4
x
5
Total
Xi : 2 5 6 8 9 30
Determinar: Desv Media
Varianza
___
x
i
- x : - 4 -1 0 2 3 0
_
x
i
- x : 4 1 0 2 3 10
_
(x
i
- x)
2
: 16 1 0 4 9 30
Sean las edades ( en ao) de 5 nios
X
2
i
: 4 25 36 64 81 210
( )
5 . 7
4 * 5
30 210 * 5
) 1 (
2
2
1 1
2
2
=

|
.
|

\
|

=

= =
n n
x x n
S
n
i
i
n
i
i
Prof.: David Becerra Rojas 70
MEDIDAS DE DISPERSIN
Desviacin Tpica: (S , )
( )
1 n
X X
S
n
1 i
2
i

=

=
) 1 (
2
1 1
2

|
.
|

\
|

=

= =
n n
x x n
n
i
i
n
i
i
2 1
2
1
2
) (

o =

=

= =
N
x
N
x
N
i
i
N
i
i Poblacional:
Muestral : Para datos No Tabulados
Prof.: David Becerra Rojas 71
MEDIDAS DE DISPERSIN
Para datos Tabulados

( )
1
1
2

=

=
n
X X n
S
k
i
i i
) 1 (
2
1 1
2

|
.
|

\
|

=

= =
n n
x n x n n
k
i
i i
k
i
i i
Prof.: David Becerra Rojas 72
COEFICIENTE DE
VARIACIN



























X
S
CV
Mide la homogeneidad que existe en los datos
Respecto a la variable en estudio.
Mientras ms pequeo, ms homogneo.
Prof.: David Becerra Rojas 73
Ejemplo 2
75 . 2
19
25 . 52
:
1
= = =

=
n
x n
X que Sabemos
k
i
i i
( )
) 1 19 ( 19
25 . 52 ) 61 . 145 ( 19
2

=
i
1
2
3
4
5
6
X
2.3 - 2.4
2.5 - 2.6
2.7 - 2.8
2.9 - 3.0
3.1 - 3.2
3.3 - 3.4
n
i
4
5
3
2
4
1
19
x
i
2.35
2.55
2.75
2.95
3.15
3.35
n
i
xx
i
9.40
12.75
8.25
5.90
12.60
3.35
52.25
= 0.327
n
i
xx
i
2
22.09
32.51
22.69
17.41
39.69
11.22
145.61
Calcule: la Media , Desv. Tpica
) 1 (
2
1 1
2

|
.
|

\
|

=

= =
n n
x n x n n
S
n
i
i i
n
i
i i
119 . 0
75 . 2
327 . 0
= = =
x
s
CV
Prof.: David Becerra Rojas 74
Ejemplo 2
a
n
u n
A X
k
i
i i
=
+ =
1
( )
) 1 19 ( 19
19 ) 67 ( 19
2 . 0
2


=
) 1 (
2
1 1
2

|
.
|

\
|

=

= =
n n
u n u n n
a S
n
i
i i
n
i
i i
i
1
2
3
4
5
6
X
2.3 - 2.4
2.5 - 2.6
2.7 - 2.8
2.9 - 3.0
3.1 - 3.2
3.3 - 3.4
n
i
4
5
3
2
4
1
19
x
i
2.35
2.55
2.75
2.95
3.15
3.35
u
i
-3
-2
-1
0
1
2
n
i
*u
i
-12
-10
-3
0
4
2
-19
= 2.75
n
i
*u
i
2

36
20
3
0
4
4
67
= 0.327
Calcule: la Media , Desv. Tpica
por el Medio Provisorio
2 . 0
19
) 19 (
95 . 2

+ =
Prof.: David Becerra Rojas 75
Coeficiente de Asimetra ( Sesgo )
Su valor es cero cuando la distribucin es simtrica, positivo cuando existe
asimetra a la derecha y negativo cuando existe asimetra a la izquierda.

de Pearson
de Fisher
3
3
1
3
3
1
) (
1
S
x x n
S
k
i
i i

= =

=
Prof.: David Becerra Rojas 76
Coeficiente de Curtosisi
ca Platicrti
a Mesocrtic
ca Leptocrti
: 0
: 0
: 0
2
2
2
(
=
)

3 3 ) (
1
4
4
1
4
4
2
= =

=
S
x x n
S
k
i
i i

Prof.: David Becerra Rojas 77


Estadstica Descriptiva
Bivariante
Prof.: David Becerra Rojas 78
Sean las siguientes variables:

X : A
1
, A
2
, ...................A
f

Y : B
1
, B
2
,.....................B
c
Estas variables, se pueden ordenar en una tabla de
doble entrada llamada Tabla de Contingencia:
Estadstica Descriptiva Bivariante
Prof.: David Becerra Rojas 79


















Tabla de Contingencia
X \ Y B
1
B
2
..B
j
.. B
c
Total
A
1

n
11
n
12

:
n
1
.
A
2

n
21
n
22

:
n
2
.
A
i
. .
n
ij

.
n
i
.
: :
:
A
f
:
n
f
.
Total n.
1
n.
2
... n.
j
..... n.
c

n

Prof.: David Becerra Rojas 80
Frecuencia Absoluta
(Conjunta)
Se denota por n
ij
y se define como: Cantidad de
elementos que cuentan simultneamente con la
caracterstica A
i
de la variable X y B
j
de la variable Y
Prof.: David Becerra Rojas 81
Frecuencia Absoluta
Marginal
n
i
.: Total de la fila i = n
ij


n.
j
: Total de la Columna j = n
ij


n.. : Total General = n
ij
= n ( Tamao muestra)
i=1 j=1
j=1
c
f
f c
i=1
Prof.: David Becerra Rojas 82
Frecuencia Relativa
Conjunta

Se denota por fij =
n
ij
n
Prof.: David Becerra Rojas 83
Frecuencia Marginal Relativa
f
i
. = f
ij
=

f.
j
= f
ij
=

f.. = f
ij
= 1
i=1 j=1
j=1
c
f
f c
i=1
n
n
n.
j
n
i
.

Prof.: David Becerra Rojas 84
Frecuencia Condicional
. . i
ij
i
ij
i
j
n
n
f
f
f = =
j
ij
j
ij
j
i
n
n
f
f
f
. .
= =
De x dado y ( x/y):
De y dado x ( y/x):
Prof.: David Becerra Rojas 85
Independencia de Variables
Diremos que dos variables X e Y son
independientes si y solo si, la conjunta es igual al
producto de las marginales, para todo i, y para todo j.
Es decir;
n
n n
n o
f f f
j i
ij
j i j i ij
. .
. .
*
, *
=
=
Prof.: David Becerra Rojas 86


Estadstica Descriptiva
Bivariante


Ejemplo: Considere una muestra de contenedores en un
recinto portuario.
Sea X : Peso (toneladas)
Y : Pas de origen
Determine e Interprete : f = n
51
=
f
34
=
n
..
= n
.3
=
n
2
.

=
f
j=4/i=3
= f
i=4/j=3
= f
.2
= f
4.
=
c= 5 4
8
27 24 121
10/121 24/121 33/121 7/24 10/25
0.083 0.20 0.27 0.29 0.40
X \ Y Francia Alemania Japn Espaa Total
5 10 4 5 4 10 23
10 - 15 8 7 10 2 27
15 - 20 3 9 3 10 25
20 - 25 1 10 7 6 24
25 - 30 8 2 0 12 22
Total 24 33 24 40 121
Prof.: David Becerra Rojas 87
Asociacin de Variables
Numricas
i
1
2
.
.
.
n
X
x
1
x
2
.
.
.
x
n
Y
y
1
y
2
.
.
.
y
n
Diagrama de Dispercin
Variable X
Y
Prof.: David Becerra Rojas 88
Tipos de Asociacin
Favorable :
. .
. . .
..
..
..
y
x
Inversa:
..
. .
.
..
..
.
x
y
x
i
x
j
x
j
x
i
y
j
y
i
y
i
y
j
Prof.: David Becerra Rojas 89
Sea X: Remuneracin
Y: Cargas Familiares
1
1
3
4
4
5
2
3
3
5
2
6

-2 -1.5
-2 -0.5
0 -0.5
1 1.5
1 -1.5
2 2.5

1
2
3
4
5
6
Ejemplo:
3
1
0
1.5
-1.5
5
) ( ) ( y y x x
) )( ( y y x x
y x i
Total 18 21
Media 3.0 3.5
--------- 1.5
0 0
9
Prof.: David Becerra Rojas 90
Covarianza ( cov (x,y) )
n
y y x x
y x Cov


=
) )( (
) , (
5 . 1
6
9
) , ( = = y x Cov
Prof.: David Becerra Rojas 91
Coeficiente de Correlacin
-1 s r s 1
r : Se expresa en porcentaje
y x
s s
y x Cov
r
*
) , (
=




=
) ) ( )( ) ( (
2 2 2 2
y y n x x n
y x xy n
r
Prof.: David Becerra Rojas 92
X
1
1
3
4
4
5
18
Y
2
3
3
5
2
6
21

XY
2
3
9
20
8
30
72

i
1
2
3
4
5
6
Total

X
2
1
1
9
16
16
25
68

En nuestro caso tenemos:
Y
2
4
9
9
25
4
36
87
= 0.65
) 21 87 * 6 )( 18 68 * 6 (
21 * 18 72 * 6
2 2


=




=
) ) ( )( ) ( (
2 2 2 2
y y n x x n
y x xy n
r
Prof.: David Becerra Rojas 93
Regresin Lineal
Y = a + bX
Consiste en ajustar a los datos (representados en el
diagrama de Dispersin, una lnea, que puede ser recta
o curvilnea .
En esta oportunidad analizaremos el caso de la lnea recta.
Esta recta, tambin sirve para marcar la tendencia
De los datos, para hacer proyecciones, y para estimar
algn valor de y dado un valor de x.
.
Prof.: David Becerra Rojas 94
Error:
i i i
y y e

=
Varianza del Error: (o
2
)
cuyo estimador est dado por:
2
)

(
2
2 2

= =

n
y y
S S
i i
x
y e

= = O y y e
i i i
)

(
Prof.: David Becerra Rojas 95
Debemos minimizar la varianza del Error
Para tal efecto debemos minimizar:
2 2
) ( )

(

= =
i i i i
bx a y y y A
Es decir derivar A
Prof.: David Becerra Rojas 96
0
0
=
c
c
=
c
c
b
A
a
A
Sistema de Ecuaciones Normales
Prof.: David Becerra Rojas 97

= + =
= =
c
c
i i
i i
y x b na
bx a y
a
A
0 ) 1 ( ) ( 2
Luego tenemos:

= +
= =
c
c
i i i i
i i i
y x x b x a
x bx a y
b
A
2
0 ) )( ( 2
Prof.: David Becerra Rojas 98


= +
= +
xy x b x a
y x b na
i i
i
2
Por lo tanto, el sistema de Ecuaciones Normales
queda de la siguiente forma:
Prof.: David Becerra Rojas 99
Por determinante tenemos;
( )



= = A
2
2
2
x x n
x x
x n



= = A xy x x y
x xy
x y
a
2
2



= = A y x xy n
xy x
y n
b
A
A
=
a
a
A
A
=
b
b
Prof.: David Becerra Rojas 100
Estimadores Mnimos Cuadrado
2 2
2
) x ( x n
xy x x y
a

=
2 2
) x ( x n
y x xy n
b

=
A
A
=
a
A
A
=
b
X b Y =
Prof.: David Becerra Rojas 101
X
1
1
3
4
4
5
18
Y
2
3
3
5
2
6
21

XY
2
3
9
20
8
30
72

i
1
2
3
4
5
6
Total

X
2
1
1
9
16
16
25
68

En el caso que estamos analizando tenemos:
Y
2
4
9
9
25
4
36
87
^
Y

2.2
2.2
3.5
4.1
4.1
4.8
( e )
^
Y - Y

-0.2
0.8
-0.5
0.9
-2.1
1.2
0.0
( e
2
)

^
(Y Y)
2
0.04
0.64
0.25
0.81
4.41
1.44
7.59
y la varianza del error es
898 . 1
4
59 . 7
2
) (
2
2
= =

=

n
y y
S
i i
x y
Luego tenemos que;
( )
57 . 1
18 ) 68 (
) 72 )( 18 ( ) 68 )( 21 (
2
=

=
n
a
( )
64 . 0
18 ) 68 (
) 21 )( 18 ( ) 72 ( 6
2
=

=
n
b
Prof.: David Becerra Rojas 102
Error Tpico: (o )
38 . 1 898 . 1
4
59 . 7
2
)

(
2
2
= = =

= =

n
y y
S S
i i
e x y
2
2


= =

n
xy b y a y
S S
x
y e
Tambin se puede obtener a partir de:
Prof.: David Becerra Rojas 103
Coeficiente de Determinacin
El coeficiente de Determinacin, nos
indica la variabilidad explicada por la recta
de regresin lineal, es decir que tan bueno
es el ajuste de la recta.
Esta dado por: r
2

0 s r
2
s1

Nota: Referencia para el ajuste, tambin lo da
el error tpico S
y/x

Prof.: David Becerra Rojas 104
Ejemplo:
Supongamos que tenemos dos variables:
X : Aos de servicio de vendedores.
Y : Ventas en M$
Vendedor
1
2
3
4
5
6
Total
X
2
2
3
4
4
5
20
Y
1.2
2.4
4.1
3.1
2.4
3.8
17.0
XY
2.4
4.8
12.3
12.4
9.6
19.0
60.5
X
2
4
4
9
16
16
25
74
Y
2
1.44
5.76
16.81
9.61
5.76
14.44
53.82
1. Confeccione un diagrama de dispersin
2. Determine el grado de asociacin entre las variables
3. Estime a travs de una recta de m. c. cuanto debiera vender un
vendedor con siete aos de servicio?.
4. Estime a travs de una recta de m. c. cuanto aos de servicio debera
tener, un vendedor que vende m$ 4.0?.
Prof.: David Becerra Rojas 105
=


=

=
)
2
.) 17 ( .) 82 . 53 ( 6 )(
2
.) 20 ( .) 74 ( 6 (
.) 17 .)( 20 ( ) 5 . 60 ( 6
)
2
) y (
2
y n )(
2
) x (
2
x n (
y x xy n
r
=

=


2
2 2
) 20 ( ) 74 ( 6
) 17 )( 20 ( ) 5 . 60 ( 6
) x ( x n
y x xy n
b
=

=


2
2 2
2
) 20 ( ) 74 ( 6
) 5 . 60 )( 20 ( ) 74 )( 17 (
) x ( x n
xy x x y
a
Luego:
1.09
.523
=.5954
Prof.: David Becerra Rojas 106
Varianza del Error:
Error Tpico:
2 2
)

(
2 2
2

=

n
xy b y a y
n
y y
S
i i
x y
2 2
)

(
2 2

=

n
xy b y a y
n
y y
S
i i
x y
=.9552
=.9124
Prof.: David Becerra Rojas 107
Las propiedades de la media son las siguientes:
- La media de una constante es la propia constante.
- La media de la suma o diferencia de variables es igual a la suma o diferencia
de las medias de dichas variables.
- La media del producto de una constante por una variable, es igual a la
constante por la media de la variable.
- La media de una combinacin lineal de dos o ms variables es igual a la
combinacin lineal de las medias de dichas variables.
- La media es el centro de gravedad de la distribucin, ya que las desviaciones
respecto a la media suman 0.

- Mediana: La mediana es el valor del elemento que ocupa el lugar central, si
los datos estn ordenados, bien de forma creciente o de forma decreciente.
- Moda: La moda es el valor ms frecuente, es decir es el valor de la variable
que se repite un mayor nmero de veces.
En el caso de una distribucin totalmente simtrica, la media y la mediana
coinciden. Si la media y la mediana difieren mucho significa que hay
heterogeneidad entre los datos y que la distribucin, por tanto ser asimtrica.
Prof.: David Becerra Rojas 108
Las propiedades de la varianza son:
- La varianza es siempre positiva o cero.
- La varianza de una constante es cero.
- La varianza de la suma o diferencia de una variable y una constante es igual a la
varianza de la variable.
- La varianza de un producto de una constante por una variable es igual al cuadrado de
la constante por la varianza de la variable.

Las propiedades de la desviacin tpica son:
- La desviacin tpica es siempre positiva o cero.
- La desviacin tpica de una constante es cero.
- La desviacin tpica de una constante por una variable es igual a la constante por la
desviacin tpica de la variable.
- La desviacin tpica de la suma o diferencia de una variable y una constante es igual a
la desviacin tpica de la variable.
Prof.: David Becerra Rojas 109
Teorema 3.5.5. (Propiedades de ) Para una distribucin bien
definida, el operador de valor esperado cumple:
Escala:

Adicin:

Independencia: si X e Y son independientes.

Composicin:


No desviado:
Prof.: David Becerra Rojas 110
Teorema 3.5.6. (Propiedades de la
varianza) Para una distribucin bien
definida, la varianza cumple:
Origen:

Adicin: si X e Y son independientes.

Escala:


Prof.: David Becerra Rojas 111
Ejercicio:

X \ Y
Chilena Argentina Peruana Brasilea
Total
5 10
4
2
4 10
20
10 15
8
3
1 12
24
15 20
3 9
3


10
25
20 25
0 10 1 10
21
25 - 30
5 2 0 15
22
Total 20 26 9 57
112

Determine:
1.- Cuntos turistas chilenos app llevan un peso no superior a 12kr.
2.- Podemos decir que el comportamiento del peso que llevan los turistas
argentinos , es mas homogneo del que llevan los brasileros?
3.- Determine e interprete:
4.- Determine el grado de asociacin respecto al peso de equipaje,
entre los turistas chilenos y argentinos.
5.- A travs de una recta de m. c. estime cuntos turistas deberan llevar un
peso 27.5kr

Se toma una muestra de 112 turistas registrando
el peso de equipaje y nacionalidad.
f
j=1/i=2
=
Prof.: David Becerra Rojas 112
Cuartiles
Li : Limite real inferior del intervalo que contiene el cuartil t, que es aquel
donde por primera vez la frecuencia acumulada pasa el (k/4x100)%.

k
k k
n
a
N
n k
Li K *
4
*
1
(

+ =

Prof.: David Becerra Rojas 113
Quintiles
( Q
q
) q = 1,..,99

Li : Limite real inferior del intervalo que contiene el percentil q, que es aquel
donde por primera vez la frecuencia acumulada pasa el (q%)
q
q q
n
a
N
n q
Li Q *
5
*
1
(

+ =

Prof.: David Becerra Rojas 114
Deciles
( D
d
) d = 1,.,9



Li : Limite real inferior del intervalo que contiene el decil d, que es aquel
donde por primera vez la frecuencia acumulada pasa el (d*10)%
d
d d
n
a
N
n d
Li D *
10
*
1
(

+ =

Prof.: David Becerra Rojas 115
Percentiles
( P
p
) p = 1,..,99

Li : Limite real inferior del intervalo que contiene el percentil p, que es aquel
donde por primera vez la frecuencia acumulada pasa el (p%)
p
p p
n
a
N
n p
Li P *
100
*
1
(

+ =

You might also like